
arXiv に MultiTurnPSB: Evaluating Multi-Turn Jailbreak Attacks an dClassifier-Ba… が掲載され、arXiv:2606.0…
42件のニュース

arXiv に MultiTurnPSB: Evaluating Multi-Turn Jailbreak Attacks an dClassifier-Ba… が掲載され、arXiv:2606.0…

論文2606.00088にて、管理外のAI利用(Shadow AI)が重要インフラの保証とセキュリティに及ぼす潜在的脅威が提示されました。従来のFrontier AIとは異なる攻撃ベクターや脆弱性の…

クライアント側のAI実行基盤が更新され、ローカル推論を前提にした端末選定と配布設計が現実的になった。

NVIDIA ResearchがICRAで発表した8つの論文は、ロボットがシミュレーションで学習した能力を実世界で応用する技術の進展を示しています。これにより、ロボットはより多様な環境で自律的に動作…

arXivにて、LLMマルチエージェントシステムにおける有害性増幅を測定する研究論文「HARP」が公開されました。この研究は、複数のAIエージェントが連携する環境でのリスク評価に新たな視点を提供し、…

arXivにて、LLMエージェントのツール利用をメモリ汚染により乗っ取る新手法「MemMorph」に関する研究論文が公開されました。この手法は、エージェントが過去の対話履歴から誤ったツール選択や悪意…

脆弱性の影響範囲と修正対象が更新され、既存運用との差分対応が必要になった。

arXivにて、医療IoTにおけるプライバシー保護のためのクラウド暗号ワークロードのマイクロベンチマークに関する論文「2605.24063」が公開されました。この研究は、機密性の高い医療データを扱う…

arXiv に BOHM: Zero-Cost Hierarchical Attribution for Compound AI Systems が掲載され、arXiv:2605.22866v1 A…

arXiv に Beyond Zero: Enterprise Security for the AI Era が掲載され、arXiv:2605.22985v1 Announce Type: new…

arXiv に SOLAR: A Self-Optimizing Open-Ended Autonomous Agent for Lifelong Learn… が掲載され、arXiv:2605.2…

脆弱性の影響範囲と修正対象が更新され、既存運用との差分対応が必要になった。

DeepMind Blogでバックエンド関連の更新があり、API互換性と処理性能への影響範囲が示されました。

脆弱性の影響範囲と修正対象が更新され、既存運用との差分対応が必要になった。

arXivにて、大規模言語モデル(LLM)を活用して敵対的攻撃を自動生成する研究論文「DarkLLM」が公開されました。この研究は、AIシステムのセキュリティ評価と防御策開発に新たな視点を提供し、論…

脆弱性の影響範囲と修正対象が更新され、既存運用との差分対応が必要になった。

脆弱性の影響範囲と修正対象が更新され、既存運用との差分対応が必要になった。

arXivにて、ローカルAIエージェントの安全な実行を可能にするランタイム安全層「AgentWall」に関する研究論文が公開されました。この技術は、エージェントの悪意ある動作をリアルタイムで検知・阻…

arXiv に DeepSlide: From Artifacts to Presentation Delivery が掲載され、arXiv:2605.15202v1 Announce Type:…

arXiv に Enabling Adversarial Robustness in AI Models through Kubeflow MLOps が掲載され、arXiv:2605.15249v…

arXivにて、自然言語駆動型Web実行のための自律型AIエージェントと統合されたセキュリティ保証に関する研究論文2605.15281が公開されました。この研究は、AIエージェントのWeb操作におけ…

arXiv に Mixed Integer Goal Programming for Personalized Meal Optimization with… が掲載され、arXiv:2605.13…

arXivにて、非線形エージェントオーケストレーションのためのグラフベースフレームワーク「GraphBit」に関する研究論文が公開されました。本フレームワークは、複雑なエージェント連携を効率的に管理…

脆弱性の影響範囲と修正対象が更新され、既存運用との差分対応が必要になった。

arXivにて公開された「AgentTrap」は、サードパーティ製AIエージェントスキルにおける実行時の信頼性障害を測定する研究論文です。AIエージェントの普及に伴うセキュリティ課題に対し、新たな評…

arXiv に Ghost in the Context: Measuring Policy-Carriage Failures in Decision-Ti… が掲載され、arXiv:2605.1…

arXivにて、大規模言語モデル(LLM)におけるバックドア攻撃を知識なしで検出し除去する新手法「BackFlush」が論文2605.12529として公開されました。この手法は、ウォーターマークを保…

arXivでAIシステムの脆弱性研究論文公開、「Few-Shot Truly Benign DPO Attack for Jailbreaking LLMs」でモデル/APIの更新点が示され、入出力…

大規模言語モデル(LLM)が生成したテキストにセマンティック不変攻撃下でも耐性を持つ透かし手法「PASA」に関する論文がarXivで公開されました。この研究は、LLMの信頼性向上に貢献する可能性があ…

arXiv に Where Reliability Lives in Vision-Language Models: A Mechanistic Study… が掲載され、arXiv:2605.08…

arXiv に Mitigating Many-shot Jailbreak Attacks with One Single Demonstration が掲載され、arXiv:2605.08277…

arXivにて、医療分野の意思決定タスク向け大規模言語モデルAIエージェントの敵対的堅牢性を高める研究論文「2605.08257」が公開されました。AIのセキュリティ強化と信頼性向上に焦点を当ててい…

arXivでツール利用AIとエージェントの研究論文公開、「GraphDC: A Divide-and-Conquer Multi-Agent System for Scalable Graph Al…

arXivにて、教育用LLMチューターにおけるプロンプトインジェクション防御の有効性を評価する研究論文「2605.06669」が公開されました。セキュリティ、ユーザビリティ、レイテンシのトレードオフ…

脆弱性の影響範囲と修正対象が更新され、既存運用との差分対応が必要になった。

脆弱性の影響範囲と修正対象が更新され、既存運用との差分対応が必要になった。

arXivにて、AIoTシステムにおけるLLMのデータアクセスをポリシーで制御するフレームワーク「SecureMCP」に関する論文が公開されました。このフレームワークは、モデルコンテキストプロトコル…

arXiv に Identifier-Free Code Embedding Models for Scalable Search が掲載され、arXiv:2605.05251v1 Announce…

arXiv に Quantum-Resistant Networks: A Review of Primitives, Protocols and Best… が掲載され、arXiv:2605.04…

arXivにて、AIエージェントの創造的推論能力を評価するための新しいベンチマーク「CreativityBench」に関する論文が公開されました。この評価手法は、ツールを本来の用途以外に転用する能力…
DeepMind BlogでAI機能が更新され、入出力互換と評価条件の差分が示されました。

クライアント側のAI実行基盤が更新され、ローカル推論を前提にした端末選定と配布設計が現実的になった。