
AIコーディングエージェントにシニアエンジニアの知見を統合するOSSが登場しました。開発ライフサイクルに対応した7つのスラッシュコマンドにより、品質ゲートやワークフローを自動的に適用可能です。
23件のニュース

AIコーディングエージェントにシニアエンジニアの知見を統合するOSSが登場しました。開発ライフサイクルに対応した7つのスラッシュコマンドにより、品質ゲートやワークフローを自動的に適用可能です。

arXiv に ToolSense: A Diagnostic Framework for Auditing Parametric Tool Knowledg… が掲載され、arXiv:2606.1…

AI SDK v7ではHarnessAgentが導入され、Claude CodeやCodexなどの外部エージェント基盤を単一の抽象レイヤーで操作可能になりました。サンドボックス実行やセッション管理な…
phuryn/pm-skills が GitHub Trending に入り、775 stars today 規模で開発者の関心を集めています。Star phuryn / pm-skills PM…

病理診断における複数情報の裁定を自動化するPathoSageが発表されました。論文ID 2606.07549で公開されたこの手法は、経験を考慮したエージェントにより、従来の手動プロセスと比較して判断…

arXiv に What Should Agents Say? Action-state Communication for Efficient Multi-… が掲載され、arXiv:2606.0…

Amazon BedrockのAgentCore RuntimeにInvokeAgentRuntimeCommandShell APIが追加されました。従来の1回限りの実行コマンドに対し、WebSo…

nesquena/hermes-webui が GitHub Trending に入り、984 stars today 規模で開発者の関心を集めています。Sponsor Star nesquena…

arXiv 2605.26154で公開されたMemMorphは、メモリ汚染を通じてLLMエージェントのツール実行権限を奪取します。従来の間接プロンプト注入とは異なり、長期記憶を直接操作する点が特徴で…

複合AIシステムの出力に対する各構成要素の貢献度を、計算負荷をかけずに階層的に特定するBOHM手法がarXivで公開されました。既存のSHAP等の手法と異なり、推論過程のメタデータを活用することで追…

arXivで「arXivでAI評価・信頼性研究論文公開、「Beyond Zero: Enterprise Security for the AI Era」」に関する更新が公開され、適用条件と影響範囲…

colbymchenry/codegraph が GitHub Trending に入り、3688 stars today 規模で開発者の関心を集めています。Star colbymchenry /…

arXivで「arXivでツール利用AIとエージェントの研究論文公開、「SOLAR: A Self-Optimizing Open-Ended Autonomous Agent for Lifelo…

arXivで「arXivでAI評価・信頼性研究論文公開、「Autonomous LLM Agents & CTFs: A Second Look」」に関する更新が公開され、適用条件と影響範囲の差分確…

arXivで「arXivでAI評価・信頼性研究論文公開、「The End of Trust: How Agentic AI Breaks Security Assumptions」」に関する更新が公…

arXivで「arXivでAI評価・信頼性研究論文公開、「Detecting Verbatim LLM Copy-Paste in Homework」」に関する更新が公開され、適用条件と影響範囲の差…

arXivで「arXivでAI評価・信頼性研究論文公開、「DeepSlide: From Artifacts to Presentation Delivery」」に関する更新が公開され、適用条件と影…

arXiv 2605.15281として公開された研究では、AIエージェントがWebサイトを自律実行する際の安全性を保証する統合フレームワークを提案しています。指示の忠実度と実行時の隔離環境を両立する…

arXivで「arXivでAI評価・信頼性研究論文公開、「Ghost in the Context: Measuring Policy-Carriage Failures in Decision-T…

ByteDanceはGUI操作特化のAIスタックを公開しました。従来のテキストベースと異なり、VLM(視覚言語モデル)を用いてデスクトップ画面を直接認識し、人間と同等のタスク遂行ワークフローを実現し…

arXivで「arXivでツール利用AIとエージェントの研究論文公開、「Understanding Annotator Safety Policy with Interpretability」」に関…

arXivで「arXivでAI評価・信頼性研究論文公開、「Identifier-Free Code Embedding Models for Scalable Search」」に関する更新が公開され…

AIエージェントが既存ツールを本来の用途以外で再利用する能力を測るCreativityBenchがarXiv(2605.02910)で発表されました。アフォーダンスに基づく推論を評価軸に据え、従来手…