タグ: #agent

一覧へ

16件のニュース

frontend 2026/7/14

arXivでAI評価・信頼性研究論文公開、「From ML Predictions to Informed Diagnostic Assistance Using the Toulmin…」

arXiv に From ML Predictions to Informed Diagnostic Assistance Using the Toulmin… が掲載され、arXiv:2607.0…

#arxiv #research #ai

other 2026/7/13

HKUDS/Vibe-Trading が GitHub Trending で急浮上、Star HKUDS / Vibe-Trading "Vibe-Trading: Your Personal Trading Agent"

HKUDS/Vibe-Trading が GitHub Trending に入り、1148 stars today 規模で開発者の関心を集めています。Star HKUDS / Vibe-Tradin…

#github-trending #oss #agent

frontend 2026/7/11

arXivでツール利用AIとエージェントの研究論文公開、「From Solvers to Research: Large Language Model-Driven Formal Mathematic…」

arXiv に From Solvers to Research: Large Language Model-Driven Formal Mathematic… が掲載され、arXiv:2607.0…

#arxiv #research #nlp

security 2026/7/9

arXivでAI評価・信頼性研究論文公開、「When Agents Remember Too Much: Memory Poisoning Attacks on Large Langua…」

arXiv に When Agents Remember Too Much: Memory Poisoning Attacks on Large Langua… が掲載され、arXiv:2607.0…

#arxiv #research #security

ai 2026/7/8

NVIDIAとLangChainが連携しNemotron 3 Ultraの推論コストを10分の1に低減

NVIDIA Nemotron 3 UltraがLangChainのDeep Agentsハーネスに最適化され、主要なクローズドモデルと同等のビジネス精度を維持しつつ、1回あたりの推論コストを10分…

#nvidia #langchain #nemotron

frontend 2026/7/8

arXivでAI評価・信頼性研究論文公開、「Prompt-to-Paper: Agentic AI System for Bioinformatics」

arXiv に Prompt-to-Paper: Agentic AI System for Bioinformatics が掲載され、arXiv:2607.05456v1 Announce Typ…

#arxiv #research #ai

backend 2026/6/18

arXivでAI評価・信頼性研究論文公開、「NAVI-Orbital: First In-Orbit Demonstration of a Zero-Shot Vision-Langua…」

arXiv に NAVI-Orbital: First In-Orbit Demonstration of a Zero-Shot Vision-Langua… が掲載され、arXiv:2606.1…

#arxiv #research #ai

ai 2026/6/18

Hugging Face、エージェント性能を独自ツールで評価するベンチマーク手法を公開

AIエージェントの評価指標として、最終回答だけでなく推論プロセス全体を計測する手法が提案されました。transformersライブラリを例にした検証では、モデルがライブラリをバイパスしてロジックを再…

#huggingface #llm #agent

ai 2026/6/16

NVIDIAやアドバンテックらが主導する「産業AIエージェント」の最新導入動向を整理

産業現場でのAIエージェント活用が本格化し、NVIDIAのOmniverseやアドバンテックの産業PCを基盤とした垂直統合型のソリューションが台頭しています。従来の単機能AIとは異なり、製造ライン全…

#nvidia #advantech #edge-ai

security 2026/6/15

arXivでAI評価・信頼性研究論文公開、「SEVRA-BENCH: Social Engineering of Vulnerabilities in Review Agents」

arXiv に SEVRA-BENCH: Social Engineering of Vulnerabilities in Review Agents が掲載され、arXiv:2606.13757v…

#arxiv #research #security

security 2026/6/12

arXivでAI評価・信頼性研究論文公開、「ToolSense: A Diagnostic Framework for Auditing Parametric Tool Knowledg…」

arXiv に ToolSense: A Diagnostic Framework for Auditing Parametric Tool Knowledg… が掲載され、arXiv:2606.1…

#arxiv #research #ai

ai 2026/6/12

Vercel、AI SDK v7にHarnessAgent APIを追加しClaude Code等のエージェント実行基盤を統合

AI SDK v7ではHarnessAgentが導入され、Claude CodeやCodexなどの外部エージェント基盤を単一の抽象レイヤーで操作可能になりました。サンドボックス実行やセッション管理な…

#vercel #aisdk #claudecode

other 2026/6/10

phuryn/pm-skills が GitHub Trending で急浮上、Star phuryn / pm-skills PM Skills Marketplace: 100+ agentic skills, commands, a…

phuryn/pm-skills が GitHub Trending に入り、775 stars today 規模で開発者の関心を集めています。Star phuryn / pm-skills PM…

#github-trending #oss #agent

ai 2026/6/9

arXivで公開、PathoSageがエージェントワークフローにより病理診断の複数ソース判定を効率化

病理診断における複数情報の裁定を自動化するPathoSageが発表されました。論文ID 2606.07549で公開されたこの手法は、経験を考慮したエージェントにより、従来の手動プロセスと比較して判断…

#arxiv #pathology #agent

frontend 2026/6/6

arXivでツール利用AIとエージェントの研究論文公開、「What Should Agents Say? Action-state Communication for Efficient Multi-…」

arXiv に What Should Agents Say? Action-state Communication for Efficient Multi-… が掲載され、arXiv:2606.0…

#arxiv #research #ai

cloud 2026/6/5

Amazon Bedrock、AgentCore Runtimeで対話型シェル機能を導入し端末操作を効率化

Amazon BedrockのAgentCore RuntimeにInvokeAgentRuntimeCommandShell APIが追加されました。従来の1回限りの実行コマンドに対し、WebSo…

#aws #bedrock #ai