
arXiv、LLMを用いて敵対的攻撃を自動生成する手法「DarkLLM」の研究論文を公開
DarkLLMはLLMを悪用して言語主導の敵対的攻撃を学習・実行する新手法です。arXiv論文番号2605.18868として公開され、従来の手動攻撃に比べ大規模なAIシステムへの脅威が具体化していま…
1件のニュース

DarkLLMはLLMを悪用して言語主導の敵対的攻撃を学習・実行する新手法です。arXiv論文番号2605.18868として公開され、従来の手動攻撃に比べ大規模なAIシステムへの脅威が具体化していま…