ai 2026/5/7 arXivでAIエージェントの創造的推論を評価する「CreativityBench」論文が公開 arXivにて、AIエージェントの創造的推論能力を評価するための新しいベンチマーク「CreativityBench」に関する論文が公開されました。この評価手法は、ツールを本来の用途以外に転用する能力… #arxiv#research#ai