NVIDIA、推論効率を最大9倍向上させるマルチモーダルAIモデル「Nemotron 3 Nano Omni」を発表

NVIDIAは、本日「Nemotron 3 Nano Omni」を発表しました。これは、ビジョン、オーディオ、言語の各機能を単一システムに統合したオープンなマルチモーダルAIモデルです。従来のAIエージェントシステムがビジョン、音声、言語で個別のモデルを使い、データ受け渡しで時間とコンテキストを失っていた課題を解決します。
Nemotron 3 Nano Omniは、ビデオ、オーディオ、画像、テキストを横断した高度な推論を可能にし、AIエージェントの応答速度と精度を向上させます。特に、複雑な文書インテリジェンスやビデオ・オーディオ理解において、6つの主要なリーダーボードでトップの成績を収めており、オープンなマルチモーダルモデルとして最高の効率と精度を実現しています。このモデルは、テキスト、画像、音声、ビデオ、ドキュメント、チャート、グラフィカルインターフェースを入力として受け取り、テキストを出力します。
Related tools
この記事に関連するおすすめツール
比較検討しやすい導入候補を優先して表示しています。一部リンクは広告・アフィリエイトを含む場合があります。
出典: NVIDIA
要点を短く整理して掲載しています。詳細は出典を確認してください。

