
ByteDanceがマルチモーダルAIエージェント「UI-TARS-desktop」を公開、デスクトップGUIの操作を自動化
ByteDanceはGUI操作特化のAIスタックを公開しました。従来のテキストベースと異なり、VLM(視覚言語モデル)を用いてデスクトップ画面を直接認識し、人間と同等のタスク遂行ワークフローを実現し…
1件のニュース

ByteDanceはGUI操作特化のAIスタックを公開しました。従来のテキストベースと異なり、VLM(視覚言語モデル)を用いてデスクトップ画面を直接認識し、人間と同等のタスク遂行ワークフローを実現し…