vLLM V1で強化学習のロールアウトログ確率計算を修正、V0との整合性を確保
ServiceNow-AIがHugging Face上で、vLLM V1における強化学習のバックエンド修正について報告しました。vLLM 0.8.5をリファレンスとして、V1のロールアウトログ確率、…
1件のニュース
ServiceNow-AIがHugging Face上で、vLLM V1における強化学習のバックエンド修正について報告しました。vLLM 0.8.5をリファレンスとして、V1のロールアウトログ確率、…