ai 2026/5/6 vLLM V1で強化学習の推論エンジンにおけるログ確率計算の正確性が向上 ServiceNow-AIは、vLLM V1への移行で強化学習(RL)の推論エンジンにおけるログ確率計算の正確性を改善したと発表しました。vLLM 0.8.5をリファレンスとして、V1ではロールアウ… #vllm#reinforcement-learning#huggingface