• home
  • about
  • 全ての投稿
  • ソフトウェア・ハードウェアの設定のまとめ
  • 分析関連のまとめ
  • ヘルスケア関連のまとめ
  • 生涯学習関連のまとめ

llm as a judge

date: 2025-03-06 excerpt: llm as a judgeについて

tag: llm as a judge


llm as a judgeについて

概要

  • あるLLMが別のLLMの出力や人間の回答を評価する手法があり、チャットボットの品質評価や自動採点に応用されている
    • ペアワイズ比較やスコアリング、理由付けを促すプロンプト設計により、正確さや一貫性を担保した評価が可能となる
  • 評価作業の効率化や客観的な比較が実現され、膨大なデータに対して高速かつ安価な評価が可能

リスク

  • 評価の安定性やバイアス、倫理的な問題、データ漏洩リスク、計算コストなど

参考

  • LLM判定の調査


llm as a judge Share Tweet