home
about
全ての投稿
ソフトウェア・ハードウェアの設定のまとめ
分析関連のまとめ
ヘルスケア関連のまとめ
生涯学習関連のまとめ

BLEUスコア

date: 2023-04-12 excerpt: BLEUスコアについて

BLEUスコアについて

概要

もともとは機械翻訳が人間の翻訳文にどれだけ近いかを計算するスコア
BPという値は機械翻訳が正解より短いときに小さくなる係数
最大が1, 最小が0で大きいほど性能が良い
機械翻訳の評価以外にも、AIによるテキスト生成などの評価ができる
一般的に1 ~ 4gramで評価

数式

\[BLEU = BP × exp( \sum_{n=1}^N w_n log p_n )\]

翻訳文が正解文より短い場合 \(BP = exp( 1 - r / c )\)

翻訳文が正解文より長い場合 \(BP = 1\)

\[p_n = \frac{count_n}{\sum_{\text{n-gram} \in \text{candidate}} count_\text{n-gram}}\]

\(r\); 翻訳文の長さ
\(c\); 正解文の長さ
\(w\); 一般的に \(1/N\)

Google Colab

BLEU

参考

機械翻訳の評価に最もよく用いられる「BLEUスコア」とは

BLEU nlp Share Tweet