IT is IT.

空想イノベーション

モデル評価のための色々な数式

f:id:itry:20190205213522j:plain
モデルを評価するうえで、その方法は一つではなく、いくつか存在する。
それら評価を行ううえで、必要となるのが、混同行列(confusion matrix)である。
混同行列は、以下のように分類される。

真陽性
True Positive(TP)
偽陰性
False Negative(FN)
偽陽性
Flase Positive(FP)
真陰性
True Negative(TN)

スポンサーリンク
 

この行列を利用して、以下のような評価指標が算出できる。

正解率
全データ中、どれだけ予測が当たったかの割合

正解率(accuracy)= \frac{TP+TN}{TP+TN+FP+FN}

適合率
予測が正の中で、実際に正であったものの割合

適合率(precision)= \frac{TP}{TP+FP}

再現率
実際に正であるものの中で、正だと予測できた割合

再現率(recall)= \frac{TP}{TP+FN}

F値
適合率と再現率の調和平均

F値(F measure)= \frac{2 \times precision \times recall}{precision+recall}

適合率、あるいは再現率のみで判断すると、予測が偏っている場合でも値が高くなってしまうため、F値を用いることが多い。
また、モデルの性能は、テストデータ、及び検証データを用いて評価、比較を行う。