モデル評価のための色々な数式
モデルを評価するうえで、その方法は一つではなく、いくつか存在する。
それら評価を行ううえで、必要となるのが、混同行列(confusion matrix)である。
混同行列は、以下のように分類される。
真陽性 True Positive(TP) |
偽陰性 False Negative(FN) |
偽陽性 Flase Positive(FP) |
真陰性 True Negative(TN) |
スポンサーリンク
この行列を利用して、以下のような評価指標が算出できる。
正解率
全データ中、どれだけ予測が当たったかの割合
正解率(accuracy)=
適合率
予測が正の中で、実際に正であったものの割合
適合率(precision)=
再現率
実際に正であるものの中で、正だと予測できた割合
再現率(recall)=
F値
適合率と再現率の調和平均
F値(F measure)=
適合率、あるいは再現率のみで判断すると、予測が偏っている場合でも値が高くなってしまうため、F値を用いることが多い。
また、モデルの性能は、テストデータ、及び検証データを用いて評価、比較を行う。