Up 「過学習」 作成: 2021-07-31
更新: 2021-07-31


      徳井直生 (2021), pp.132,133.
    [学習データの丸暗記にならないよう] 機械学習モデルの学習時には、データ全体を学習(訓練)データと評価データに分げ、学習データのみをAIのモデルに与えるのが普通です。
    学習の合間に評価用のデータをモデルに与えてその結果を見ることで、学習の進行度を測る目安とします。
    評価データに対するモデルの誤りの結果は、モデルのアップデートには用いない点が特徴です (アップデートに用いてしまうと学習データと同じ扱いになってしまいます)。
    教科書をひたすら勉強してきた学生たちに、中間テストや期末テストとして応用問題を出題し、学生の理解度を測るようなものだと思ってください。
    ただし、学生に対しては中間テストや期末テストの答えを開示しないので、学生は正解を知らない未知の問題と毎回向き合うことになります。
    学習データに対してはいい成績を収めていても、未知のデータに対しては悪い結果しか出せないような状況は、「過学習」と呼ばれ、問題を一般化して捉えることができていないという証拠となります。
    教科書を丸暗記しただけで応用が利かない生徒のような状況です。



  • 参考Webサイト
    • Wikipedia
    • 参考文献
      • Wikipedia
        • 徳井直生(なお) (2021) :『創るためのAI──機械と創造性のはてしない物語』, ビー・エヌ・エヌ, 2021.