通常の検証 (Hold-Out) | 交差検証 (Cross-Validation) | |
---|---|---|
方法 | データを一度だけ「訓練用」と「検証用」に分割し、モデルの性能を評価する。 | データを複数(K個)に分割し、検証する場所を変えながらK回評価を行い、その平均スコアで性能を判断する。 |
メリット | シンプルで計算コストが低い。 | データの分割方法に依存しない、より客観的で信頼性の高い評価ができる。 |
デメリット | 分割の仕方によって、たまたま簡単な検証データばかりになったり、逆に難しいデータばかりになったりと、評価結果が偶然に左右されやすい。 | 複数回モデルを学習させるため、計算コストが高くなる。 |
例えるなら | 模擬試験を1回だけ受けて、その点数で実力を判断する。 | 範囲の違う模擬試験を複数回受けて、その平均点でより正確な実力を把握する。 |