交差検証 vs テストデータ

解説: 「練習試合」と「本番の試合」

交差検証 (Cross-Validation) テストデータ (Test Set)
目的 ハイパーパラメータチューニングや、モデルの頑健性を評価するため。 モデルの最終的な汎化性能を一度だけ評価するため。
データ 訓練データをさらに複数に分割して使う。 学習には一切使われなかった、完全に未知のデータ。
例えるなら チーム内で紅白戦を何度も行い、最適な戦術や選手起用を探る「練習試合」。 練習で作り上げた最高のチームで、一度きりの「本番の試合」に臨み、本当の実力を測る。
デモでの役割 青い訓練データをさらに5つに分け、黄色い検証用ブロックをずらしながら5回評価を繰り返すプロセス。 最初に分割され、鍵マーク(🔒)でロックされる赤いデータ。学習には決して使われない。