標準化 (Standardization) vs 正規化 (Normalization)
まとめ: どっちをいつ使う?
標準化 (Standardization)
- 目的: データを平均0、標準偏差1の分布に変換する。
- 特徴: 外れ値の影響を受けにくい。元のデータの分布の形が維持されやすい。
- 使い所:
- データに外れ値が含まれる可能性がある場合。
- SVM、ロジスティック回帰、線形回帰など、多くの機械学習アルゴリズムで汎用的に使われる。
正規化 (Normalization)
- 目的: データを0から1の範囲にスケーリングする。
- 特徴: 外れ値に非常に敏感。「外れ値あり」データで試すと、ほとんどの点が0の近くに固まってしまうのがわかる。
- 使い所:
- 値の範囲を明確にしたい場合。
- ニューラルネットワークの画像処理(ピクセル値を0-1に)や、距離ベースのアルゴリズム(k-NNなど)で有効な場合がある。