事前学習とファインチューニングの違いとは？AIモデルが賢くなる２段階プロセスをやさしく解説！

2025年7月7日 2025年7月7日山崎講師

山崎講師

こんにちは。ゆうせいです。
今回は、「事前学習とファインチューニングの違いとは？AIモデルが賢くなる２段階プロセスをやさしく解説！」というテーマで進めていきます。

AIモデルを育てるプロセスの中で必ず出てくるのが、
「事前学習（Pretraining）」と「ファインチューニング（Fine-tuning）」という2つのフェーズです。

「どちらも“学習”だし、何が違うの？」と疑問に思ったことはありませんか？

実はこの2つは役割も規模もまったく違うんです！
この違いを正しく理解しておくと、AIの仕組みや応用も一気に見通しがよくなりますよ。

結論から：役割が全く違う！

比較項目	事前学習（Pretraining）	ファインチューニング（Fine-tuning）
目的	一般的な知識や言語理解を獲得	特定のタスクや分野に適応させる
データ	大量の汎用データ（Wikipediaなど）	タスクに関連した専門データ
モデルの変化	基本モデルの「初期重み」を決める	モデルの「重みを微調整」する
学習の範囲	すべてのパラメータを学習	一部またはすべてのパラメータを調整
例	GPT、BERTの初期学習	医療GPT、法務GPTへのカスタマイズ

① 事前学習（Pretraining）とは？

一言で言うと？

「モデルが“世の中の一般常識”を身につけるフェーズ」

まだ何も知らない状態のモデルに対して、「言語とは何か」「文の構造は？」「知識ってどう表現されるの？」というような、基礎中の基礎を大量に学ばせるプロセスです。

たとえばこんなデータで学習します：

Wikipedia、ニュース記事、SNS投稿、書籍、小説など
英語、日本語、その他多言語のミックス
特定のタスクに関係ない「一般文」

モデルの目的：

この段階では、「タスクを解く力」ではなく、「言語そのものの理解力」を養います。

たとえば：

「リンゴを食べた」は自然な文 → OK
「食べたをリンゴ」→ 不自然 → NG

このように、文脈や単語の関係性を大量に学ぶのが目的です。

よく使われる手法：

マスク言語モデル（Masked Language Modeling）：一部の単語を隠して予測させる（BERT系）
自己回帰モデル（Autoregressive）：次の単語を予測させる（GPT系）

② ファインチューニング（Fine-tuning）とは？

一言で言うと？

「すでに賢くなったモデルに、特定の“仕事”を教えるフェーズ」

事前学習済みモデルは「知識」は持っていますが、「仕事のやり方」はまだ知りません。
そこで、そのモデルを特定のタスク用に調整するのがファインチューニングです。

たとえばこんなデータで調整：

医療診断に関するQAペア
特定企業のチャットログ
法律相談の過去データ

これらを使って、「専門的な仕事」をこなせるようにします。

具体例：

モデル	ファインチューニングで得られるスキル
GPT	法律相談に特化、感情に配慮した応答
BERT	SNSの投稿感情を分類、商品レビュー分析
T5	医療文書の要約、レポートの自動生成

例え話でイメージしよう！

● 事前学習 → 小学校〜高校までの「基礎学力」を育てる

一般常識、言葉の使い方、社会知識を学ぶ

● ファインチューニング → 就職後の「専門職トレーニング」

医者になる、弁護士になる、接客業になるなど
ベースは同じでも、目指す職種によって学ぶ内容が変わる

事前学習とファインチューニングは「分担作業」

両方ともAIモデルの成長には欠かせないものですが、それぞれ異なる役割を持っています。

フェーズ	担当する内容	対象となる能力
事前学習	一般的な言語理解を習得	「ことばの感覚」「世界の知識」
ファインチューニング	特定の用途に応じた最適化	「専門分野への応用力」

実はこの2つ、「蒸留」や「PEFT」とも関係がある！

事前学習モデル → 蒸留 → 軽量化（DistilBERTなど）
ファインチューニング → PEFT（LoRA、Adapterなど） → 効率的学習

つまり、事前学習 × ファインチューニング × 蒸留が今のAIモデルのベースになっているとも言えます！

まとめ

事前学習：汎用的な言語能力や知識を学ぶ
ファインチューニング：特定のタスクやドメインに適応させる
両者は別物だけど、連携してモデルの実用化を支えている
例えるなら「基礎教育」と「職業訓練」！

今後の学習の指針

AIモデルの構築フロー全体を理解するには、次のようなテーマにもチャレンジしてみましょう：

事前学習の実装方法（BERT/GPTの学習方式）
タスク別ファインチューニング（テキスト分類、QA、要約など）
PEFT（LoRA、Adapter）など軽量ファインチューニング手法
事前学習データの設計思想やバイアス問題

ご希望があれば、実際のコードや図解と一緒に、どのフェーズもより深掘りしていけますよ！
気になるテーマがあれば、ぜひ教えてくださいね。

生成AI研修のおすすめメニュー

投稿者プロフィール

山崎講師代表取締役

セイ・コンサルティング・グループ株式会社代表取締役。
岐阜県出身。
2000年創業、2004年会社設立。
IT企業向け人材育成研修歴業界歴20年以上。
すべての無駄を省いた費用対効果の高い「筋肉質」な研修を提供します！
この記事に間違い等ありましたらぜひお知らせください。

事前学習とファインチューニングの違いとは？AIモデルが賢くなる２段階プロセスをやさしく解説！

結論から：役割が全く違う！

① 事前学習（Pretraining）とは？

一言で言うと？

たとえばこんなデータで学習します：

モデルの目的：

よく使われる手法：

② ファインチューニング（Fine-tuning）とは？

一言で言うと？

たとえばこんなデータで調整：

具体例：

例え話でイメージしよう！

● 事前学習 → 小学校〜高校までの「基礎学力」を育てる

● ファインチューニング → 就職後の「専門職トレーニング」

事前学習とファインチューニングは「分担作業」

実はこの2つ、「蒸留」や「PEFT」とも関係がある！

まとめ

今後の学習の指針

生成AI研修のおすすめメニュー

投稿者プロフィール

最新の投稿

G検定の対策

【新人エンジニア向け｜「尤度（ゆうど）」とは？確率とどう違う？をかんたん解説】