ナイーブベイズによる医療診断補助デモ

このデモの解説: 医療診断への応用

このページは、ナイーブベイズ分類器が、どのようにして医療診断の補助に利用されるかを視覚的に理解するためのデモです。2つの検査値（特徴量）から、患者が「健康」か「疾患あり」かを確率的に予測します。

新しい患者の検査データが得られた時、「その患者が疾患を持つ確率は？」という問いに答えるため、ベイズの定理を使います。

学習: あなたが配置した過去の患者データ（検査値と確定診断）から、アルゴリズムは各グループ（健康群・疾患群）の検査値の統計的な分布（平均とばらつき）を学習します。キャンバス上の点線の楕円は、この学習された分布を示しています。
予測: 新しい患者（カーソル位置）の検査値に対して、以下の計算を行います。
- P(疾患|検査値) ∝ P(検査値|疾患) × P(疾患)
これは、「検査値が与えられた時に疾患である確率（事後確率）は、『疾患群の人がその検査値を示す確率（尤度）』と『集団全体の疾患率（事前確率）』の積に比例する」ということを意味します。健康である確率も同様に計算し、両者を比較してより確率の高い方を予測結果とします。

※「ナイーブ」という名前は、計算を単純化するために「検査値1と検査値2は互いに関係なく独立している」という大胆な仮定を置くことに由来します。

左のグラフ

患者データの分布図です。X軸とY軸は異なる検査値を表します。「診断境界を表示」を押すと、どの検査値の組み合わせがどちらに分類されるかが背景色で示されます。

右の操作パネル

データの追加やリセットができます。
ライブ診断情報ボックスがこのデモの心臓部です。

事前確率 P(状態): 登録されている全データのうち、「健康」と「疾患あり」がそれぞれどのくらいの割合かを示します。
カーソル位置での予測: カーソルを合わせた検査値に対して、ベイズの定理に基づいた確率計算がリアルタイムで表示されます。尤度と事前確率を掛け合わせて、最終的な事後確率を比較している様子がわかります。