ビジネスデータ分析の基礎
索引
A
- アウトライヤー (Outlier): データの中で極端に離れた値。アナリシスオブバリアンス (ANOVA): グループ間の平均の差を検定する方法。アルファ (α, Significance Level): 仮説検定での有意水準。
B
- バイアス (Bias): データや推定の偏り。ベイズの定理 (Bayes' Theorem): 条件付き確率を計算する方法。ブートストラップ法 (Bootstrap Method): 標本データを再抽出して推定量の分布を評価する手法。
C
- カテゴリーデータ (Categorical Data): 質的なカテゴリーで表されるデータ。確率 (Probability): 事象が起こる可能性の度合い。確率変数 (Random Variable): 取る値がランダムに決まる変数。確率密度関数 (Probability Density Function): 連続変数の確率分布を表す関数。偏差 (Deviation): データ点が平均からどれだけ離れているか。偏り (Bias): 偏見や先入観によるデータの歪み。決定係数 (Coefficient of Determination, R²): 回帰モデルの説明力を示す指標。カイ二乗分布 (Chi-Square Distribution): カイ二乗検定に使われる分布。カイ二乗検定 (Chi-Square Test): 観測データと期待データの適合度を検定する方法。クラスター分析 (Cluster Analysis): データを自然にグループ分けする手法。クロスバリデーション (Cross-Validation): モデルの汎化性能を評価する方法。コックス比例ハザードモデル (Cox Proportional-Hazards Model): 生存分析に用いる回帰モデル。共分散 (Covariance): 2変数の同時変動を示す尺度。交絡因子 (Confounding Factor): 影響を与えるが測定していない変数。回帰分析 (Regression Analysis): 変数間の関係をモデル化する方法。回帰直線 (Regression Line): 回帰分析で求めた直線。感度 (Sensitivity): 真の陽性を正しく検出する割合。クリスカル・ウォリス検定 (Kruskal-Wallis Test): 3つ以上の独立した群の中央値の差を検定する非パラメトリック手法。
D
- デザインオブエクスペリメンツ (Design of Experiments): 実験計画法。ディペンデンス (Dependence): 変数間の依存関係。ディストリビューション (Distribution): データの分布。
E
- エフェクトサイズ (Effect Size): 効果の大きさを示す指標。
F
- F検定 (F-Test): 2つの分散の比を検定する方法。F分布 (F-Distribution): F検定に用いる確率分布。フィッシャーの正確検定 (Fisher's Exact Test): 小さいサンプルサイズに適した独立性の検定。フィッシャーのz変換 (Fisher's z-Transformation): 相関係数の分布を正規化する方法。
G
- 標準得点 (Standard Score, z-Score): 平均からの標準偏差単位での距離。
H
- 箱ひげ図 (Box Plot): データの分布と異常値を示す図表。母集団 (Population): 統計的調査の対象となる全体。帰無仮説 (Null Hypothesis): 仮説検定において否定される仮説。中心極限定理 (Central Limit Theorem): 標本平均の分布が正規分布に近づく理論。ヒストグラム (Histogram): データの頻度分布を示す棒グラフ。
I
- 独立事象 (Independent Events): 他の事象に影響されない事象。独立変数 (Independent Variable): 他の変数に影響を与える変数。独立 (Independence): 2つの事象が互いに無関係であること。一元配置分散分析 (One-Way ANOVA): 1つの要因に対する分散分析。因子分析 (Factor Analysis): データの背後にある潜在因子を特定する手法。イントラカルクレベルアグリーメント (Intra-class Correlation): 同一クラス内の測定一致度を示す指標。
J
- 条件付き確率 (Conditional Probability): 他の事象が起きたときの確率。
K
- 検定力 (Power of a Test): 真の効果を発見する能力。確率変数 (Random Variable): ランダムに値を取る変数。確率密度関数 (Probability Density Function): 連続変数の確率分布。
L
- ランダマイズドコントロールトライアル (Randomized Controlled Trial, RCT): 無作為化比較試験。大数の法則 (Law of Large Numbers): 標本平均が母平均に収束する理論。信頼性 (Reliability): 測定の一貫性。連続データ (Continuous Data): 任意の値を取るデータ。
M
- 平均 (Mean): データの中心値。メディアン (Median): データの中央値。最頻値 (Mode): 最も頻繁に出現する値。母集団 (Population): 調査対象の全体。母平均 (Population Mean): 母集団の平均。母分散 (Population Variance): 母集団の分散。モデルセレクション (Model Selection): 最適なモデルの選択。モノトニックトランスフォーメーション (Monotonic Transformation): 単調変換。
N
- 名義尺度 (Nominal Scale): カテゴリー分けのみを行う尺度。ノンパラメトリック検定 (Non-Parametric Test): 分布に依存しない検定。ノンパラメトリック手法 (Non-Parametric Methods): 分布に依存しない解析手法。正規分布 (Normal Distribution): データが平均値を中心に対称に分布。標準正規分布 (Standard Normal Distribution): 平均0、標準偏差1の正規分布。母平均 (Population Mean): 母集団の平均。母分散 (Population Variance): 母集団の分散。
O
- オッズ比 (Odds Ratio, OR): ある事象が起こるオッズの比。
P
- パラメトリック検定 (Parametric Test): 分布に基づいた検定。パラメトリック手法 (Parametric Methods): 分布に基づいた解析手法。ポイント推定 (Point Estimation): パラメータの点推定。パーミュテーションテスト (Permutation Test): 帰無分布を再サンプルで推定する検定。p値 (p-Value): 帰無仮説の下での観測データの確率。分散分析 (Analysis of Variance, ANOVA): グループ間の平均の差を検定。分散 (Variance): データのばらつきの尺度。標本 (Sample): 母集団の部分集合。標本平均 (Sample Mean): 標本の平均。標本分散 (Sample Variance): 標本の分散。標本標準偏差 (Sample Standard Deviation): 標本分散の平方根。ピアソンの相関係数 (Pearson's Correlation Coefficient): 2変数の線形関係の強さ。
Q
- 四分位範囲 (Interquartile Range, IQR): データの中央50%の範囲。定量データ (Quantitative Data): 数値で表されるデータ。質的データ (Qualitative Data): カテゴリーで表されるデータ。
R
- ランダム化比較試験 (Randomized Controlled Trial, RCT): 無作為に割り当てられた試験。ランダム抽出 (Random Sampling): 無作為に標本を選ぶ方法。ランダム (Random): 偶然によるもの。リスク比 (Risk Ratio, RR): リスクの比率。ROC曲線 (ROC Curve): 真陽性率と偽陽性率の関係を示す曲線。回帰分析 (Regression Analysis): 変数間の関係をモデル化する方法。重回帰分析 (Multiple Regression Analysis): 複数の独立変数を用いる回帰分析。
S
- 標準偏差 (Standard Deviation): データのばらつきの尺度。標準化 (Standardization): データの標準偏差を1にする変換。標準誤差 (Standard Error, SE): 標本平均のばらつきの尺度。サンプリング (Sampling): 母集団から標本を選ぶこと。スピアマンの順位相関係数 (Spearman's Rank Correlation Coefficient): 順位データの相関係数。シグマ (σ): 標準偏差の記号。散布図 (Scatter Plot): 2変数のデータ点を示す図。信頼区間 (Confidence Interval): 母平均が含まれる範囲。
T
- t検定 (t-Test): 2つの平均の差を検定する方法。t分布 (t-Distribution): 小さいサンプルサイズに適した分布。t得点 (t-Score): t分布に基づく標準得点。事後検定 (Post Hoc Test): 分散分析後に行う詳細検定。
U
- 無作為抽出 (Random Sampling): 無作為に標本を選ぶ方法。順序尺度 (Ordinal Scale): 順序に基づいた尺度。推測統計 (Inferential Statistics): 母集団について推測する統計。有意水準 (Significance Level, α): 仮説検定での誤差の許容限界。
V
- 妥当性 (Validity): 測定の正確さ。分散 (Variance): データのばらつきの尺度。視覚化 (Visualization): データを視覚的に表現する方法。
W
- ウィルコクソン順位和検定 (Wilcoxon Rank-Sum Test): 2つの独立した群の中央値の差を検定。ウィルコクソンの符号順位検定 (Wilcoxon Signed-Rank Test): 対応のある2群の差を検定。
Z
- z検定 (z-Test): 標準正規分布を用いる検定。z分布 (z-Distribution): 標準正規分布。z値 (z-Score): 標準正規分布に基づく得点。
投稿者プロフィール
-
セイ・コンサルティング・グループ株式会社代表取締役。
岐阜県出身。
2000年創業、2004年会社設立。
IT企業向け人材育成研修歴業界歴20年以上。
すべての無駄を省いた費用対効果の高い「筋肉質」な研修を提供します!
この記事に間違い等ありましたらぜひお知らせください。
最新の投稿
- 新入社員2024年11月23日「ゲシュタルト崩壊」とシステム開発
- 新入社員2024年11月23日データベースでテーブル名やフィールド名にスペースを使うことは、一般的には推奨されていません
- 新入社員2024年11月23日「データにはなぜ型が必要なのか?」を2進数の観点から解説
- 新入社員2024年11月23日ディスプレイの解像度の意味と変更方法