書評:統計学入門の要点のまとめ
- 一通り読んで、重要な点をまとめた結果
- 理解しやすく、網羅性も高い
現象の法則性
- 統計学の存在意義
記述統計学
- 観察して、理論性のある推論で法則性の発見を行うこと
統計的推論
- 一部から全体を推論する
- 全数調査をするのはこれでカバーできないとき e.g. 国勢調査
大量観察
- ある一定の法則をもたらしうる
積率相関係数
- K. ピアソンによって導入されたもの
- ref. wikipedia
標本
- sample
母集団
- population
量的データ
- coutableなデータ
質的データ
- categoricalなデータ
第一義統計
- 調査を目的にデータを集めた場合
第二義統計
- いろいろな調査結果をまとめて分析する場合
ヒストグラム
- 階級(class)に分けて度数(frequency)を集計したもの
累積度数
- cumulative frequency
双峰型(bumodal)
- 2つ以上の分布が入り混じっていることが多い分布
ローレンツ曲線
- 累積相対度数のグラフで2つの軸を述べるとき、不平等に分配されているかがわかる曲線
- e.g. 資産の不平等など
平均
- mean
幾何平均
- geometric mean
- ref. wikipedia
調和平均
- harmonic mean
- ref. wikipedia
中央値
- median
百分率
- percentile
最瀕値
- mode
標準偏差
- standart deviation
- 散らばりの尺度
多変量解析
- multivariate analysis
散布図
- scattergram
相関係数
- 積率相関係数などを含む概念
相関関係と因果関係
- 基本的に別概念
見かけ上の相関
- 媒介変数zで説明できるような相関のこと
層別(stratification)
- グループ分けして集計すること
最小二乗法
- 省略
多項式回帰
- 省略
確率的意味論
- 偶然かそうでないか
根元事象
- ただ一つの標本点からなりそれ以上分解できない事象
複合事象
- 根元事象でないもの
確率
- 事象の起こりやすさを定量的に表したもの
頻度による確率の定義(頻度主義?)
n -> ∞
で確率が収束すると仮設する定義
主観確率(ベイジアン?)
- なにか最初に観測者で確率を最初に与える.後、確率の公理主義的定理により確率をチューニングする
ベイズ統計学
- 条件付き確率(公理系を参照しているから?)のことを言っているっぽい
確率変数
- ランダムにある値をとる値
確率分布
- 離散型
- 連続型
歪度
- 省略
尖度
- 省略
超幾何分布
- 空間でMなどの要素があるとき、combinaitionで計算できる確率分布
復元と非復元
- サンプルした要素をもとに戻すか戻さないか
二項分布とベルヌーイ分布
- ベルヌーイ分布は二項分布の特殊系
- 兆幾何分布から二項分布は導出できる
ポアソン分布
- nが大、pが小のときの二項分布
正規分布(normal distribution, ガウス分布)
- 二項分布を更に一般化して連続にしたもの
- あらゆるランダムネスの和は中心極限定理によりこれになる
大数の法則
- 真の値への集中
標本抽出
- sampling
パラメトリックとノンパラメトリック
- 母集団をいくつかのパラメータで決定できるかできないか
検定
- 省略
回帰分析
- 省略