過去 1 週間のページビュー

2011年8月16日火曜日

ブートストラップ

あるところからデータをとってきて50個くらいのデータ列をつくる。
その50個から当確率で50個重複を許して選んできて平均をとる。
それを1000回行ってその1000個の平均をとる。
もとの分布はきにしなくていい。

わからないこと
初めにとってくるデータの数どのくらい以上?
何回くらい繰り返せばいいの?

これがブートストラップ。
知っている範囲で。
すごく簡単に説明してるけどあってるかな?

記述統計と推測統計の違い

記述統計とは取ってきたデータのみが語るという立場。
標本平均をとってきたり、相関係数を計算したりというのはこちらの枠組み



推測統計はデータは誤差をもっていて、その構造にたいしてモデルを入れて考える。
確率論のツールを使うので、少し難解になりがちであるが、必要なものである。
検定とか推定というのはこちらの枠組み。

簡単だがまとめ。