問題1
互いに独立する2つの分布の分散が等しいことを確認するために用いられる、2つのカイ二乗分布の比は何と呼ばれるか?
F分布が正解です
F分布は2つの確率分布の分散が等しいかどうかの確認に使われます。
なお、Fは発見者(フィッシャーさん)の頭文字のFから来ているそうです。
問題2
調査する人が実際に取ってきたサンプルデータ(標本)の数
自由度が正解です
自由度は標本がある場合、具体的には複数の確率変数を調査するガイ2乗分布やF分布、及び標本から全体を推定するt分布で使用されます。
問題3
階乗(n!)を一般化した関数のことは何関数と呼ばれるか?
ガンマ関数が正解です
階乗を一般化した関数はガンマ関数とよばれ、nが整数の場合は下記のように表されます。
- Γ(n)=(n-1)!=(n-1)・(n-2)・……・2・1
問題4
複数の確率変数が独立であることを確認するために用いられる、各確率変数の2乗の和を取ったものを何というか?
F分布が正解です
本題ではカタカナでかいていますが、χ(カイ)はギリシア文字から来ています。
なお、厳密には各確率分布は標準正規分布であることを仮定しています。
対象とする確率分布が一つの場合は、標準正規分布の2乗と同じになります。
また、若干分かりにくい2二乗の和を取っている理由ですが、3つ以上あっても独立であればカイ2乗分布に従うので確認しやすいからこの方法がとられています。
問題5
散布図から近似する直線を引く際に、y軸方向の差の合計値が最も小さくなるように直線を引く方法を何というか?
最小二乗法が正解です
最小二乗法のざっくりとした計算の仕方は以下の通りです。
- 求める直線の方程式をy=ax+bとおく
- 散布図上の点Pnを(Pnx,Pny)とおく
- Pnとy軸方向の距離をdnとおく
- y軸方向の距離(y-Pny)を計算する
- 符号を正に統一するため、一つ前の計算結果を2乗する。
- このとき、一つ前の工程の結果をdn2に代入して∑(dn)2を計算する
- ∑(dn)2をa,bで偏微分し、それぞれ最小値となる等式を2つ作成する
- 2つのa,bの方程式を連立して解く
問題6
相関係数を2乗した値のことは何と呼ばれるか?
決定係数が正解です
相関係数も決定係数も2つの量的変数について述べたものなのですが、相関係数は関係の有無を表示するのに使用されるのに対して、決定係数は回帰直線への当てはまりの尺度として使われます。
また、他の選択肢の連関係数は2つの質的変数版相関係数と理解すればよいです。
問題7
散布図に対して最も近似されているといえる直線
回帰直線が正解です
理科の実験や経済(お金)の分析に実際のデ一タの散布図を用いられることがあり、そこから数学的な扱いがしやすくなるように直接に近似するということがあります。
問題8
2つの事象(原因),(結果)について、原因→結果となる確率を用いて(結果)から(原因)を推測するための定理を何というか?
ベイズの定理が正解です
(原因)→(結果)が発生するる確率と(結果)→(原因)が発生する確率を以下の記号でおきます。
- 「原因→結果」が発生する確率:P(原因|結果)
- (結果)を見て原因はこれだと断言できる確率:P(結果|原因)
- P(結果|原因)=P(B原因|結果)×P(結果)/P(原因)
問題9
発生確率pが非常に小さいものを十分大きい試行回数を重ねた時の確率分布
ポアソン分布が正解です
ポアソン分布は正規分布と似たようなものと思ってもらって問題ないです。
その中でも、発生確率を極限まで0に近づけて、試行回数を無限に近似できることから、ネイピア数eで近似して数学上取扱をしやすくなるメリットがあります。
ポアソン分布のイメージとしては、交通事故似合う確率分布や宝くじの1等が当たる確率分布を考えると分かりやすいように思えます。
問題10
母平均は分かるが母分散が不明という状況で標本の分散から本来の正規分布に代わって推定される確率分布
T分布が正解です
名称にTが付いていますが、このTには特に意味はなく作成者が初めて使用した時の文字がtだったからとされています。