PC用は別頁

== 期待値 ==
■期待値
○期待値とは,小中学校で習った平均値のことです.
 すなわち,表1のように変数x1 ,x2 ,x3 ,...,xNが合計N個あるとき,それらの平均値m (mean value)または期待値E(X)(Expectation)は,変数の合計x1+x2+x3+...+xNNで割ったものになります.
m=
-- 表1--
変数X x1 x2 x3 xN
度数F 1 1 1 1 N

○表2のように確率分布表で表されている場合には
m=x1 +x2 +x3 +…+xN …(*1)
となって,各々の変数xk (k=1,2,3,...,N)とその確率との積の和になります.
-- 表2(確率分布表) --
確率変数X x1 x2 x3 xN
確率P 1
○表3のように度数分布表で示され,同じ値が各々f1個,f2個,...ある場合,合計を求める計算が
x1+……+x2+……+......+xn+……

f1f2(←合計N個)
=x1 f1+x2 f2+……+xn fn
となるから,平均値は
m=…(*2)
-- 表3(度数分布表) --
変数X x1 x2 x3 xn
度数F f1 f2 f3 fn N
 表5のように
=pk (k=1,2,3,...,n)とおくと,平均値は
m=E(X)=x1p1+x2p2+x3p3+...+xnpn
【要約】
 表1のように,変数x1 ,x2 ,x3 ,...,xNが合計N個あるとき,それらの平均値(期待値)は,
m=E(X)=…(1)
 表5のように,確率変数x1 , x2 , ...に対応する確率が各々p1 , p2 , ...のとき,平均値(期待値)は
m=E(X)=x1 p1+x2 p2+x3 p3+...+xn pn…(2)
-- 表4(度数分布表) --
確率変数X x1 x2 x3 xn
確率P 1

=pkとおく
-- 表5(確率分布表) --
確率変数X x1 x2 x3 xn
確率P p1 p2 p3 pn 1


(参考)
◎ 平均値(期待値)の長所
 平均値は,「真ん中あたりがどこにあるか」を示しており,統計データを集約するときに最も重要なものです.以下に示すように,平均値にも弱点はありますが,ほとんどすべての統計において平均値が使われます.
 元の変数x1 ,x2 ,x3 ,...,xNN個のデータであるのに対して,平均値はただ1個の数値です.だから,元のデータが持っていた情報量がN次元であったのに対して,平均値はたった1次元の情報しか持っていません.これは平均値に限らず,統計データの代表値にはすべて当てはまることですが,平均値という中心付近を表す代表値1つだけでは,元のデータが持っていた「各々の個性」は表現できません.それでも,N個の生のデータを引きずっていく煩わしさよりは,1個の数値で全体の傾向がわかる便利さに目を向けることが重要です.

図1
△ 平均値の弱点→別の代表値を使う場合
 例えば,図2のように,極端値(外れ値)を含むようなデータにおいては,平均値は「順位の中央」からかなり離れた所に来ます.
【例】 アメリカでは,人口の1%の人が富の99%を持っており,残り99%に人が富の1%を分けあっているといわれています.このような場合に,収入の平均値は極端な富豪の収入に引きずられて,庶民の収入とはかけ離れた高い値になります.
【例】 中高生の家庭学習の時間についていえば,2割の子供たちが家庭学習時間の8割を行っていると言われており,家庭学習をほとんどしない子供たちが多くいると言われています.このような場合に,家庭学習時間の平均値は,多くの子供たちの実態からはかけ離れた高い数値になっています.
【例】 多くの集団において遅刻の回数は,そのほとんどを数人の人が計上しており,平均値が多くても,その集団全体の遅刻傾向とは無関係で,特定の個人の傾向を表していることが多いようです.

 順位を重視して,上半分と下半分の中央に来る値は「中央値(メジアン)」と呼ばれます.
 (*2)式を見るとわかるように,平均値の計算においては,すべての変数xkの値が,公平に同じ確率で評価されています.これは,どの値xkが少し変化しても,そのだけ平均値に反映されることを示しています.
 例えば,a<b<ccが極端に大きな外れ値のとき,平均値では
=a+b+c
となりますが,中央値(メジアン)は
=a+b+c=b
となって,極端値cが変化しても影響を受けません.
 このような中央値(メジアン)は「順位の中央」に着目して,上半分と下半分に分けたいときなどに用いられます.
図2


△ 平均値の弱点→別の代表値を使う場合
 図3がある商品(例えば靴)のサイズや価格帯と売れ行きを表しているような場合に,平均値付近の商品を品ぞろえしても,対応できません.平均値は「真ん中あたり」を表してはいますが,「最もよく売れるサイズや価格帯」に一致するとは限りません.
 頻度が最大となっている(山が一番高い)値を「最頻値(モード)」といい,売れ筋商品を考えるような場合に使われます.
図3
◎ 平均値の弱点→複数の代表値の併用でカバーする
 平均値E(X)という1種類の代表値だけでは,元のデータの傾向が表し切れないことに対しては,次に述べる分散V(X)(または標準偏差σ(X))というもう一つの代表値と合わせて2種類の代表値を併用することによって,全体の傾向を表します.(ほとんどの場合,高校でも大学でもこの2つの代表値を使えば十分です.)
◎ データの散らばり方を表す代表値:分散V(X)(または標準偏差σ(X)
図4
 図4の上の図と下の図とでは,平均値が同じですが,上の図ではデータが平均値付近に集まっているのに対して,下の図ではデータは散らばっており,これら2つのデータは異なる傾向を持っています.
 平均値E(X)だけでは区別できない散らばりを表す数字が分散V(X)(または標準偏差σ(X))です.
 下の図5においては,AとCは平均値が等しくて,散らばりはCの方が大きくなっています.
 また,AとBとでは,散らばりが等しく,平均値はBの方が大きくなっています.
 AとD,BとCでは平均値も散らばりも異なっています.

図5
※例えば,中高生の国語と数学の得点を比較すると,国語の得点は散らばりが少なく,数学の得点は散らばりが大きくなる傾向があります.このとき,散らばりが小さな国語の得点は,平均値のまわりに集まっているので,とても重宝したいところが長所ですが,逆に国語の得点は個人差が少なく,個人差を区別するのには不便だとも言えます.
 数学の得点は,散らばりが大きく,平均値の辺りに多くの得点が集まっている訳ではないので,その平均値にどれだけの重要性があるのか?と思うこともありますが,逆に,散らばりが大きいということは,個人差が大きいということで,数学の得点を見れば個人差がよく分かることになります.(ここで分かる個人差は理数系の得意不得意です)
【要約】
 N個の変数からなるデータの特徴を幾つかの数値に集約して表すときに,通常2つの数値が使われます.
 N個の変数からなるデータの情報量を完全に維持しようとすると,理論上N個の数値が必要となるが,それでは煩わしさが元と同じで集約したことにならない.
 N個の変数からなるデータの特徴を数個の数値で「集約」するときに,通常,次の2つが使われます.
平均値E(X)
 「真ん中あたりがどこにあるか」を示しており,統計データを集約するときに最も重要なもので,ほとんどすべての統計において平均値が使われます.
分散V(X)(または標準偏差σ(X)
 データの散らばり具合を表しています.

【例題1】
 2つのさいころを同時に投げるとき,出た目の和の期待値を求めてください.
(解答)
◆ポイント◆ ⇒「期待値」ときたら「確率分布表」を作る!
 2つのさいころを同時に投げるとき,目の出方は合計36通りあり,次の表のように
和が21通り
和が32通り

和が121通り
となるから,確率分布表は次のようになる.
X 2 3 4 5 6 7 8 9 10 11 12
P 1
 期待値は
E(X)=2×+3×+4×+5×+ 6×+7×
+8×+9×+10×+11×+12×

=(2+6+12+20+30+42+40+36+30+22+12)=7
1 2 3 4 5 6
1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12
【例題2】
 袋の中に赤玉が3個,白玉が2個,合計5個の玉が入っているとき,次の各々の場合について,2つの期待値を比較してください.

(1) 同時に2個取り出すとき,その中に含まれる赤玉の個数の期待値,白玉の個数の期待値

(2) 1個ずつ2回取り出すとき,赤玉が取り出される回数の期待値.ただし,取り出した玉は元に戻さない場合(=非復元抽出の場合)と取り出した玉を元に戻す場合(=復元抽出の場合)

(3) 取り出した玉は元に戻さない(=非復元抽出)ものとして,赤玉が出るまで1個ずつ取すときの取り出す回数の期待値と白玉が出るまで1個ずつ取り出すときの取り出す回数の期待値
◆ポイント◆ ⇒「期待値」ときたら「確率分布表」を作る!
(解答)
(1)
[赤玉の個数]
5個ある玉の中から,2個取り出す方法は,全部で
N=5C2=10通り
ア) 赤玉0個と白玉2個を取り出す方法は
3C0×2C2=1通り
イ) 赤玉1個と白玉1個を取り出す方法は
3C1×2C1=6通り
ウ) 赤玉2個と白玉0個を取り出す方法は
3C2×2C0=3通り
したがって,赤玉の個数について,確率分布表は次のようになる.
X 0 1 2
P 1
赤玉の個数の期待値は
E(X)=0×+1×+2×==
[白玉の個数]
5個ある玉の中から,2個取り出す方法は,全部で
N=5C2=10通り
ア) 赤玉2個と白玉0個を取り出す方法は
3C2×2C0=3通り
イ) 赤玉1個と白玉1個を取り出す方法は
3C1×2C1=6通り
ウ) 赤玉0個と白玉2個を取り出す方法は
3C0×2C2=1通り
したがって,白玉の個数について,確率分布表は次のようになる.
Y 0 1 2
P 1
白玉の個数の期待値は
E(Y)=0×+1×+2×==
 以上により,赤玉の個数の期待値,白玉の個数の期待値は各々で,それらの和は2,比は3:2になる.
(参考)
 通俗的な感覚(答案に書いても○してもらえない理由付け)だけで言えば,2個のうちで赤玉が含まれる期待値(平均値)が,なら,残りは白玉だから,白玉の期待値(平均値)は2−=となりそうに思える.
 実際,後に確率変数の変換の項目で,2つの確率変数X ,YについてE(X+Y)=E(X)+E(Y)が成り立つことが示されるので,X+Y=2 → E(X+Y)=2のとき,E(X)+E(Y)=2という予想が正しいことがわかる.

 さらにまた,通俗的な感覚だけで言えば,赤玉が3個と白玉が2個あるのだから,赤玉の個数の期待値と白玉の個数の期待値は,:=3:2になっているのではないかと予想できる.
 実際,赤玉が3個と白玉が2個あるときに,3個同時に取り出す場合でも,赤玉の個数の期待値と白玉の個数の期待値は,:=3:2が成り立っている.(ただし,この場合は,+=3
(2)
≪非復元抽出の場合≫
[赤玉の個数]
5個ある玉の中から,1個ずつ2回取り出す方法は,全部で
N=5×4=20通り
ア) 赤玉0個 ⇔ 白−白と出る出方は
2×1=2通り
イ) 赤玉1個 ⇔ 赤−白または白−赤と出る出方は
3×2+2×3=12通り(排反事象の加法定理)
ウ) 赤玉2個 ⇔ 赤−赤と出る出方は
3×2=6通り
したがって,赤玉の個数について,確率分布表は次のようになる.
X 0 1 2
P 1
赤玉の個数の期待値は
E(X)=0×+1×+2×==
(参考)
 通俗的な感覚(答案に書いても○してもらえない理由付け)だけで言えば,2個同時に取り出すときと,1個ずつ2回取り出すときの,赤玉の個数,白玉の個数の期待値は,結果が一致しているから,いつでも同じになるのではないか,と予想できる.
 実際,2個同時に取り出すときは,(組合せ)÷(組合せ)となるのに対して,非復元で1個ずつ取り出すときは(順列)÷(順列)となって,分母・分子とも2!倍になるだけだから,結果は一致する.
→続き
≪復元抽出の場合≫
[赤玉の個数]
5個ある玉の中から,1個ずつ2回取り出すときに,取り出した玉を元に戻すのだから,その方法は全部で
N=5×5=25通り
ア) 赤玉0個 ⇔ 白−白と出る出方は
2×2=4通り
イ) 赤玉1個 ⇔ 赤−白または白−赤と出る出方は
3×2+2×3=12通り(排反事象の加法定理)
ウ) 赤玉2個 ⇔ 赤−赤と出る出方は
3×3=9通り
したがって,赤玉の個数について,確率分布表は次のようになる.
X 0 1 2
P 1
赤玉の個数の期待値は
E(X)=0×+1×+2×==
 以上により,赤玉が取り出されるまでの回数の期待値はいずれもになり,等しい.
(参考)
 非復元抽出の場合と復元抽出の場合とで結果が一致する.
 その理由を,通俗的(答案に書いても○してもらえない理由付け)に考えてみると,復元抽出の場合は,玉の数は毎回3:2であるのに対して,非復元抽出の場合は玉の数が減っていくことを考慮に入れる必要がある.
 すなわち,非復元抽出の場合,1回目に赤玉が出る確率は0.6,白玉が出る確率は0.4だから,2回目を取るときには,全部で4個のうちに赤玉が2.4個,白玉が1.6個,3:2の割合で含まれることになり,赤の「濃さ」は変わらない.(元が濃いと出やすいから,取った玉を戻さない場合でも濃さは変わらない).
 そのような訳で,復元抽出の場合と非復元抽出の場合とで結果が一致すると考えられる.
(3)
[赤玉が出るまでの回数]
ア) 1回で赤玉が出る確率は

イ) 1回目に白玉が出て,2回目に赤玉が出る確率は
×=
ウ) 1回目,2回目とも白玉が出て,3回目に赤玉が出る確率は
×=
したがって,赤玉が出るまでの回数について,確率分布表は次のようになる.
X 1 2 3
P 1
赤玉が出るまでの回数の期待値は
E(X)=1×+2×+3×=
[白玉が出るまでの回数]
ア) 1回で白玉が出る確率は

イ) 1回目に赤玉が出て,2回目に白玉が出る確率は
×=
ウ) 1回目,2回目とも赤玉が出て,3回目に白玉が出る確率は
××=
エ) 1回目,2回目,3回目とも赤玉が出て,4回目に白玉が出る確率は
××=
したがって,白玉が出るまでの回数について,確率分布表は次のようになる.
X 1 2 3 4
P 1
白玉が出るまでの回数の期待値は
E(X)=1×+2×+3×+4×=2
 したがって,赤玉が出るまでの回数の期待値は回,白玉が出るまでの回数の期待値は2
(参考)
 通俗的な感覚だけで言えば,赤玉の方が多く入っているので,赤玉が出るまでの回数の方が少なくなるはずであるが,玉が3:2の割合で入っているときに,出るまでの回数が3:4となる関係(他の比率でも通用する関係)を示すのは簡単ではない.

 正しい番号を選択してください.
【問題1】
 2つのさいころを同時に投げて,大きい方の目をM,小さい方の目をmとする(2つの目が等しいときは,M, mいずれもその等しい値とする).M, mの期待値に最も近い組合せは次のうちどれか.

1E(m)=2.0, E(M)=4.0 2E(m)=2.2, E(M)=3.8
3E(m)=2.5, E(M)=4.5 4E(m)=2.7, E(M)=4.3



【問題2】
 袋の中に赤玉4個,白玉1個が入っている.同時に3個取り出すとき,その中に含まれる赤玉の個数の期待値を求めてください.



12.0 22.4 32.7 43.5



【問題3】
 トランプのハートのカードが3枚,スペードのカードが4枚,合計7枚ある.裏返してよく切ってから,1枚ずつ2回抜き取るとき,ハートのカードが出る回数の期待値を求めてください.ただし,抜き取ったカードは元に戻さないものとします.


1 2 3 4



【問題4】
 5枚の10円硬貨を同時に投げるとき,表が出る枚数の期待値を求めてください.
[例] ⇒表は3枚

1 22 3 43 5



【問題5】
 トランプのハートのカードが3枚,スペードのカードが4枚,合計7枚ある.裏返してよく切ってから,ハートが出るまで1枚ずつ取るとき,取る回数の期待値を求めてください.ただし,取ったカードは元に戻さないものとします.

12 2 3 43



(むずかしい)
【問題6】
 3枚の10円硬貨を投げて,表が出た枚数を数えるにあたって,なるべく表の枚数が多くなるように,次のルールで行うことにする.
(I) 1回目は3枚同時に投げる.
(II) 1回目が表になった硬貨はそのままにしておき,裏になった硬貨だけをもう一度投げ直して,2回目に表が出たものも表の枚数に入れる.
 このようにして,2回目までに表となる硬貨の枚数の期待値を求めてください.

1 22 3 4 5




(補足問題:簡単なくじ引きなどの期待値)
【問題7】

 箱の中に赤玉が1個,青玉が2個,黄玉が4個,白玉が13個入っているくじがあり,1個取り出したときに,赤玉が出たら1000円,青玉が出たら500円,黄玉が出たら100円もらえ,白玉ははずれとなっている.このくじで玉を1個を取り出すとき,もらえる金額の期待値を求めてください.

190(円) 2100(円) 3110(円) 4120(円)



【問題8】

 ある学校で生徒の家庭学習時間を調査したら次の表のようになった.この学校の生徒の家庭学習時間の期待値(平均値)を求めてください.
T(時間) 0 1 2 3 4
割合(%) 60 30 6 3 1 100


10.55 20.95 31.15 42.25




(携帯版)統計メニューに戻る

...メニューに戻る