相関係数

※このページは,統計検定3級程度(高卒レベル)の教材です
1. 用語と記号

 著書,著者によって,記号が微妙に違うが,このページでは次の約束による.
〇1 大文字のSを「積の和」または「2乗和」に使う
【例】
・・・共変動(偏差積和)
・・・変動(偏差平方和)
〇2 小文字のsSnで割った平均に使う
【例】
・・・共分散
・・・分散
〇3 ギリシャ文字のσを「平均のルート」に使う
【例】

・・・標準偏差

※なお,書物によっては,推測統計の公式として,標準偏差や分散の分母をn−1とする公式(不偏偏差,不偏分散)を扱うが,この教材では記述統計の公式として,標準偏差や分散の分母がnになっている方を使う.
なお,元のデータに対して,次の変形・処理を行う.
偏差
各変数から平均値を引いた値


標準化(基準化,規格化)
各々の変数から平均値を引いて,標準偏差で割った値に直すこと.これにより,標準化された変数の平均値は0,標準偏差は1になる.


2. n個の2次元の点と見たときの相関係数の意味

2.1 共変動(偏差積和)
 身長と体重のような2つの変数について,一方が増えると他方も増える傾向があるとき,これらの変数は正の相関関係があるという.逆に,一方が増えると他方が減る傾向があるとき,負の相関関係があるという.

-図1-
 例えば,点(x1, y1), (x2, y2)が右図1のように並んでいるとする.ただし,およびは,それぞれx, yの平均値である.
 右図1の場合,散布図で見ると「正の相関関係がある」ということを,数値として表す方法を考えてみると,
は(正の数)×(正の数),(負の数)×(負の数)になり,右図1の水色の長方形の面積はいずれも正の値になる.

-図2-
 右図2の場合,は(負の数)×(正の数),(正の数)×(負の数)になり,右図2の桃色の長方形の面積はいずれも負の値になる.
 このようにして,

という形で定義される式(これを共変動という)を作ると,その符号の正負が正の相関関係,負の相関関係を表すようになる.

-図3-
 右図3のように,4個の点が並んでいるとき,水色で示される長方形2個の面積は大きく(正の値が大きい),桃色で示される長方形の面積は小さいから(負の値が小さい),全体では共変動の値は正になり,正の相関関係があるという事実と一致する.
上記のように,2つの偏差の積和を計算したものは,共変動と呼ばれるが,1つの変数の偏差の2乗の和を計算したものは変動(偏差平方和)と呼ばれる



2.2 共分散
 共変動をnで割った平均を共分散という

すなわち
・・・共分散
上記のように,2変数の積和の平均は,共分散と呼ばれるが,1つの変数の偏差の平方和の平均は分散と呼ばれる
すなわち
すなわち
2.3 相関係数(ピアソンの積率相関係数)
 共分散は2つの変数の測定単位によって影響を受ける.(例えば,長さの単位をメートルからセンチメートルに変えると,各変数は100倍になり,共分散は10000倍の値になる).このような測定単位による影響を受けないものとして,共分散を2つの標準偏差で割たものを考え,相関係数と呼ぶ.これは,元のデータを,標準化(基準化,規格化)してから共分散を求めたものになっている.

・・・相関係数

【問題2.1】
-表1-
xkyk
10
21
32
42
50
 右の表1に示された2つの変数x, yについて,次の値を求めてください.
@ 共変動
A 共分散
B 相関係数
 なお,小数になるときは,小数第3位を四捨五入して小数第2位まで求めてください.
解答を見る
【問題2.2】
 相関係数と共分散の符号はつねに一致するかどうか,根拠も示して答えてください.
解答を見る
【問題2.3】
 共分散が大きくなると,相関係数も大きくなるといえるかどうか,根拠も示して答えてください.
解答を見る

3. 線形変換による影響

xk'=axk+b
yk'=cyk+dという線形変換を行ったとき
[平均]・・・@
・・・A
(解説)
のとき


(例)
のとき

yについても同様に示される]
[変動]・・・B
・・・C
(解説)
のとき


(例)
のとき

yについても同様に示される]
[分散]・・・D
・・・E
(解説)
のとき


(例)
のとき

yについても同様に示される]
[標準偏差]・・・F
・・・G
(解説)
分散の解説より

だから


(例)
のとき

yについても同様に示される]

[共変動]・・・H
(解説)
のとき




(例)
のとき
[共分散]・・・I
(解説)
のとき




(例)
のとき
[相関係数]・・・J
(解説)

のとき




(例)
のとき
【問題3.1】
 各々10件の測定値からなる2つの変数x, yの相関係数が0.4であったとき,測定値を訂正してx, yのすべての値に1を加えた場合,相関係数はどう変わりますか.正しいものを次の選択肢から選んでください.
@0.4よりも小さくなる A0.4で変化しない
B0.4よりも大きくなる C上記の条件だけでは決まらない
解答を見る

【問題3.2】
 各々10件の測定値からなる2つの変数x, yの相関係数が0.4であったとき,測定値を訂正してxのすべての値を2倍し,yの値をそのまま使用した場合,x, yの相関係数はどのような値になりますか.正しいものを次の選択肢から選んでください.
@0.4よりも小さくなる A0.4で変化しない
B0.4よりも大きくなる C上記の条件だけでは決まらない
解答を見る
【問題3.3】
 各々10件の測定値からなる2つの変数x, yの相関係数が0.4であったとき,変数x, yを基準化してx’, y’に変えた場合,相関係数はどのような値になりますか.正しいものを次の選択肢から選んでください.
@0.4よりも小さくなる A0.4で変化しない
B0.4よりも大きくなる C上記の条件だけでは決まらない
解答を見る

4. 散布図と相関係数のイメージ

 図がたくさん登場しますが,これらを覚えるのではなく「勘を養う」という雰囲気で見てください.ここで養われた勘をもとにして,後で問題を出しますが,それらの問題は,文字や公式で説明するよりは「図を想像すれば解ける」ものが多い.

r=1.0の場合の散布図[例]

r=0.6の場合の散布図[例]

r=0.3の場合の散布図[例]

r=0.0の場合の散布図[例]

r=−0.3の場合の散布図[例]

r=−0.6の場合の散布図[例]

r=−1.0の場合の散布図[例]

【問題4.1】
 ほとんど相関関係が見られない(r≒0)1つの集団を2つに分けたとき,それぞれの集団で相関関係が認められることがあるかどうか,根拠も示して答えてください.
解答を見る
【問題4.2】
 正の相関がある1つの集団を2つに分けたとき,2つの集団とも負の相関が見られることがあるかどうか,根拠も示して答えてください.
解答を見る
【問題4.3】
 高校3年生の1学級40人の身長と体重の相関について,男女別に相関係数を求める方が,学級全体で相関係数を求めるよりも,つねに相関が強くなるという考えについて,正しいかどうか根拠も示して答えてください.
解答を見る
【問題4.4】
 ある学級40人の1学期中間試験国語の得点について,男子20人の得点の標準偏差が15.0,女子20人の得点の標準偏差も15.0であるとき,この学級全体の得点の標準偏差も15.0に等しいかどうか,根拠も示して答えてください.
解答を見る

5. 2つのn次元ベクトルと見たときの相関係数の意味

・・・共変動

 共変動は,「偏差を成分とするベクトル」の「内積」に対応する.
 すなわち


とするとき


だから,
ベクトルの大きさで割る
・・・相関係数

 相関係数は,「ベクトルのなす角」(の余弦)に対応する.
 すなわち

 このようにして,相関係数が+1に近ければ2つのベクトルは同じ方向を向いており,−1に近ければ2つのベクトルは逆方向を向いていることになる.0に近ければ,2つのベクトルは無関係な方向を向いていることになる.

【問題5.1】 (★むずかしい)
 ある学級の生徒40人について,1学期中間試験の国語,数学,英語の得点の相関係数を調べた.
 国語と数学の得点の相関係数が,数学と英語の得点の相関係数が のとき,英語と国語の得点の相関係数のとり得る値の範囲を調べてください.
解答を見る
確率統計のメニューに戻る 高校数学のメニューに戻る