【簡単】統計学最初の関門「平方和」がマスターできる【初心者向け】
統計学や品質管理を学ぶときに、最初につまずくのが「平方和」です。公式を覚えて計算しても、「平方の和である理由」、「平方和の公式の変形」や「測定データを変換して平方和の導出」がわからず、困りますよね。
こういう疑問に答えます。
本記事のテーマ
平方和をマスターするポイント
- ➀なぜ平方和は2乗和なのかを理解する
- ②平方和の公式をスムーズに変形できる
- ③測定データを変換して平方和を算出できる
記事の信頼性
記事を書いている私は、QC検定®1級合格し、平方和でつまずきやすい社内のQC検定®2級挑戦者にわかりやすく説明しています。
①QC検定®と品質管理検定®は、一般財団法人日本規格協会の登録商標です。
➁このコンテンツは、一般財団法人日本規格協会の承認や推奨、その他の検討を受けたものではありません。
➂QCプラネッツは、QC検定®と品質管理検定®の商標使用許可を受けています。
●リンクページ
本記事を読んでいるあなたは、平方和、確率分布関数など統計学の基礎をマスターしたいはずです。理解度アップのための必須な関連記事がありますので、関連記事も読んでください。
確率分布関数の作り方や確率・期待値を積分で計算する理由が簡単にわかるページ
【簡単】確率分布関数がすぐ身につく方法
★品質管理・統計に頻出な分布関数をわかりやすく解説したページ
【簡単】F分布がすぐ使いこなせる【初心者向け】
【簡単】t分布がすぐ使いこなせる【初心者向け】
【簡単】χ2乗分布がすぐ使いこなせる【初心者向け】
【簡単】χ2乗分布とt分布とF分布がすぐわかる【初心者向け】
★理解が難しいポアソン分布がすぐ理解できるページ
【簡単】わかりやすく理解できるポアソン分布
QC模試受験しよう!
QC模試(品質技量の腕試し&QC検定®対策) 品質技量の実力を試したい! QC検定®合格対策に活用したい! 1,000円で提供します! 公式、暗記で終わらず、自分のものにできているかを試すオリジナル試験問題です! |
品質力が鍛えられる「QC塾」を是非ご利用ください。
品質のリーダーを育成する「QC塾」 ブログでは、品質の勉強、実務、QC検定®に役立つ情報をアップして 「わかる」価値を提供していますが、「わかる」を「できる」に変える トレーニング塾「QC塾」を是非ご利用ください。 難解な品質が、すっきりわかり、指導できるレベルまで上達できます! |
さっそく見ていきましょう。
➀なぜ平方和は2乗和なのかを理解する
平方和に入る前に、他の式を考えて比較すると平方和の良さが理解できます。理解してから公式を使うようにしましょう。
You tubeでもわかりやすく解説しています。ブログも合わせてマスターしましょう。
1乗和のばらつき算出式を作る
世の中のデータは、「平均」と「ばらつき」の2つで評価します。平均の式は「合計/個数」です。「合計/個数」以外の式はほぼ使いませんよね。
では、ばらつきの算出式を「平方和を知らない」人として考えてみましょう。
ばらつきの定義から考えると、「平均からのズレ」ですよね。式に書きましょう。あるデータ \(x_i\)と平均 \(\bar{x}\)とするとばらつきは
$$ \sum_{i} (x_i-\bar{x}) $$
という式になります。
平方和と違って、2乗しませんから計算は簡単ですね。でも公式として使われていません。なぜでしょうか?
例を見ればわかります。5個のデータを見ましょう。
\(x_i\) | 53,48,44,57,58 |
\(\bar{x}\) | 52,52,52,52,52 |
\(x_i-\bar{x}\) | 1,-4,-8,5,6 →合計0 |
なんと、\(\sum_{i} (x_i-\bar{x})\)となります。式は正しそうに書いていますが、式の意味は「全部の合計」と「平均×個数」の差です。どちらも全部の合計になるため、0になります。この式は使えません。残念!
修正した1乗和のばらつき算出式を作る
ばらつきの式が0にならないように再考します。ばらつきは「平均からのズレ」であり、この値は常に正になります。そこで、次の式に改良しました。
あるデータx(i)と平均bar(x)とするとばらつきは
$$ \sum_{i} |x_i-\bar{x}| $$
という式になります。苦手意識の高い絶対値記号ですが、大丈夫です!
例を見てチェックしましょう。同じく5個のデータを見ましょう。
\(x_i\) | 53,48,44,57,58 |
\(\bar{x}\) | 52,52,52,52,52 |
\(|x_i-\bar{x}|\) | 1,4,8,5,6 →合計24 |
ばらつきの合計が24で平均24/5=4.8と5程度平均からずれる。確かにデータを見ると正しいとわかります。
実は、ばらつきを評価する式の1つに
$$ \sum_{i} |x_i-\bar{x}| $$
もあります。でもなぜ教科書にはいつも平方和の式なのでしょうか?
計算が楽だからばらつきは平方和で算出
ばらつきを評価する
$$ \sum_{i} |x_i-\bar{x}| $$
は1つ大きな問題があります。それは「絶対値|x|の||を外すのが手間」なんです。
絶対値|x|はx≧0ならx,x
\(\sum_{i} |x_i-\bar{x}|\) =\( |x_1-\bar{x}|+ |x_2-\bar{x}|\)+\(・・・+|x_n-\bar{x}|\)
とn個の項それぞれに中身の正負を見て絶対値記号を外すのが大変手間です。
なので、面倒な絶対値記号を外す手間を不要な方法を考えるはずです。
これは「2乗」すればよいのです。()の中身の正負に関係なく簡単に()を外すことができます。これがばらつきを平方和で評価する理由なのです。
ばらつきを評価する式は平方和以外にもありますが、平方和が複雑な式ですが、計算の手間が少ないわけです。
ちなみに上の例の平方和は142となります。
\(x_i\) | 53,48,44,57,58 |
\(\bar{x}\) | 52,52,52,52,52 |
\((x_i-\bar{x})^2\) | 1,16,64,25,36 →合計142 |
②平方和の公式をスムーズに変形できる
平方和は2つの式で表現できます。試験に使いやすい方を覚えておくと便利です。でも数列の和Σの変形に慣れておくと、分散分析、実験計画法、回帰分析の理解が早くなります。式の変形を見ましょう。
You tubeでも解説しています。ブログも合わせてマスターしてください。
平方和の式の2つの顔
平方和の式は「平均からのズレの2乗和」です。式で書くと
$$ S=\sum_{i} (x_i-\bar{x})^2 $$
です。この式を変形した、よく使われる式があります。
$$ S=\sum_{i} x_i^2- (\sum_{i} x_i)^2/n $$
平方和の式を変形
教科書では変形過程を見たいところを省く
ので、本記事は省かずに導出過程を書きます。
$$ S=\sum_{i} (x_i-\bar{x})^2 $$
$$ =\sum_{i} (x_i^2-2\bar{x}x_i+(\bar{x})^2) $$
ここで、\(\bar{x}\)は平均で、\(\bar{x}=(\sum_{i} x_i)/n\)を代入します。
\( S=\sum_{i} x_i^2\)-\(2((\sum_{i} x_i)/n)(\sum_{i} x_i)\)+\(\sum_{i}((\sum_{i} x_i)/n)^2 \)
急に難しくなりましたね。眺めるだけでも十分な勉強になるので、まずは見ましょう!
第2項は、\(2(\sum_{i} x_i)/n)(\sum_{i} x_i)\)=\(2/n(\sum_{i} x_i)^2\)に変形できます。
第3項は、\(\sum_{i}((\sum_{i} x_i)/n)^2\)=\(n((\sum_{i} x_i)/n)^2\)=\(1/n(\sum_{i} x_i)^2)\)に変形できます。
まとめると、
\(S=\sum_{i} x_i^2- 2/n(\sum_{i} x_i)^2\)+\(1/n(\sum_{i} x_i)^2\)=\(\sum_{i} x_i^2-(\sum_{i} x_i)^2/n\)と変形できました。
大事なのは、第2項、第3項の変形です。実験計画法、回帰分析で活用する分散分析の分散期待値の変形に応用されます。
公式の当てはめ方
例題を見ましょう。慣れないうちは2つも平方和の公式を覚えず、1つだけにしましょう。最初は、平方和S=\(\sum_{i} x_i^2-(\sum_{i} x_i)^2/n\)をよく使っていました。
1. 5個のデータにおける平方和を求めよ。
\(x_i\) | 8,12,6,10,4 (合計40)8 |
\(x_i^2\) | 64,144,36,100,16 (合計360) |
試験では、データの2乗を与えている場合があります。
平方和S=\(\sum_{i} x_i^2-(\sum_{i} x_i)^2/n\)を使います。
S=360-40^2/5=40
2. 5個のデータにおける平方和を求めよ。
\(x_i\) | 8,12,6,10,4 (合計40) |
平均が8と簡単に求められるので、
\(S=\sum_{i} (x_i-\bar{x})^2\)を使います。
S=(8-8)^2+(12-8)^2+(6-8)^2+(10-8)^2+(4-8)^2=40
③測定データを変換して平方和を算出できる
平方和に慣れていないあなたを惑わす試験問題があります。よく、測定データをわざわざ変換して平方和が変換値の2乗に変化する内容です。心理統計学の期末試験やQC検定®3級・2級に頻出問題ですね。
事例を挙げます。
測定データが5つあり、その重さを測定した。xの値は大きいので、X=(x-260)×10とするXに変換した。
x | 261.4,267.3,255.3,257.3,258.7 |
X | 14,73,-47,-27,-13 |
xによる平方和Sxと、Xによる平方和SXの関係には Sx=(➀)SXの関係がある。(➀)はいくらか?
安心してください。慣れている人でも即答できません。一般化した方がわかりやすいので、式で見ましょう。
ある変数xにXをX=(x-m)×M (x,Xは変数、m,Mは定数)するように変換します。Xによる平方和SXの式を作ります。
\(SX=\sum(X_i-\bar{X})^2\)
ここで、 \(X=(x-m)×M\)ですから、
\(X_i=(x_i-m)×M\),\(\bar{X} =(\bar{x}-m)×M\)
を代入します。
\(SX=\sum((x_i-m)×M -(\bar{x}-m)×M)^2\)
=\(M^2\sum(x_i -m)^2\)=\(M^2Sx\)となりますね。
なので(➀)はM=10から100が答えとなります。
変換した平方和の出題は、本質的な内容ではありません。しかし、慣れないあなたに出題される問いなので、平方和の式変形は慣れておくとよいです。
まとめ
平方和でつまずきやすいポイントを3つ解説しました。
- なぜ平方和は2乗和なのかを理解する
- ②平方和の公式をスムーズに変形できる
- ③測定データを変換して平方和を算出できる
本記事を読んでいるあなたは、平方和、確率分布関数など統計学の基礎をマスターしたいはずです。理解度アップのための必須な関連記事がありますので、関連記事も読んでください。
確率分布関数の作り方や確率・期待値を積分で計算する理由が簡単にわかるページ
【簡単】確率分布関数がすぐ身につく方法
★品質管理・統計に頻出な分布関数をわかりやすく解説したページ
【簡単】F分布がすぐ使いこなせる【初心者向け】
【簡単】t分布がすぐ使いこなせる【初心者向け】
【簡単】χ2乗分布がすぐ使いこなせる【初心者向け】
【簡単】χ2乗分布とt分布とF分布がすぐわかる【初心者向け】
★理解が難しいポアソン分布がすぐ理解できるページ
【簡単】わかりやすく理解できるポアソン分布
Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119