ガチΣ
平均と分散にちょっとよく出る関係あるんでそれの導出
その前にΣの説明
って書いたらiが0からnまで(なんか)を全部足すって意味
だったら、1+2+3+・・・+nって意味、ちなみにこれn(1+n)/2
だったら1+1+1+・・・+1って意味、ちなみに1をn回足すのでこの値はn
だったらって意味、ちなみにってだいたいデータのこと だからこれをnで割ったら平均がでる なんかこれわかってる前提で話すすめてたけど
というわけだけどΣの何回か足すって掛け算と同じような操作なのでΣは分配法則みたいな感じの掛け算と同じような性質をいろいろもってる
たとえばつまり括弧がはずせる まあxとy足してから全部足すのとx全部足してy全部足してその二つを足すのも変わらないよねってこと
あとつまりiに関係ないやつはΣの前に出せる まあxをa倍してから全部足すのとx全部足してa倍するのも変わらないよねってこと
ちなみにこの二つの性質もってるやつは結構おって大学はキモいからこれをまとめて線形性って呼んでる
これらを踏まえて(分散はデータ全部二乗してから平均取ったやつからデータの平均を二乗したやつを引いたやつ)をみちびく
ガチ分散
細かいことはある程度大きな視野持てるようになってからのほうがわかりやすいだろうからまずは雑に書く
まず最初なんで平均とかいう値を求めたかというとn個もあるデータの特性を平均という一つの数字で表せるから
でも平均の他にもデータには特性があってたとえばデータのばらつき
これ左のほうがデータは固まってて右の方はデータが散らばってる これを一つの値で表すのが分散
分散を数字にしようと思うととりあえず基準がいるのでとりあえず平均値を基準にする
で、この青の矢印の長さの平均とったらデータが散らばってるほど数字がでかくてまとまってるほど数字がちっさくなる
でも青の矢印のでかさはデータが平均よりでかいかどうかでだったり逆にだったりするから実際に計算するとき場合分けが入ることになってうんこ
というわけで二乗して無理やり正の数にしてやってから平均をとることで最強になる
これを式にする
まず青の矢印
それの二乗 ちなみにこれどっちが前でも同じ数になる
これの平均、つまり1からnまでのiすべてについて足してnで割ることで分散の式が出る ちなみにiはインデックスのi
まあこれでいいんだけどなんか二乗しちゃってるからその分減らそう見たいに考えたのが標準偏差で雑に分散にルート付けてる だから分散はだいたいってかくし標準偏差はだいたいってかく
ガチ平均
平均は全部足して足した数で割ります。平均って平らに均すって書きます。
こういうデータあったら平均は
こういう数(青の面積と黒の面積が同じ(平らに均すので))
だから平均が満たすべき性質は
これを4で割ったらの形にできて
n=4の時がこれなんで一般的には
になる しらんけど