統計学Part17 [無断転載禁止]©2ch.net

1132人目の素数さん2016/11/11(金) 02:34:18.63ID:4ofrRMLG

657132人目の素数さん2018/09/02(日) 20:48:29.11ID:Ez5w7m9A
自由度の求め方について教えてください。
2グループについて、それぞれ平均値、標準偏差、n数がわかっています。
各グループでn数は違います
個々のデータは分かりません。分散が等しくないt検定(ウェルチのt検定)
をしようと思います。t値は求められるのですが、自由度も求め方がわから
ないので、有意水準5%で有意かどうかが判断できません。自由度の算出
方法を教えていただけないでしょうか。

658132人目の素数さん2018/09/05(水) 13:20:42.31ID:tS2KOPjG
定義読めば?

659132人目の素数さん2018/09/08(土) 13:11:44.95ID:WFiBaON4
>>657

# t検定(生データなし,等分散不問)
Welch.test=function(n1,n2,m1,m2,sd1,sd2){
T=(m1-m2)/sqrt(sd1^2/n1+sd2^2/n2)
df=(sd1^2/n1+sd2^2/n2)^2 / (sd1^4/n1^2/(n1-1)+sd2^4/n2^2/(n2-1))
p.value=2*pt(abs(T),df,lower.tail = FALSE)
return(p.value)
}

660132人目の素数さん2018/09/08(土) 13:21:23.26ID:WFiBaON4
標本数n 平均m 標準偏差sdの正規分布するシミュレーションデータを作ってWelchの検定をすることもできる。

Rが使えるなら

scale(rnorm(n))*sd + m

で可能。

これを各グループで作って検定する方法もある。

>659の結果と一致するはず。

661132人目の素数さん2018/09/16(日) 21:33:48.81ID:rMRDGQ30
統計学と並行して高校数学からやり直してるんだけど、微分積分さえある程度できれば解析学までやる必要はないってホント?
むしろその時間で線形代数やったほうが良いってのもホント?

662132人目の素数さん2018/09/19(水) 00:33:36.01ID:2tFRgvax
合成関数の微分とか全微分とかあたりまでは統計でも必須

663132人目の素数さん2018/09/19(水) 12:00:34.51ID:P3TgEiwp
ほ〜そういうものか。ありがとう

664学術2018/09/19(水) 12:03:01.01ID:KX539Fwk
統計三世。ルパンナポレオンより最強の(血)統系。

665132人目の素数さん2018/10/14(日) 16:10:05.84ID:tYo68Cmn
3個中1個が当たりのものがある。これを被験者6人中5人が当たりを引いた。
このとき、被験者は有意水準1%で当たりがわかるとは言えないが、有意水準5%で当たりがわかると言える。
ただし(1/3)^6=0.0014とする。

これ6C5*(1/3)^6+6C6*(1/3)^6=0.0096で1%を下回るんじゃないの?
納得できないんだけど教えて偉い人

666学術2018/10/14(日) 19:03:49.48ID:yXYU+8iI
確率を検証して当たる確率出すなんてナンセンスだよね。賭け事は進んでいて
意外性が在る乱数になるから、何か見えないものが働いていることが数学ではよくわからない。そしてタロットも然り。同じ確率なんだけど、
運命を感じるというのも変な話で。矛盾しているよね。気持ちと心が。

667132人目の素数さん2018/10/22(月) 11:52:44.19ID:1/aHuqXD
練習問題の解法を教えてください。基本統計学第4版(有斐閣)の6章の問題です。

41)1つのサイコロを1,000回投げたとき、1の目が180回以上出る確率と、1の目が140回以上200回以下出る確率を求めよ。
本の答えは、0.1379と0.9875です。以下のように計算してるのですが、答えがあいません。

前段の問題
n=1000,p=1/6の2項分布を正規分布で近似して求めた。μ=1000*1/6、σ^2=1000*1/6*5/6としてN(1000/6, 5000/36)を使う
(180−1000/6)/(sqrt(5000)/6)=80/sqrt(5000)=1.1313 −>正規分布の上側確率表より【0.12924】

後段の問題
Pr(140≦x≦200)で計算する
(140−1000/6)/(sqrt(5000)/6)=−160/sqrt(5000)=−2.2627 −>正規分布の上側確率表より0.011911
(200−1000/6)/(sqrt(5000)/6)=200/sqrt(5000)=2.828 −>正規分布の上側確率表より0.0023274
1−0.011911−0.0023274=【0.9857】

【】が自分で計算した答えです。計算式のどこかで間違えているのはずなのですが、自分では気付くことができません。
よろしくお願いします。

668132人目の素数さん2018/10/22(月) 15:38:07.09ID:TgBnmqGr
z=(179.5-1000/6)/sqrt(5000/36)=1.08894...→1.09
z=1.09に対する分布表の値は.3621なので、0.5からこれを引いて0.1379

z1=(200.5-1000/6)/sqrt(5000/36)=2.87085...→z=2.87
z=2.87 に対する分布表の値は 0.4979
z2=(139.5-1000/6)/sqrt(5000/36)=-2.30517...→z=2.31
z=2.31 に対する分布表の値は 0.4896
これらの和は0.9875

「180回以上出る確率」の相反事象は「179回以下出る確率」なので、
179.5を境界にするのが妥当だということと、教わった手順に従って、
「適当」な場面で四捨五入を行い、数表を用いると、
テキスト通りの値に行き着くようです。

669132人目の素数さん2018/10/23(火) 13:31:34.14ID:CdMSDP6/
ありがとうございました。離散数値での確率密度関数の使い方がわかりました。

670132人目の素数さん2018/10/30(火) 21:09:05.91ID:rPxKt/Y8
ちょいとすみません。わからないところがあってここにたどり着いたズブの素人なのですが、よければ教えてください。
標準偏差て平均が基準値なんですよね?
平均じゃなくて、ある値(カットオフ値)を基準にしてそこからバラつきがどんなものか調べたい時は、計算方法は標準偏差と同じで平均値をカットオフ値に置き換えたらいいのでしょうか?
ネットで調べても平均値で計算、ばかりでわからなかったです

671132人目の素数さん2018/11/20(火) 22:09:26.70ID:cFR1wwH3
Wolframに入力してみました。

https://www.wolframalpha.com/input/?i=sum%5Bchoose(1000,n)*1%2F6%5En*(5%2F6)%5E(1000-n),+n+%3D+180+to+1000%5D
sum[choose(1000,n)*1/6^n*(5/6)^(1000-n), n = 180 to 1000]
sum_(n=180)^1000 ((5/6)^(1000 - n) binomial(1000, n))/6^n
=0.138430864995663940543635063874277127250218037792364115557...

https://www.wolframalpha.com/input/?i=sum%5Bchoose(1000,n)*1%2F6%5En*(5%2F6)%5E(1000-n),+n+%3D+140+to+200%5D
sum[choose(1000,n)*1/6^n*(5/6)^(1000-n), n = 140 to 200]
sum_(n=140)^200 ((5/6)^(1000 - n) binomial(1000, n))/6^n =
=0.988113644388740861240108592472945211524447200450991732557...

672132人目の素数さん2018/11/29(木) 23:38:51.95ID:oAvg0d0l
九州大学大学院数理学府数理学専攻数理学コース 問題と解答
基礎科目4題(150分) 専門科目2題(120分) 口頭試問 ※英語は課さない
https://www.dropbox.com/sh/vx4soup3t782d91/AAD4Izg4yNB-8jXUmkUSftO_a?dl=0

673132人目の素数さん2018/12/04(火) 22:30:12.09ID:44qbPqb5

674132人目の素数さん2018/12/16(日) 11:35:51.85ID:FIaML+tk
重回帰分析で交互作用を検討?交互作用が予想される問題に
適用すべきは、実験計画法(分散分析)ではないのか?
重回帰分析で交互作用を検討する  Posted on 2014年1月31日  
http://norimune.net/1733

675132人目の素数さん2018/12/25(火) 20:38:41.41ID:pRXuZdkl
この名大のように先端医療開発部門に生物統計とバイオインフォマティクスを
抱える統計解析室という組織があるのは、他所のの医学部でも通常なのかな?
医学部で生物統計というと新薬の薬効の統計的検定ということか?
また統計解析室長を木下文恵某とかいう若手の助教が担うのも通常なのかな?
名古屋大学医学部附属病院 先端医療開発部 先端医療・臨床研究支援センターの体制 
統計解析室−−生物統計・バイオインフォマティクス
http://www.nu-camcr.org/cms/center_index/center_staff/

676132人目の素数さん2018/12/27(木) 00:12:12.23ID:MJGJAQMS
例えば、母集団から50枚の答案用紙を選んで、平均が
60点だとする。母集団は2500枚の答案用紙から成り立っているとして、平均は70点とする。このとき50枚の答案用紙をランダムに選んだかの検定はどの

ようにすればいいでしょうか。(つまり60点の平均点が低いので、ランダムに選んだかどうかを疑っているわけです。)

677132人目の素数さん2018/12/30(日) 08:45:37.63ID:OqurSyyP
>>646
EXCELの分析ツールは良くないというのは、統計専用ソフトと
出力値が合わないからですか?
お薦めの統計専用ソフトは、どれどれですか?

678学術2018/12/30(日) 12:25:34.69ID:RTlTqpwk
方程式に代入する速度はパソコンじゃ無理なんだろうか?そうでもないらしいね。

679132人目の素数さん2018/12/30(日) 15:39:18.16ID:VJBrhucL
こんなグラフの2つの系列に対する有意差検定ってどうすればいいでしょうか。
ttps://benesse.jp/teikitest/_resource/img/kou/science/k_sc_619_6.png
実際には2つの系列はそれぞれ複数の結果があります。

680132人目の素数さん2018/12/31(月) 12:28:26.71ID:BBwEFlcD
>>676
母集団のバラツキが大きいならランダムに選んだと言えるかもね。
母集団の分布をどう仮定するかによるんじゃね。

681132人目の素数さん2018/12/31(月) 23:33:19.06ID:oFI1Upvm
>>676
母集団は正規分布としてシミュレーションしてみた。
母分散が43点程度であれば標本平均が60点以下になる確率が5%を越える。

> f= function(sig){
+ x=scale(rnorm(2500))*sig + 70
+ mean(replicate(1e3,mean(sample(x,50)))<=60)
+ }
> f=Vectorize(f)
> f(1:100)
[1] 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000
[13] 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.001
[25] 0.002 0.002 0.003 0.003 0.005 0.006 0.010 0.018 0.017 0.017 0.013 0.021
[37] 0.029 0.026 0.029 0.041 0.035 0.037 0.057 0.054 0.058 0.076 0.059 0.060
[49] 0.063 0.068 0.080 0.074 0.077 0.086 0.098 0.092 0.114 0.096 0.110 0.098
[61] 0.115 0.115 0.133 0.122 0.141 0.118 0.139 0.157 0.170 0.153 0.182 0.165
[73] 0.171 0.154 0.167 0.175 0.163 0.174 0.178 0.174 0.196 0.205 0.204 0.211
[85] 0.206 0.205 0.217 0.212 0.235 0.218 0.189 0.230 0.232 0.215 0.221 0.246
[97] 0.217 0.228 0.216 0.248
>

682132人目の素数さん2018/12/31(月) 23:34:50.72ID:oFI1Upvm
>>679
同一濃度での反応速度データがあるならpaired t-test で検定できるのでは。

683132人目の素数さん2018/12/31(月) 23:58:42.47ID:oFI1Upvm
>>665
6C5*(1/3)^5*(2/3)+6C6*(1/3)^6= 0.01783265

684132人目の素数さん2019/01/01(火) 01:14:20.00ID:dni0tbHZ
>>682
x軸の値を実験の設定値にすれば同一ですが、測定値で補正してるので厳密には同一になりません。
散布図のプロットを繋いだような系列では難しいですね。
もしx軸を設定値としてpaired t-testする場合、レプリケートの扱いは各測点で平均化すればいいでしょうか。
それとも検定結果を平均化する方法が有るのでしょうか。

685132人目の素数さん2019/01/01(火) 07:21:45.66ID:nRsyFy0N
>>681
訂正
×母分散が43点程度
○ 母集団の標準偏差が43点程度

686132人目の素数さん2019/01/01(火) 07:42:07.71ID:nRsyFy0N
>>684
阻害剤の添加による反応速度の変化=0が帰無仮説の検定
なので両端のデータが多いと有意差なしになるだろうね。
この例での有意差検定の意味がわからなくなってきた。

687132人目の素数さん2019/01/01(火) 14:03:25.77ID:dni0tbHZ
>>686
専用の検定が無いとなると確かに両端に影響されますね。
有意差の数値化は諦めてグラフから説明するしかないかもしれませんね。

688132人目の素数さん2019/01/03(木) 05:08:06.81ID:9mVlT2wA
https://i.imgur.com/BHgxjYD.png
帰無仮説、対立仮説に関する質問です。

・3つのグループの標本は同じ母集団から得られたものである。○か×か?
どちらなんでしょう。
初学者なため、自分でも何を言いたい質問なのか分かりませんが、お答えいただければ幸いです。

689132人目の素数さん2019/01/03(木) 12:53:01.61ID:QWWivxRF
>>688
×

690132人目の素数さん2019/01/03(木) 12:59:00.73ID:elcA+Zry
>>688
F分布を書くとこんなかんじ

https://i.imgur.com/sJWogIE.png

691132人目の素数さん2019/01/03(木) 13:43:39.06ID:ZOqQE5UH
>>688
宿題かい?

692132人目の素数さん2019/01/03(木) 16:24:30.86ID:9mVlT2wA
>>689-690
×なんですね。お返事ありがとうございます
それも画像付きで…感謝の極みです

>>691
Odyssey主催のビジネス統計スペシャリスト(上級)という資格試験の勉強中でして…
ベーシックに合格できたのでスペシャリストの方も取ろうと思ったら内容が一気に難しくなり、
恥ずかしながら独学でどうしても分からない所が出てきたので質問させていただきました

693132人目の素数さん2019/01/03(木) 17:27:28.50ID:xWkC5+gv
>>692
統計検定二級あたりの教科書で一通り手法は知っといた方がいいかもね。無料がいいなら統計WEBとかもあるし。

まあ、でも、問題に複数の会社名が出てきてる時点で同じロット(母集団)とは言えないんじゃ?と思ったけど。

694132人目の素数さん2019/01/03(木) 17:45:10.89ID:elcA+Zry
>>688
生データなしで計算すると

> ## m sd n
> A=c(159.0625,sqrt(3924.729167),16)
> B=c(240,sqrt(22027.5),17)
> C=c(366.35,sqrt(5329.292105),20)
>
> lh=rbind(A,B,C)
> colnames(lh)=c("m","sd","n") ; lh
m sd n
A 159.0625 62.64766 16
B 240.0000 148.41664 17
C 366.3500 73.00200 20
> mean.G=sum(lh[,"m"]*lh[,"n"])/sum(lh[,"n"])
> SS.bit=sum((lh[,"m"]-mean.G)^2*lh[,"n"])
> SS.wit=sum(lh[,"sd"]^2*(lh[,"n"]-1))
> df.bit=nrow(lh)-1
> df.wit=sum(lh[,"n"]-1)
> MS.bit=SS.bit/df.bit
> MS.wit=SS.wit/df.wit
> (F.ratio=MS.bit/MS.wit)
[1] 19.28831
> pf(F.ratio,df.bit,df.wit,lower.tail=FALSE)
[1] 6.18406e-07
> (η2=(SS.bit)/(SS.bit+SS.wit))
[1] 0.4355169

695132人目の素数さん2019/01/03(木) 18:05:15.25ID:elcA+Zry
どの2つが別の母集団かを検定すると

> pairwise.t.test(x,g,p.adjust='holm')

Pairwise comparisons using t tests with pooled SD

data: x and g

A B
B 0.02596 -
C 4.5e-07 0.00083

P value adjustment method: holm

696132人目の素数さん2019/01/05(土) 21:27:56.85ID:6yG70IA5
Zが標準正規分布に従う時、次の値を求めよ。
1:P{Z>u1}=0.05を満たすu1の値 → u1=1.645
2:P{Z<u2}=0.005を満たすu2の値 → u2=-2.576
3:P{-u3<Z<u3}=0.99を満たすu3の値 → u3=2.576

Xが正規分布N(10, 5^2)に従う時、次の確率を求めよ。
1:P{X>20} → 0.0228
2:P{X<5} → 0.1587
3:P{0<X<20} → 0.9544

途中式:https://i.imgur.com/mJcxOKQ.png
※P{X>20}は 0.0028 じゃなくて 0.0228 の間違い。
━━━━━━━━━━━━━━━
Excelスレで質問したのですがスレチと言われたのでここで質問させて下さい。
上の6つの問題を標準正規分布の数値表を用いずに、
Excelの関数で求めたいのですが関数式を教えていただければ幸いです。

697132人目の素数さん2019/01/05(土) 22:04:26.80ID:yvpdTVqU
>>696
これを見た統計学スレの方々が答えてくれたのかはわかりませんが、
このレスの後すぐに関数式を教えていただけました。ありがとうございました!

698132人目の素数さん2019/01/06(日) 08:18:40.95ID:ef7QnJT7
>>697
NORMINV, NORMDIST

699132人目の素数さん 2019/01/06(日) 09:53:57.32ID:a2Sn8ikL
>>696
Excelスレで質問?
数学板上のソフトスレは、以下しかない筈だが?
理工系分野手法操作も扱うExcelスレは、何処板に?
【R言語】統計解析フリーソフトR 第6章【GNU R】 [無断転載禁止]©2ch.net
http://rio2016.2ch.net/test/read.cgi/math/1501755792/
統計ソフトSTATAの部屋 Ver.2
https://rio2016.2ch.net/test/read.cgi/math/1284083650/
グラフから読み取る統計学の基本入門 [無断転載禁止]©2ch.net
http://rio2016.2ch.net/test/read.cgi/math/1497075809/

700132人目の素数さん2019/01/06(日) 14:40:18.34ID:4nVseH61
Zが標準正規分布に従う時、次の値を求めよ。
1:P{Z>u1}=0.05を満たすu1の値 → u1=1.645
2:P{Z<u2}=0.005を満たすu2の値 → u2=-2.576
3:P{-u3<Z<u3}=0.99を満たすu3の値 → u3=2.576

qnorm(0.05,lower.tail = FALSE)
qnorm(0.005,lower.tail= TRUE)
qnorm((1-0.99)/2,lower.tail=FALSE)

Xが正規分布N(10, 5^2)に従う時、次の確率を求めよ。
1:P{X>20} → 0.0228
2:P{X<5} → 0.1587
3:P{0<X<20} → 0.9544

1-pnorm(20,10,5)
pnorm(5,10,5)
pnorm(20,10,5)-pnorm(0,10,5)

701132人目の素数さん2019/01/08(火) 14:30:28.74ID:6dIcngvn
散々ググってもわからなかったので、教えてください。
どこか間違ってるんだが、どこかわかりません。

検定の際にα=5% β=20%、右側検定(母集団の平均測定)として、
なぜ、確率の場合分けで足し合わせるように
H0となる確率=(1−α)/(1-α+β)   H1となる確率=(1-β)/(1-β+α)
ではなく

いきなり、H0の第2種の過誤=β=20%、H1第1種の過誤=α=5%なのでしょう。
そもそもμ0とμが1:1の確率で起こる前提だと、確率の場合分けができますが、前提が違うのでしょうか。

H0ならば測定値xバーはZcrit 以下に95%分布している(はず)、よってH0をrejectできない。
でもそれが間違っている確率はβ=20%よ、というのがピンときません。。。

702132人目の素数さん2019/01/10(木) 20:50:46.14ID:Ylhxumi4
>間違っている確率はβ=20%よ

というのは正しくないよ。

棄却  棄却しない
H0 A B
H1 C D

α=A/(A+B)
β=D/(C+D)

β=D/(B+D)ではないよ。

ちなみに
A/(A+C)はFalse Positive Report ProvbabilityとかFalse Positive Rateとか呼ばれる

703132人目の素数さん2019/01/10(木) 22:24:03.86ID:7xf256Xd
平均値と中央値の差の絶対値が標準偏差以下であることを示して欲しいです。よろしくお願いします。

704132人目の素数さん2019/01/10(木) 22:55:32.84ID:TC7xh35K
>>688,692です。
https://i.imgur.com/KQMCk5P.png
質問に答えてくださった方々のお力で資格試験に無事合格できました。
このスレにいる統計学の専門者の方々から見たら、
「おいおいそんな見たことも聞いたことも無いうんちな資格取ってどーすんだ?w」と思われるかもしれませんが、
単に、お礼を伝えに来ただけなのです。ありがとうございました(、、

705132人目の素数さん2019/01/11(金) 08:06:00.17ID:R3J99zpw
>>704
エクセル分析ベーシック?エクセル分析スペシャリスト?
無事合格おめでとうございます。
初めて聞く資格名です。
どの方面で有能な資格なのですか?
主催odysseyというのは、どういう組織なのですか?
https://stat.odyssey-com.co.jp/about/

706132人目の素数さん2019/01/13(日) 13:27:33.24ID:8DXBc9Sn
NHKのこの「日本人の意識」調査のサンプルサイズn=5400は、
過剰で統計理論に背いているだろ?
1安倍ちゃん ★2019/01/10(木) 18:43:00.82ID:e4+I4ZlK9
・・・「日本人の意識」調査を、昭和48年から5年ごとに行っています。最新の調査は
去年6月から7月にかけて、全国の16歳以上の5400人を対象に個人面接法で実施し、
50.9%にあたる2751人から回答を得ました。
この中で、結婚についての考え方を尋ねたところ「必ずしも結婚する必要はない」と
答えた人は68%、「人は結婚するのが当たり前だ」と答えた人は27%・・・・
【NHK世論調査の異常な現実】本当にちゃんと選んでるのか?現状の生活満足が92%
http://asahi.5ch.net/test/read.cgi/newsplus/1547113380/

707132人目の素数さん2019/01/18(金) 10:00:15.52ID:/asQ+GeG
>>706
どちらにしても、アンケートを受けた本人が考えたというより、
親の考え方がそうだということにしかならんのだよな。

そう考えると、大人は理不尽だ。

新着レスの表示
レスを投稿する