統計学Part17 [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
>>646
>うん、分析ツールは良くないっていう話はよく聞く・・・・・・・・・・・・
良くないというのは、Excelのどのバージョンのどのサブメニューのことなのか?
良くないというのは、分析結果の精度が粗い?分析結果が間違っている?
それとも、うん、>>646と>>645を受けたレスということは、分析ツールとは別メニューの
Excelのソルバー>>645が、良くないという趣旨なのか?
ソルバーが良くないというのは、他の統計ツールと分析結果が相異するからなの? 自由度の求め方について教えてください。
2グループについて、それぞれ平均値、標準偏差、n数がわかっています。
各グループでn数は違います
個々のデータは分かりません。分散が等しくないt検定(ウェルチのt検定)
をしようと思います。t値は求められるのですが、自由度も求め方がわから
ないので、有意水準5%で有意かどうかが判断できません。自由度の算出
方法を教えていただけないでしょうか。 >>657
# t検定(生データなし,等分散不問)
Welch.test=function(n1,n2,m1,m2,sd1,sd2){
T=(m1-m2)/sqrt(sd1^2/n1+sd2^2/n2)
df=(sd1^2/n1+sd2^2/n2)^2 / (sd1^4/n1^2/(n1-1)+sd2^4/n2^2/(n2-1))
p.value=2*pt(abs(T),df,lower.tail = FALSE)
return(p.value)
} 標本数n 平均m 標準偏差sdの正規分布するシミュレーションデータを作ってWelchの検定をすることもできる。
Rが使えるなら
scale(rnorm(n))*sd + m
で可能。
これを各グループで作って検定する方法もある。
>659の結果と一致するはず。 統計学と並行して高校数学からやり直してるんだけど、微分積分さえある程度できれば解析学までやる必要はないってホント?
むしろその時間で線形代数やったほうが良いってのもホント? 合成関数の微分とか全微分とかあたりまでは統計でも必須 3個中1個が当たりのものがある。これを被験者6人中5人が当たりを引いた。
このとき、被験者は有意水準1%で当たりがわかるとは言えないが、有意水準5%で当たりがわかると言える。
ただし(1/3)^6=0.0014とする。
これ6C5*(1/3)^6+6C6*(1/3)^6=0.0096で1%を下回るんじゃないの?
納得できないんだけど教えて偉い人 確率を検証して当たる確率出すなんてナンセンスだよね。賭け事は進んでいて
意外性が在る乱数になるから、何か見えないものが働いていることが数学ではよくわからない。そしてタロットも然り。同じ確率なんだけど、
運命を感じるというのも変な話で。矛盾しているよね。気持ちと心が。 練習問題の解法を教えてください。基本統計学第4版(有斐閣)の6章の問題です。
41)1つのサイコロを1,000回投げたとき、1の目が180回以上出る確率と、1の目が140回以上200回以下出る確率を求めよ。
本の答えは、0.1379と0.9875です。以下のように計算してるのですが、答えがあいません。
前段の問題
n=1000,p=1/6の2項分布を正規分布で近似して求めた。μ=1000*1/6、σ^2=1000*1/6*5/6としてN(1000/6, 5000/36)を使う
(180−1000/6)/(sqrt(5000)/6)=80/sqrt(5000)=1.1313 −>正規分布の上側確率表より【0.12924】
後段の問題
Pr(140≦x≦200)で計算する
(140−1000/6)/(sqrt(5000)/6)=−160/sqrt(5000)=−2.2627 −>正規分布の上側確率表より0.011911
(200−1000/6)/(sqrt(5000)/6)=200/sqrt(5000)=2.828 −>正規分布の上側確率表より0.0023274
1−0.011911−0.0023274=【0.9857】
【】が自分で計算した答えです。計算式のどこかで間違えているのはずなのですが、自分では気付くことができません。
よろしくお願いします。 z=(179.5-1000/6)/sqrt(5000/36)=1.08894...→1.09
z=1.09に対する分布表の値は.3621なので、0.5からこれを引いて0.1379
z1=(200.5-1000/6)/sqrt(5000/36)=2.87085...→z=2.87
z=2.87 に対する分布表の値は 0.4979
z2=(139.5-1000/6)/sqrt(5000/36)=-2.30517...→z=2.31
z=2.31 に対する分布表の値は 0.4896
これらの和は0.9875
「180回以上出る確率」の相反事象は「179回以下出る確率」なので、
179.5を境界にするのが妥当だということと、教わった手順に従って、
「適当」な場面で四捨五入を行い、数表を用いると、
テキスト通りの値に行き着くようです。 ありがとうございました。離散数値での確率密度関数の使い方がわかりました。 ちょいとすみません。わからないところがあってここにたどり着いたズブの素人なのですが、よければ教えてください。
標準偏差て平均が基準値なんですよね?
平均じゃなくて、ある値(カットオフ値)を基準にしてそこからバラつきがどんなものか調べたい時は、計算方法は標準偏差と同じで平均値をカットオフ値に置き換えたらいいのでしょうか?
ネットで調べても平均値で計算、ばかりでわからなかったです Wolframに入力してみました。
https://www.wolframalpha.com/input/?i=sum%5Bchoose(1000,n)*1%2F6%5En*(5%2F6)%5E(1000-n),+n+%3D+180+to+1000%5D
sum[choose(1000,n)*1/6^n*(5/6)^(1000-n), n = 180 to 1000]
sum_(n=180)^1000 ((5/6)^(1000 - n) binomial(1000, n))/6^n
=0.138430864995663940543635063874277127250218037792364115557...
https://www.wolframalpha.com/input/?i=sum%5Bchoose(1000,n)*1%2F6%5En*(5%2F6)%5E(1000-n),+n+%3D+140+to+200%5D
sum[choose(1000,n)*1/6^n*(5/6)^(1000-n), n = 140 to 200]
sum_(n=140)^200 ((5/6)^(1000 - n) binomial(1000, n))/6^n =
=0.988113644388740861240108592472945211524447200450991732557... 重回帰分析で交互作用を検討?交互作用が予想される問題に
適用すべきは、実験計画法(分散分析)ではないのか?
重回帰分析で交互作用を検討する Posted on 2014年1月31日
http://norimune.net/1733 この名大のように先端医療開発部門に生物統計とバイオインフォマティクスを
抱える統計解析室という組織があるのは、他所のの医学部でも通常なのかな?
医学部で生物統計というと新薬の薬効の統計的検定ということか?
また統計解析室長を木下文恵某とかいう若手の助教が担うのも通常なのかな?
名古屋大学医学部附属病院 先端医療開発部 先端医療・臨床研究支援センターの体制
統計解析室−−生物統計・バイオインフォマティクス
http://www.nu-camcr.org/cms/center_index/center_staff/ 例えば、母集団から50枚の答案用紙を選んで、平均が
60点だとする。母集団は2500枚の答案用紙から成り立っているとして、平均は70点とする。このとき50枚の答案用紙をランダムに選んだかの検定はどの
ようにすればいいでしょうか。(つまり60点の平均点が低いので、ランダムに選んだかどうかを疑っているわけです。) >>646
EXCELの分析ツールは良くないというのは、統計専用ソフトと
出力値が合わないからですか?
お薦めの統計専用ソフトは、どれどれですか? 方程式に代入する速度はパソコンじゃ無理なんだろうか?そうでもないらしいね。 こんなグラフの2つの系列に対する有意差検定ってどうすればいいでしょうか。
ttps://benesse.jp/teikitest/_resource/img/kou/science/k_sc_619_6.png
実際には2つの系列はそれぞれ複数の結果があります。 >>676
母集団のバラツキが大きいならランダムに選んだと言えるかもね。
母集団の分布をどう仮定するかによるんじゃね。 >>676
母集団は正規分布としてシミュレーションしてみた。
母分散が43点程度であれば標本平均が60点以下になる確率が5%を越える。
> f= function(sig){
+ x=scale(rnorm(2500))*sig + 70
+ mean(replicate(1e3,mean(sample(x,50)))<=60)
+ }
> f=Vectorize(f)
> f(1:100)
[1] 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000
[13] 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.001
[25] 0.002 0.002 0.003 0.003 0.005 0.006 0.010 0.018 0.017 0.017 0.013 0.021
[37] 0.029 0.026 0.029 0.041 0.035 0.037 0.057 0.054 0.058 0.076 0.059 0.060
[49] 0.063 0.068 0.080 0.074 0.077 0.086 0.098 0.092 0.114 0.096 0.110 0.098
[61] 0.115 0.115 0.133 0.122 0.141 0.118 0.139 0.157 0.170 0.153 0.182 0.165
[73] 0.171 0.154 0.167 0.175 0.163 0.174 0.178 0.174 0.196 0.205 0.204 0.211
[85] 0.206 0.205 0.217 0.212 0.235 0.218 0.189 0.230 0.232 0.215 0.221 0.246
[97] 0.217 0.228 0.216 0.248
> >>679
同一濃度での反応速度データがあるならpaired t-test で検定できるのでは。 >>665
6C5*(1/3)^5*(2/3)+6C6*(1/3)^6= 0.01783265 >>682
x軸の値を実験の設定値にすれば同一ですが、測定値で補正してるので厳密には同一になりません。
散布図のプロットを繋いだような系列では難しいですね。
もしx軸を設定値としてpaired t-testする場合、レプリケートの扱いは各測点で平均化すればいいでしょうか。
それとも検定結果を平均化する方法が有るのでしょうか。 >>681
訂正
×母分散が43点程度
○ 母集団の標準偏差が43点程度 >>684
阻害剤の添加による反応速度の変化=0が帰無仮説の検定
なので両端のデータが多いと有意差なしになるだろうね。
この例での有意差検定の意味がわからなくなってきた。 >>686
専用の検定が無いとなると確かに両端に影響されますね。
有意差の数値化は諦めてグラフから説明するしかないかもしれませんね。 https://i.imgur.com/BHgxjYD.png
帰無仮説、対立仮説に関する質問です。
・3つのグループの標本は同じ母集団から得られたものである。○か×か?
どちらなんでしょう。
初学者なため、自分でも何を言いたい質問なのか分かりませんが、お答えいただければ幸いです。 >>689-690
×なんですね。お返事ありがとうございます
それも画像付きで…感謝の極みです
>>691
Odyssey主催のビジネス統計スペシャリスト(上級)という資格試験の勉強中でして…
ベーシックに合格できたのでスペシャリストの方も取ろうと思ったら内容が一気に難しくなり、
恥ずかしながら独学でどうしても分からない所が出てきたので質問させていただきました >>692
統計検定二級あたりの教科書で一通り手法は知っといた方がいいかもね。無料がいいなら統計WEBとかもあるし。
まあ、でも、問題に複数の会社名が出てきてる時点で同じロット(母集団)とは言えないんじゃ?と思ったけど。 >>688
生データなしで計算すると
> ## m sd n
> A=c(159.0625,sqrt(3924.729167),16)
> B=c(240,sqrt(22027.5),17)
> C=c(366.35,sqrt(5329.292105),20)
>
> lh=rbind(A,B,C)
> colnames(lh)=c("m","sd","n") ; lh
m sd n
A 159.0625 62.64766 16
B 240.0000 148.41664 17
C 366.3500 73.00200 20
> mean.G=sum(lh[,"m"]*lh[,"n"])/sum(lh[,"n"])
> SS.bit=sum((lh[,"m"]-mean.G)^2*lh[,"n"])
> SS.wit=sum(lh[,"sd"]^2*(lh[,"n"]-1))
> df.bit=nrow(lh)-1
> df.wit=sum(lh[,"n"]-1)
> MS.bit=SS.bit/df.bit
> MS.wit=SS.wit/df.wit
> (F.ratio=MS.bit/MS.wit)
[1] 19.28831
> pf(F.ratio,df.bit,df.wit,lower.tail=FALSE)
[1] 6.18406e-07
> (η2=(SS.bit)/(SS.bit+SS.wit))
[1] 0.4355169 どの2つが別の母集団かを検定すると
> pairwise.t.test(x,g,p.adjust='holm')
Pairwise comparisons using t tests with pooled SD
data: x and g
A B
B 0.02596 -
C 4.5e-07 0.00083
P value adjustment method: holm Zが標準正規分布に従う時、次の値を求めよ。
1:P{Z>u1}=0.05を満たすu1の値 → u1=1.645
2:P{Z<u2}=0.005を満たすu2の値 → u2=-2.576
3:P{-u3<Z<u3}=0.99を満たすu3の値 → u3=2.576
Xが正規分布N(10, 5^2)に従う時、次の確率を求めよ。
1:P{X>20} → 0.0228
2:P{X<5} → 0.1587
3:P{0<X<20} → 0.9544
途中式:https://i.imgur.com/mJcxOKQ.png
※P{X>20}は 0.0028 じゃなくて 0.0228 の間違い。
━━━━━━━━━━━━━━━
Excelスレで質問したのですがスレチと言われたのでここで質問させて下さい。
上の6つの問題を標準正規分布の数値表を用いずに、
Excelの関数で求めたいのですが関数式を教えていただければ幸いです。 >>696
これを見た統計学スレの方々が答えてくれたのかはわかりませんが、
このレスの後すぐに関数式を教えていただけました。ありがとうございました! >>696
Excelスレで質問?
数学板上のソフトスレは、以下しかない筈だが?
理工系分野手法操作も扱うExcelスレは、何処板に?
【R言語】統計解析フリーソフトR 第6章【GNU R】 [無断転載禁止]©2ch.net
http://rio2016.2ch.net/test/read.cgi/math/1501755792/
統計ソフトSTATAの部屋 Ver.2
https://rio2016.2ch.net/test/read.cgi/math/1284083650/
グラフから読み取る統計学の基本入門 [無断転載禁止]©2ch.net
http://rio2016.2ch.net/test/read.cgi/math/1497075809/ Zが標準正規分布に従う時、次の値を求めよ。
1:P{Z>u1}=0.05を満たすu1の値 → u1=1.645
2:P{Z<u2}=0.005を満たすu2の値 → u2=-2.576
3:P{-u3<Z<u3}=0.99を満たすu3の値 → u3=2.576
qnorm(0.05,lower.tail = FALSE)
qnorm(0.005,lower.tail= TRUE)
qnorm((1-0.99)/2,lower.tail=FALSE)
Xが正規分布N(10, 5^2)に従う時、次の確率を求めよ。
1:P{X>20} → 0.0228
2:P{X<5} → 0.1587
3:P{0<X<20} → 0.9544
1-pnorm(20,10,5)
pnorm(5,10,5)
pnorm(20,10,5)-pnorm(0,10,5) 散々ググってもわからなかったので、教えてください。
どこか間違ってるんだが、どこかわかりません。
検定の際にα=5% β=20%、右側検定(母集団の平均測定)として、
なぜ、確率の場合分けで足し合わせるように
H0となる確率=(1−α)/(1-α+β) H1となる確率=(1-β)/(1-β+α)
ではなく
いきなり、H0の第2種の過誤=β=20%、H1第1種の過誤=α=5%なのでしょう。
そもそもμ0とμが1:1の確率で起こる前提だと、確率の場合分けができますが、前提が違うのでしょうか。
H0ならば測定値xバーはZcrit 以下に95%分布している(はず)、よってH0をrejectできない。
でもそれが間違っている確率はβ=20%よ、というのがピンときません。。。 >間違っている確率はβ=20%よ
というのは正しくないよ。
棄却 棄却しない
H0 A B
H1 C D
α=A/(A+B)
β=D/(C+D)
β=D/(B+D)ではないよ。
ちなみに
A/(A+C)はFalse Positive Report ProvbabilityとかFalse Positive Rateとか呼ばれる 平均値と中央値の差の絶対値が標準偏差以下であることを示して欲しいです。よろしくお願いします。 >>688,692です。
https://i.imgur.com/KQMCk5P.png
質問に答えてくださった方々のお力で資格試験に無事合格できました。
このスレにいる統計学の専門者の方々から見たら、
「おいおいそんな見たことも聞いたことも無いうんちな資格取ってどーすんだ?w」と思われるかもしれませんが、
単に、お礼を伝えに来ただけなのです。ありがとうございました(、、 >>704
エクセル分析ベーシック?エクセル分析スペシャリスト?
無事合格おめでとうございます。
初めて聞く資格名です。
どの方面で有能な資格なのですか?
主催odysseyというのは、どういう組織なのですか?
https://stat.odyssey-com.co.jp/about/ NHKのこの「日本人の意識」調査のサンプルサイズn=5400は、
過剰で統計理論に背いているだろ?
1安倍ちゃん ★2019/01/10(木) 18:43:00.82ID:e4+I4ZlK9
・・・「日本人の意識」調査を、昭和48年から5年ごとに行っています。最新の調査は
去年6月から7月にかけて、全国の16歳以上の5400人を対象に個人面接法で実施し、
50.9%にあたる2751人から回答を得ました。
この中で、結婚についての考え方を尋ねたところ「必ずしも結婚する必要はない」と
答えた人は68%、「人は結婚するのが当たり前だ」と答えた人は27%・・・・
【NHK世論調査の異常な現実】本当にちゃんと選んでるのか?現状の生活満足が92%
http://asahi.5ch.net/test/read.cgi/newsplus/1547113380/ >>706
どちらにしても、アンケートを受けた本人が考えたというより、
親の考え方がそうだということにしかならんのだよな。
そう考えると、大人は理不尽だ。 統計先達方に質問。先般より騒動出来の厚労省「毎月勤労統計」不正問題だが、2004年
以前まで零細企業は抽出統計、大企業は全数統計と決められていた根拠は、何なのかな?
統計の考えに立脚すれば企業規模に関わらず標本抽出統計一本でよいのじゃないか?
【伝統】厚生労働省、勤労統計を正しく装うデータ改変ソフトまで作成していた事が判明 ★2
http://asahi.5ch.net/test/read.cgi/newsplus/1547255657/ 改変ソフトって、ほんとかね?割合を合わせてるだけじゃないの?
決まりはもちろん全数だけど、件数割合を全数に合わせているとしたら
計算結果はおおきく変わらないだろうね。
だとした場合
今までの報道では、件数も合わせずに、そのまま東京の分は1/3で計算
していたと報道していた。これの方が大間違いの報道ということに
なるのだが。 社会人でも通いやすい統計学の大学院てどこかありませんか デイトレやるようになって勉強し始めた
とりあえず2級が目標 ある私立医大の合格者の偏差値の平均値はm、標準偏差は10の正規分布であるとする。
合格者のうち成績上位70%は入学を辞退し下位30%の合格者が入学する。入学者の偏差値の平均値をmaとする。
m - maを算出せよ。
答はmの値によらないでいい? >>708
1 全件調査は法的に決まっていた
2 サンプル抽出なら、全体支払い料を算出する際に抽出率の逆数を乗じないといけない
3 上のミスをこっそり修正したので賃金の伸び率が不自然になった おまけに2004年からのデータ破棄してるって
紙のアンケートだか何か知らないがひどい >>718
じつは指摘されるのと類似した問題が一つの要因で
ただ、言われていることとちょっと異なるんだが
ソフト環境が進んで、さらに無償で利用できる関係で研究員によって
好みのツールを使うようになり、検証が不十分になってきているところが
今回の要因の一つにある。
便利さが生んだ問題と言ったらいいのか。 高度な統計解析が必要とされるわけではないので
言い換えれば、ツールオタクが生んでしまった問題の
一つと言えなくもない。
言語で結果が変わるわけじゃないんだから、
研究と業務という意識の切り分けができていなかった
といえるかも。 書くところがここしないので書かせていただきます
公的な統計の問題が毎日ニュースで流れていますけど、
賃金構造基本統計調査=> チンコウ
毎月勤労統計調査 => マイキン
と、統計の専門家が短縮してチンコウ、マイキンと
おっしゃっていますけど、俺が耳がすこし悪いので、
聞くたびに、チンコ、マンコと聞こえてしまいます。
お願いですから、他の短縮形を使ってください!
よろしくお願いします! 賃金構造基本統計調査=> 賃本
じゃあまずいかな?
どう発音してもいいけど すいません、質問です。
ttp://www.data-arts.jp/jssc/grade1semi/2016-06/2/q1/q.html
この問題の(3)の解答なのですが、なぜ自由度が9になるのでしょうか。11カテゴリで自由度10にならないのでしょうか。 相関係数について教えてください。
変数a={1,1,1,1,1,1,1,1,1,1}
変数b={1,1,1,1,1,1,1,1,1,1}
つまり2つの変数の値が全て同じだった場合に、
相関係数を計算すると計算不能になりますけど、
これは相関係数は1だと言っていいんでしょうか?
それとも計算不能でいいんでしょうか? 1でok
ていうか全く同じデータの相関係数求めてどうすんの 意味ないですよね?
よくよく考えてみると、
その意味ないことを
延々と証明してるキチガイ論文見つけたので
学会発表のときに
触れてやろうと思ってます >>733 に異を唱えてくれるステキな大人のひと、いないの? エンタングルメントみたいな非自明ながらも完全なる相関性とかもあるんだけどね。 >>735
そんな人は研究に忙しくて
5chみてるヒマないでしょ?
ここにくるのは初心者とカスとゴミですから >>732
相関係数の公式は知らんが、
0/0は、不定値である
そもそも、aもbも全部1とのことだが
より精密に測定すれば
0.982とか1.023の感じの測定値となる
有効数字1桁ではなく、せめて、
有効数字2~3桁となるよう再測定せよ
なお、相関K数は計算上不定だが
一般に相関K数は-1~+1に定まる 統計学で大学院に行って学びたいと思うけど、修論がまったく思い描けない。
既にある問題解析なら、本を買ってやればよいと思う。
統計学の修士論文って、どんなレベルなんですか? 学部なんだろ、当たり前だろ、馬鹿か
>修論がまったく思い描けない 修論のテーマなんて教授から与えられるものじゃないの 昨今AIと呼ばれているものは統計学のごく一部を応用してるにすぎないし応用と呼べるレベルにすら達していないものも多い
つまり統計学なくして理論面でのAIの発展などあり得ない >>749
禿同
その基本的なことさえ
全く分かってない機械学を
Pythonでやってるママゴトでも
高い給料もらえるという
データサイエンティストバブル! >>748
残念ながら今のところ
統計学≒AI
なのよ
よろしくね! ■ このスレッドは過去ログ倉庫に格納されています