統計学Part17 [無断転載禁止]©2ch.net

1132人目の素数さん2016/11/11(金) 02:34:18.63ID:4ofrRMLG

621◆2VB8wsVUoo 2018/04/07(土) 11:33:11.36ID:yx+HETs3

622◆2VB8wsVUoo 2018/04/07(土) 11:33:32.71ID:yx+HETs3

623◆2VB8wsVUoo 2018/04/07(土) 11:33:55.94ID:yx+HETs3

624◆2VB8wsVUoo 2018/04/07(土) 11:34:18.46ID:yx+HETs3

625◆2VB8wsVUoo 2018/04/07(土) 11:34:43.80ID:yx+HETs3

626◆2VB8wsVUoo 2018/04/07(土) 11:35:04.81ID:yx+HETs3

627◆2VB8wsVUoo 2018/04/07(土) 11:35:39.61ID:yx+HETs3

628132人目の素数さん2018/04/13(金) 19:25:25.97ID:DJOFUmPK
ここの住人は標本数と標本の大きさの誤用についてどう思っているのか聞きたい。

629132人目の素数さん2018/04/13(金) 21:59:46.38ID:A3EEexMu
>>628
言葉遊びだと思うけど、
こだわる椰子がいるから俺はサンプルサイズと言ってる。

630MC 火照る BACKESS INN SECRARETALY2018/04/24(火) 18:28:27.51ID:AQvWaaW1
統計三世ぐらいかな?

631132人目の素数さん2018/04/26(木) 16:28:34.37ID:O7d38XWC
>>629
英語じゃないと駄目な言葉多いな

632132人目の素数さん2018/04/26(木) 18:20:10.78ID:8EF8msBO
英語で混同してるなら元々の用語に問題があるんだよ。
単位系が定義変更してるのだから用語変更もすべき

633◆2VB8wsVUoo 2018/04/27(金) 01:08:09.69ID:HEiX2WEB

634◆2VB8wsVUoo 2018/04/27(金) 01:08:28.01ID:HEiX2WEB

635◆2VB8wsVUoo 2018/04/27(金) 01:08:46.88ID:HEiX2WEB

636◆2VB8wsVUoo 2018/04/27(金) 01:09:07.26ID:HEiX2WEB

637◆2VB8wsVUoo 2018/04/27(金) 01:09:30.10ID:HEiX2WEB

638◆2VB8wsVUoo 2018/04/27(金) 01:09:48.02ID:HEiX2WEB

639◆2VB8wsVUoo 2018/04/27(金) 01:10:04.34ID:HEiX2WEB

640◆2VB8wsVUoo 2018/04/27(金) 01:10:25.34ID:HEiX2WEB

641◆2VB8wsVUoo 2018/04/27(金) 01:10:47.20ID:HEiX2WEB

642◆2VB8wsVUoo 2018/04/27(金) 01:11:07.88ID:HEiX2WEB

643132人目の素数さん2018/05/30(水) 13:02:27.74ID:zhXCcFtY
Excelのマクロで統計関係の自作関数作って公開している人知っている?
わざわざRに取り込んだりするのめんどい

644132人目の素数さん2018/05/30(水) 15:46:15.18ID:pDBXC67r
EXCELは結果怪しいことが結構ある

645132人目の素数さん2018/05/30(水) 22:59:00.46ID:fLd3NENr
エクセルのソルバーは信用してないな。

6466432018/05/30(水) 23:16:31.14ID:RVrncVse
うん、分析ツールは良くないっていう話はよく聞くよね。

俺の妄想は、Excelシート上のA列にN数、B列に陽性数が入っているとして
C列に

=confint(A1,B1,0.95,"wald")

みたいにすると、簡単に信頼区間が得られるようなユーザ定義関数。

あ、RExcelがあるか

647132人目の素数さん2018/05/31(木) 00:11:02.18ID:aIE/YYKp
RExcelってまだあんの?

648132人目の素数さん2018/05/31(木) 10:56:29.42ID:pzVdBp0Y
>>646
Rの方が面倒くさくないよ。
パッケージbinomを使えば

A=c(1,2,3)
N=c(5,6,7)
for(i in 1:length(A))
print(binom::binom.confint(A[i],N[i],conf=0.95))
で一気に様々な信頼区間が表示される。

http://imagizer.imageshack.com/img921/964/oNNsrh.jpg

6496432018/05/31(木) 19:48:49.58ID:ScaGZZYq
>>648
便利そうなパッケージ、教えてくれてありがとう。
俺の説明不足だったんだけど、
そのRのコンソールに出力されたテキストを結局また元のExcelへコピペして、
「区切り位置」とかでパースしたりいろいろして表の体裁に仕上げる、
という作業に、何となく徒労感があるんだ。

ちなみにExcelに戻すのは、色つけろ枠つけろみたいな要求に
R で対応するスキルが足りないから。
knit とか覚えればいいのかな。

>>647
http://sunsite.univie.ac.at/rcom/
開発は続いているよう。

650132人目の素数さん2018/05/31(木) 20:18:19.79ID:yx7icnTY
>>649
情報ありがとう。

以前、インストールでめちゃくちゃ苦労して、パソコン変わった際にはインストールする気が起きなかった記憶がある。それ以来、ご無沙汰してるわ

6516432018/06/01(金) 07:34:41.66ID:habNwJja
それな。
俺も昔苦労して最終的に入るには入ったんだけど、
Excelが全体的に重くなってしまうのがストレスで、あまりいい思い出がない。
今のPCはメモリたくさん積んでるから当時よりはましかもしれない。

統計学らしくない話を振ってしまってすまなかった。名無しに戻ります。

652132人目の素数さん2018/06/01(金) 09:36:03.25ID:SQks1NC+

653132人目の素数さん2018/06/20(水) 19:27:08.42ID:I5gINDgV
既存の評価指標Aが0〜10までしか計測できないところを
0〜50まで図れる新規の評価指標Bを作りました。

信頼性と妥当性を検証したいんですけど、
信頼性は級内相関でいいとして、妥当性はどう検証すればいいでしょう?
BはAを内包している関係なので、相関係数が高くて収束的妥当性があってもよくないし
低くて弁別性があってもよくないと思うんです。

BがAを内包していますみたいなことを検証する統計ってあるんですか?

654132人目の素数さん2018/06/21(木) 13:56:27.00ID:Ze2kEGUX
>>628
今読んでる本(国立大の統計学の教授が翻訳)には
サンプルサイズのことを標本数と表現してあったので調べたが
読者等の混乱を避けるためにサンプルサイズ(標本の大きさ)と標本数は使い分けたほうがいいということらしい。

実際いま本読ん出る時に、どっちのことか混乱することがあるので
読者がいるようなものは使い分けたほうがいいとおもうわ。

655132人目の素数さん2018/06/22(金) 03:49:34.67ID:karFMQ6d
>>653
階層クラスター分析?

656132人目の素数さん2018/08/26(日) 14:42:57.20ID:6vST7ijX
>>646
>うん、分析ツールは良くないっていう話はよく聞く・・・・・・・・・・・・
良くないというのは、Excelのどのバージョンのどのサブメニューのことなのか?
良くないというのは、分析結果の精度が粗い?分析結果が間違っている?

それとも、うん、>>646>>645を受けたレスということは、分析ツールとは別メニューの
Excelのソルバー>>645が、良くないという趣旨なのか?
ソルバーが良くないというのは、他の統計ツールと分析結果が相異するからなの?

657132人目の素数さん2018/09/02(日) 20:48:29.11ID:Ez5w7m9A
自由度の求め方について教えてください。
2グループについて、それぞれ平均値、標準偏差、n数がわかっています。
各グループでn数は違います
個々のデータは分かりません。分散が等しくないt検定(ウェルチのt検定)
をしようと思います。t値は求められるのですが、自由度も求め方がわから
ないので、有意水準5%で有意かどうかが判断できません。自由度の算出
方法を教えていただけないでしょうか。

658132人目の素数さん2018/09/05(水) 13:20:42.31ID:tS2KOPjG
定義読めば?

659132人目の素数さん2018/09/08(土) 13:11:44.95ID:WFiBaON4
>>657

# t検定(生データなし,等分散不問)
Welch.test=function(n1,n2,m1,m2,sd1,sd2){
T=(m1-m2)/sqrt(sd1^2/n1+sd2^2/n2)
df=(sd1^2/n1+sd2^2/n2)^2 / (sd1^4/n1^2/(n1-1)+sd2^4/n2^2/(n2-1))
p.value=2*pt(abs(T),df,lower.tail = FALSE)
return(p.value)
}

660132人目の素数さん2018/09/08(土) 13:21:23.26ID:WFiBaON4
標本数n 平均m 標準偏差sdの正規分布するシミュレーションデータを作ってWelchの検定をすることもできる。

Rが使えるなら

scale(rnorm(n))*sd + m

で可能。

これを各グループで作って検定する方法もある。

>659の結果と一致するはず。

661132人目の素数さん2018/09/16(日) 21:33:48.81ID:rMRDGQ30
統計学と並行して高校数学からやり直してるんだけど、微分積分さえある程度できれば解析学までやる必要はないってホント?
むしろその時間で線形代数やったほうが良いってのもホント?

662132人目の素数さん2018/09/19(水) 00:33:36.01ID:2tFRgvax
合成関数の微分とか全微分とかあたりまでは統計でも必須

663132人目の素数さん2018/09/19(水) 12:00:34.51ID:P3TgEiwp
ほ〜そういうものか。ありがとう

664学術2018/09/19(水) 12:03:01.01ID:KX539Fwk
統計三世。ルパンナポレオンより最強の(血)統系。

665132人目の素数さん2018/10/14(日) 16:10:05.84ID:tYo68Cmn
3個中1個が当たりのものがある。これを被験者6人中5人が当たりを引いた。
このとき、被験者は有意水準1%で当たりがわかるとは言えないが、有意水準5%で当たりがわかると言える。
ただし(1/3)^6=0.0014とする。

これ6C5*(1/3)^6+6C6*(1/3)^6=0.0096で1%を下回るんじゃないの?
納得できないんだけど教えて偉い人

666学術2018/10/14(日) 19:03:49.48ID:yXYU+8iI
確率を検証して当たる確率出すなんてナンセンスだよね。賭け事は進んでいて
意外性が在る乱数になるから、何か見えないものが働いていることが数学ではよくわからない。そしてタロットも然り。同じ確率なんだけど、
運命を感じるというのも変な話で。矛盾しているよね。気持ちと心が。

667132人目の素数さん2018/10/22(月) 11:52:44.19ID:1/aHuqXD
練習問題の解法を教えてください。基本統計学第4版(有斐閣)の6章の問題です。

41)1つのサイコロを1,000回投げたとき、1の目が180回以上出る確率と、1の目が140回以上200回以下出る確率を求めよ。
本の答えは、0.1379と0.9875です。以下のように計算してるのですが、答えがあいません。

前段の問題
n=1000,p=1/6の2項分布を正規分布で近似して求めた。μ=1000*1/6、σ^2=1000*1/6*5/6としてN(1000/6, 5000/36)を使う
(180−1000/6)/(sqrt(5000)/6)=80/sqrt(5000)=1.1313 −>正規分布の上側確率表より【0.12924】

後段の問題
Pr(140≦x≦200)で計算する
(140−1000/6)/(sqrt(5000)/6)=−160/sqrt(5000)=−2.2627 −>正規分布の上側確率表より0.011911
(200−1000/6)/(sqrt(5000)/6)=200/sqrt(5000)=2.828 −>正規分布の上側確率表より0.0023274
1−0.011911−0.0023274=【0.9857】

【】が自分で計算した答えです。計算式のどこかで間違えているのはずなのですが、自分では気付くことができません。
よろしくお願いします。

668132人目の素数さん2018/10/22(月) 15:38:07.09ID:TgBnmqGr
z=(179.5-1000/6)/sqrt(5000/36)=1.08894...→1.09
z=1.09に対する分布表の値は.3621なので、0.5からこれを引いて0.1379

z1=(200.5-1000/6)/sqrt(5000/36)=2.87085...→z=2.87
z=2.87 に対する分布表の値は 0.4979
z2=(139.5-1000/6)/sqrt(5000/36)=-2.30517...→z=2.31
z=2.31 に対する分布表の値は 0.4896
これらの和は0.9875

「180回以上出る確率」の相反事象は「179回以下出る確率」なので、
179.5を境界にするのが妥当だということと、教わった手順に従って、
「適当」な場面で四捨五入を行い、数表を用いると、
テキスト通りの値に行き着くようです。

669132人目の素数さん2018/10/23(火) 13:31:34.14ID:CdMSDP6/
ありがとうございました。離散数値での確率密度関数の使い方がわかりました。

670132人目の素数さん2018/10/30(火) 21:09:05.91ID:rPxKt/Y8
ちょいとすみません。わからないところがあってここにたどり着いたズブの素人なのですが、よければ教えてください。
標準偏差て平均が基準値なんですよね?
平均じゃなくて、ある値(カットオフ値)を基準にしてそこからバラつきがどんなものか調べたい時は、計算方法は標準偏差と同じで平均値をカットオフ値に置き換えたらいいのでしょうか?
ネットで調べても平均値で計算、ばかりでわからなかったです

671132人目の素数さん2018/11/20(火) 22:09:26.70ID:cFR1wwH3
Wolframに入力してみました。

https://www.wolframalpha.com/input/?i=sum%5Bchoose(1000,n)*1%2F6%5En*(5%2F6)%5E(1000-n),+n+%3D+180+to+1000%5D
sum[choose(1000,n)*1/6^n*(5/6)^(1000-n), n = 180 to 1000]
sum_(n=180)^1000 ((5/6)^(1000 - n) binomial(1000, n))/6^n
=0.138430864995663940543635063874277127250218037792364115557...

https://www.wolframalpha.com/input/?i=sum%5Bchoose(1000,n)*1%2F6%5En*(5%2F6)%5E(1000-n),+n+%3D+140+to+200%5D
sum[choose(1000,n)*1/6^n*(5/6)^(1000-n), n = 140 to 200]
sum_(n=140)^200 ((5/6)^(1000 - n) binomial(1000, n))/6^n =
=0.988113644388740861240108592472945211524447200450991732557...

新着レスの表示
レスを投稿する