統計学Part17 [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
つまり文系に必要だから、理系の必須事項はどんどん高3に回してゆこう
ということか。
残念ながら理系の高3の多くは
・高1〜2で学んだ事を入試問題が解けるレベルまで引き上げること
・新たに数IIIの微積分を学習し、更に入試問題が解けるレベルまで引き上げること
で手一杯で、微積分以外で新たに学ぶ項目はとても定着が悪い。
例えば複素平面は今数IIIだが、数Bにあった頃に比べて、とても出来が悪い。
なので「理系だけがやればいい」とか言ってベクトルや空間座標を
3年に回してしまうと、理系の学生は大学に入ってからの線形代数に
ついて行けなくなる危険がある。
一方、大学の理系の統計では、線形代数の知識も要求される。
教える順序が間違っていると思うなあ。 あと、文系であっても経済学部だと線形代数は要求される。
2〜3次元の幾何ベクトルがシッカリ身に付いていないと
n次元の線形代数の理解はとても貧弱になると思うがどうだろうか。
それよりも高校生の段階で統計を学んでおく事の方が重要なんだろうか。 やっぱり別スレの方が良さそうだが
その前に統計スレで煽っておこうw 統計学の端緒に触れるのに果たして幾何ベクトルの理解が必要なのかね
単なる数の並びで十分な気がする
しかも高校の学習内容に理論的な完全さは端から求められていないだろうし 理系以外の教養の底上げが狙いだとすると、日本の科学技術の基礎力という観点だけでは是非を問えないね
統計学は科学技術の担い手だけのものではないので 数学の項目を削って統計を入れるという発想がおかしい >>595
> 統計学の端緒に触れるのに果たして幾何ベクトルの理解が必要なのかね
そのような主張はしていませんが? 科学技術の基礎力という観点だけでは是非を問えないと言ったろ
まず議論の出発点を見直さなきゃ 理系はどうせ数IIIやるんだから問題なくないですか? このへんなんだろう(適当)
生徒が数学が社会に出ていないと感じていること
企業からの要望
応用重視へ そうですね。統計は科学技術以外でも重要です。しかし
その普及のために科学技術者の養成を疎かにして良いこと
にはなりません。
文系の大学で統計を必須にしたって良いわけです。
ただでさえ理系と文系では大学で要求される時間数が
全然違うのだから、文系に統計が入ったくらいで
理系よりも時間数が多くなることはないでしょう。
あるいは高3の文系で統計を必須にするという選択肢もある。
あるいは高校で文理に分かれる時期を今よりも早めるとか、
学年に縛られず統計は2年で3年でも取れるようにするとか、
理系を犠牲にせずに文系に統計を教える方法はいくらでもある。 本当に問題だと思うならこんなとこに書き込んでないで行動を起こしたら 統計学必修化するなら統計詐欺の代表的手法も紹介しとかないとマズイ
生兵法が一番危険だからね
ますます数学からかけ離れちゃうけど 是非はともかくとして、大学ではなく高校で学習することには大いに意味があると思うよ
大学受験に必要となれば皆が真面目に勉強する
受験生の真面目さと大学生の不真面目さを対照すれば、これがどれほど重大な差かわかると思う ベクトルは数学のあらゆる分野の土台となる。
統計学も進んだ理論にはベクトルの理解は不可欠。
逆に統計学は数学の各分野の土台となるだろうか。
だから
ベクトルを犠牲にしてでも統計をやらねば!!!!!!! 株価でも為替でもいいのですが、値動きのチャートが
ブラウン運動(ランダム)に沿っているのかどうかを
判定することは可能ですか? >>576 〜>>581あたりがヒントになりそうだね。ありがとう。 ここの住人は標本数と標本の大きさの誤用についてどう思っているのか聞きたい。 >>628
言葉遊びだと思うけど、
こだわる椰子がいるから俺はサンプルサイズと言ってる。 英語で混同してるなら元々の用語に問題があるんだよ。
単位系が定義変更してるのだから用語変更もすべき Excelのマクロで統計関係の自作関数作って公開している人知っている?
わざわざRに取り込んだりするのめんどい うん、分析ツールは良くないっていう話はよく聞くよね。
俺の妄想は、Excelシート上のA列にN数、B列に陽性数が入っているとして
C列に
=confint(A1,B1,0.95,"wald")
みたいにすると、簡単に信頼区間が得られるようなユーザ定義関数。
あ、RExcelがあるか >>646
Rの方が面倒くさくないよ。
パッケージbinomを使えば
A=c(1,2,3)
N=c(5,6,7)
for(i in 1:length(A))
print(binom::binom.confint(A[i],N[i],conf=0.95))
で一気に様々な信頼区間が表示される。
http://imagizer.imageshack.com/img921/964/oNNsrh.jpg >>648
便利そうなパッケージ、教えてくれてありがとう。
俺の説明不足だったんだけど、
そのRのコンソールに出力されたテキストを結局また元のExcelへコピペして、
「区切り位置」とかでパースしたりいろいろして表の体裁に仕上げる、
という作業に、何となく徒労感があるんだ。
ちなみにExcelに戻すのは、色つけろ枠つけろみたいな要求に
R で対応するスキルが足りないから。
knit とか覚えればいいのかな。
>>647
http://sunsite.univie.ac.at/rcom/
開発は続いているよう。 >>649
情報ありがとう。
以前、インストールでめちゃくちゃ苦労して、パソコン変わった際にはインストールする気が起きなかった記憶がある。それ以来、ご無沙汰してるわ それな。
俺も昔苦労して最終的に入るには入ったんだけど、
Excelが全体的に重くなってしまうのがストレスで、あまりいい思い出がない。
今のPCはメモリたくさん積んでるから当時よりはましかもしれない。
統計学らしくない話を振ってしまってすまなかった。名無しに戻ります。 既存の評価指標Aが0〜10までしか計測できないところを
0〜50まで図れる新規の評価指標Bを作りました。
信頼性と妥当性を検証したいんですけど、
信頼性は級内相関でいいとして、妥当性はどう検証すればいいでしょう?
BはAを内包している関係なので、相関係数が高くて収束的妥当性があってもよくないし
低くて弁別性があってもよくないと思うんです。
BがAを内包していますみたいなことを検証する統計ってあるんですか? >>628
今読んでる本(国立大の統計学の教授が翻訳)には
サンプルサイズのことを標本数と表現してあったので調べたが
読者等の混乱を避けるためにサンプルサイズ(標本の大きさ)と標本数は使い分けたほうがいいということらしい。
実際いま本読ん出る時に、どっちのことか混乱することがあるので
読者がいるようなものは使い分けたほうがいいとおもうわ。 >>646
>うん、分析ツールは良くないっていう話はよく聞く・・・・・・・・・・・・
良くないというのは、Excelのどのバージョンのどのサブメニューのことなのか?
良くないというのは、分析結果の精度が粗い?分析結果が間違っている?
それとも、うん、>>646と>>645を受けたレスということは、分析ツールとは別メニューの
Excelのソルバー>>645が、良くないという趣旨なのか?
ソルバーが良くないというのは、他の統計ツールと分析結果が相異するからなの? 自由度の求め方について教えてください。
2グループについて、それぞれ平均値、標準偏差、n数がわかっています。
各グループでn数は違います
個々のデータは分かりません。分散が等しくないt検定(ウェルチのt検定)
をしようと思います。t値は求められるのですが、自由度も求め方がわから
ないので、有意水準5%で有意かどうかが判断できません。自由度の算出
方法を教えていただけないでしょうか。 >>657
# t検定(生データなし,等分散不問)
Welch.test=function(n1,n2,m1,m2,sd1,sd2){
T=(m1-m2)/sqrt(sd1^2/n1+sd2^2/n2)
df=(sd1^2/n1+sd2^2/n2)^2 / (sd1^4/n1^2/(n1-1)+sd2^4/n2^2/(n2-1))
p.value=2*pt(abs(T),df,lower.tail = FALSE)
return(p.value)
} 標本数n 平均m 標準偏差sdの正規分布するシミュレーションデータを作ってWelchの検定をすることもできる。
Rが使えるなら
scale(rnorm(n))*sd + m
で可能。
これを各グループで作って検定する方法もある。
>659の結果と一致するはず。 統計学と並行して高校数学からやり直してるんだけど、微分積分さえある程度できれば解析学までやる必要はないってホント?
むしろその時間で線形代数やったほうが良いってのもホント? 合成関数の微分とか全微分とかあたりまでは統計でも必須 3個中1個が当たりのものがある。これを被験者6人中5人が当たりを引いた。
このとき、被験者は有意水準1%で当たりがわかるとは言えないが、有意水準5%で当たりがわかると言える。
ただし(1/3)^6=0.0014とする。
これ6C5*(1/3)^6+6C6*(1/3)^6=0.0096で1%を下回るんじゃないの?
納得できないんだけど教えて偉い人 確率を検証して当たる確率出すなんてナンセンスだよね。賭け事は進んでいて
意外性が在る乱数になるから、何か見えないものが働いていることが数学ではよくわからない。そしてタロットも然り。同じ確率なんだけど、
運命を感じるというのも変な話で。矛盾しているよね。気持ちと心が。 練習問題の解法を教えてください。基本統計学第4版(有斐閣)の6章の問題です。
41)1つのサイコロを1,000回投げたとき、1の目が180回以上出る確率と、1の目が140回以上200回以下出る確率を求めよ。
本の答えは、0.1379と0.9875です。以下のように計算してるのですが、答えがあいません。
前段の問題
n=1000,p=1/6の2項分布を正規分布で近似して求めた。μ=1000*1/6、σ^2=1000*1/6*5/6としてN(1000/6, 5000/36)を使う
(180−1000/6)/(sqrt(5000)/6)=80/sqrt(5000)=1.1313 −>正規分布の上側確率表より【0.12924】
後段の問題
Pr(140≦x≦200)で計算する
(140−1000/6)/(sqrt(5000)/6)=−160/sqrt(5000)=−2.2627 −>正規分布の上側確率表より0.011911
(200−1000/6)/(sqrt(5000)/6)=200/sqrt(5000)=2.828 −>正規分布の上側確率表より0.0023274
1−0.011911−0.0023274=【0.9857】
【】が自分で計算した答えです。計算式のどこかで間違えているのはずなのですが、自分では気付くことができません。
よろしくお願いします。 z=(179.5-1000/6)/sqrt(5000/36)=1.08894...→1.09
z=1.09に対する分布表の値は.3621なので、0.5からこれを引いて0.1379
z1=(200.5-1000/6)/sqrt(5000/36)=2.87085...→z=2.87
z=2.87 に対する分布表の値は 0.4979
z2=(139.5-1000/6)/sqrt(5000/36)=-2.30517...→z=2.31
z=2.31 に対する分布表の値は 0.4896
これらの和は0.9875
「180回以上出る確率」の相反事象は「179回以下出る確率」なので、
179.5を境界にするのが妥当だということと、教わった手順に従って、
「適当」な場面で四捨五入を行い、数表を用いると、
テキスト通りの値に行き着くようです。 ありがとうございました。離散数値での確率密度関数の使い方がわかりました。 ちょいとすみません。わからないところがあってここにたどり着いたズブの素人なのですが、よければ教えてください。
標準偏差て平均が基準値なんですよね?
平均じゃなくて、ある値(カットオフ値)を基準にしてそこからバラつきがどんなものか調べたい時は、計算方法は標準偏差と同じで平均値をカットオフ値に置き換えたらいいのでしょうか?
ネットで調べても平均値で計算、ばかりでわからなかったです Wolframに入力してみました。
https://www.wolframalpha.com/input/?i=sum%5Bchoose(1000,n)*1%2F6%5En*(5%2F6)%5E(1000-n),+n+%3D+180+to+1000%5D
sum[choose(1000,n)*1/6^n*(5/6)^(1000-n), n = 180 to 1000]
sum_(n=180)^1000 ((5/6)^(1000 - n) binomial(1000, n))/6^n
=0.138430864995663940543635063874277127250218037792364115557...
https://www.wolframalpha.com/input/?i=sum%5Bchoose(1000,n)*1%2F6%5En*(5%2F6)%5E(1000-n),+n+%3D+140+to+200%5D
sum[choose(1000,n)*1/6^n*(5/6)^(1000-n), n = 140 to 200]
sum_(n=140)^200 ((5/6)^(1000 - n) binomial(1000, n))/6^n =
=0.988113644388740861240108592472945211524447200450991732557... 重回帰分析で交互作用を検討?交互作用が予想される問題に
適用すべきは、実験計画法(分散分析)ではないのか?
重回帰分析で交互作用を検討する Posted on 2014年1月31日
http://norimune.net/1733 この名大のように先端医療開発部門に生物統計とバイオインフォマティクスを
抱える統計解析室という組織があるのは、他所のの医学部でも通常なのかな?
医学部で生物統計というと新薬の薬効の統計的検定ということか?
また統計解析室長を木下文恵某とかいう若手の助教が担うのも通常なのかな?
名古屋大学医学部附属病院 先端医療開発部 先端医療・臨床研究支援センターの体制
統計解析室−−生物統計・バイオインフォマティクス
http://www.nu-camcr.org/cms/center_index/center_staff/ 例えば、母集団から50枚の答案用紙を選んで、平均が
60点だとする。母集団は2500枚の答案用紙から成り立っているとして、平均は70点とする。このとき50枚の答案用紙をランダムに選んだかの検定はどの
ようにすればいいでしょうか。(つまり60点の平均点が低いので、ランダムに選んだかどうかを疑っているわけです。) >>646
EXCELの分析ツールは良くないというのは、統計専用ソフトと
出力値が合わないからですか?
お薦めの統計専用ソフトは、どれどれですか? 方程式に代入する速度はパソコンじゃ無理なんだろうか?そうでもないらしいね。 こんなグラフの2つの系列に対する有意差検定ってどうすればいいでしょうか。
ttps://benesse.jp/teikitest/_resource/img/kou/science/k_sc_619_6.png
実際には2つの系列はそれぞれ複数の結果があります。 >>676
母集団のバラツキが大きいならランダムに選んだと言えるかもね。
母集団の分布をどう仮定するかによるんじゃね。 >>676
母集団は正規分布としてシミュレーションしてみた。
母分散が43点程度であれば標本平均が60点以下になる確率が5%を越える。
> f= function(sig){
+ x=scale(rnorm(2500))*sig + 70
+ mean(replicate(1e3,mean(sample(x,50)))<=60)
+ }
> f=Vectorize(f)
> f(1:100)
[1] 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000
[13] 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.001
[25] 0.002 0.002 0.003 0.003 0.005 0.006 0.010 0.018 0.017 0.017 0.013 0.021
[37] 0.029 0.026 0.029 0.041 0.035 0.037 0.057 0.054 0.058 0.076 0.059 0.060
[49] 0.063 0.068 0.080 0.074 0.077 0.086 0.098 0.092 0.114 0.096 0.110 0.098
[61] 0.115 0.115 0.133 0.122 0.141 0.118 0.139 0.157 0.170 0.153 0.182 0.165
[73] 0.171 0.154 0.167 0.175 0.163 0.174 0.178 0.174 0.196 0.205 0.204 0.211
[85] 0.206 0.205 0.217 0.212 0.235 0.218 0.189 0.230 0.232 0.215 0.221 0.246
[97] 0.217 0.228 0.216 0.248
> >>679
同一濃度での反応速度データがあるならpaired t-test で検定できるのでは。 >>665
6C5*(1/3)^5*(2/3)+6C6*(1/3)^6= 0.01783265 >>682
x軸の値を実験の設定値にすれば同一ですが、測定値で補正してるので厳密には同一になりません。
散布図のプロットを繋いだような系列では難しいですね。
もしx軸を設定値としてpaired t-testする場合、レプリケートの扱いは各測点で平均化すればいいでしょうか。
それとも検定結果を平均化する方法が有るのでしょうか。 >>681
訂正
×母分散が43点程度
○ 母集団の標準偏差が43点程度 >>684
阻害剤の添加による反応速度の変化=0が帰無仮説の検定
なので両端のデータが多いと有意差なしになるだろうね。
この例での有意差検定の意味がわからなくなってきた。 >>686
専用の検定が無いとなると確かに両端に影響されますね。
有意差の数値化は諦めてグラフから説明するしかないかもしれませんね。 https://i.imgur.com/BHgxjYD.png
帰無仮説、対立仮説に関する質問です。
・3つのグループの標本は同じ母集団から得られたものである。○か×か?
どちらなんでしょう。
初学者なため、自分でも何を言いたい質問なのか分かりませんが、お答えいただければ幸いです。 ■ このスレッドは過去ログ倉庫に格納されています