統計学Part16
レス数が1000を超えています。これ以上書き込みはできません。
統計検定HPの2級の過去問の問11[1]の解答が2番になってるけど3番の間違いではないか?
これどなたか教えてください! いやいや説明できるなら説明すればする終わる話題だろ
説明できないで逃げようとするからいつまでも追いかけられるんだよ ある組立工場では,作業内事故の低減に努めている。この工場の 2 つの部署でそ
れぞれ起こった 1 日あたりの事故数 y について 200 日間記録した。この期間内で
の,部署 A の事故数の平均 y ̄A は 11.8 件,標準偏差 sA は 2.4 件であり,部署 B
の事故数の平均 y ̄B は 8.1 件,標準偏差 sB は 2.0 件であった。労務担当者は,これ
ら 2 つの部署間で事故数に違いがあるかどうか検討することにした。ただし,事故
数は部署ごと,日ごとに独立であり,母分散が等しいと仮定して有意水準 5% で評
価するものとする。
〔1〕まず,2 つの部署の事故数の合成した分散 s^2 を,2 つの部署の標準偏差 sA,sB
から求める。その s^2 の式として正しいものはどれか。次の 1 〜 5 のうちから
適切なものを一つ選べ。 >>11
s^2=[(200-1)sA^2+(200-1)sB^2]/(200+200-2)=[sA^2+sB^2]/2 線形結合して共分散が0で
s^2=sA^2+sB^2
じゃ無いの? >>14
合成と合計がごっちゃになっている、ようするにt検定をやろうとしていることを留意しよう
>>14は分散の合計で、(A,B二部署からなる)工場で起こる事故数の分散だ
求めたいのは1部署で起こる事故数の分散の推定値
ただ[1]だけだと>>14になるようにも読めるので、選択肢に>>14が無いんだと思う
試験勉強してる人なら2群の平均の差のt検定の式で即座に>>12が思い浮かぶはず >>15
母分散が等しいと仮定しているから
母分散の点推定値として分散の平均を使うってこと? そうか、統計検定2級程度も受かるか怪しい奴らが
このスレにたくさんいるってことだな。 その発言は逆に君の馬鹿さを露わにするぞ
ここに書き込むために有形無形を問わず何か関門でもあったか? >>16 も >>17も
計算は同じだな
解釈の仕方が違うだけで >>19
そうか、馬鹿はそういう発想をして自分を慰めるんだな。 等分散仮定下での合併分散の式がなんで↓になるのかなんて、正直考えたこともなかった
{ (m-1)Va + (n-1)Vb } / (m+n-2)
誰か賢い人教えてor良い参考資料紹介してくだせー >>21
>>19を統計検定2級程度も受かるか怪しい奴と決めつけることで自分を慰めている、と受け取れる >>23
そうか、馬鹿はそういう受け取り方をするんだな。 >>24
ごめんな、確かに>>19の人は言い過ぎだった、許してやって 各群からの推定母平均(μa, μb), プールデータからの推定母平均(μe)
>>22式から、
Σ{(ai -μa)^2} + Σ{(bi - μb)^2} = Σ{(ai -μe)^2} + Σ{(bi - μe)^2}
が導かれるけど、計算したら左から右になるんで?
それともμa = μb = μe を仮定? 統計検定の過去問の質問をした者だが
俺のおかげでスレが盛り上がってよかったね >>25
そうか、ごめんな、馬鹿よばわりして。
正直者なんで本音がでちゃった。
ちなみにこのスレの半分は俺が書き込んでるのでよろしくw 結論としては
統計検定2級すら受からない馬鹿が
このスレに大勢いるということですか? >>29
相変らず性格悪いですね。偏差値70超えてますよ。 >>26
標本集合A+標本集合Bを標本集合C
と考えたら
(ai-μa)^2+(bi-μb)^2=(ci-μc)^2
じゃね?
sA^2がna度数、sB^2がnb度数観測された
と考えたら
(na*sA^2+nb*sB^2)/(na+nb) >>31
上の方は一般には成り立たないかも
例えばAとBが左右に離れていた場合
Cの値は大きな値になりそう 統計学がブームとかすごいステマ臭がするんだけど
こんなのやって一体何の役に立つんだ? 正規分布でない(ピークが無いフラットな)標本で、
「母集団と個体の関係、個体間の相対関係」に絞り適当に把握したい場合
(他グループとの比較やパーセンタイルは除外)、
学力の偏差値計算を用いた場合の問題点を教えてください。 >>26
t分布を使って母平均の差を検定するから
帰無仮説として母平均の差=0を置く
そうした帰無仮説の元で計算した値と
標本から計算した値を比較する
そしてt分布で有意水準以下の確率だったら帰無仮説を棄却する >>36
補足
だからμa=μb=μeは帰無仮説を数式で表したもの Aさん、Bさん、Cさんの3人のテストの得点が
平均 ua, ub, uc
標準偏差 σa, σb, σc
の正規分布となる場合、Aさんが3人の中で一番点数が高い確率は? >>39
NB>NC ∩ NA>NB の確率と
NC>NB ∩ NA>NC の確率との和
共分散が判らないから計算できなくね? >>36-37
なるほど、すっきりしました
どうもありがとうございます 統計検定2級って言ったらスゲーじゃん!誰でもホイホイ撮れるもんじゃねぇやん 2級の合格率見たら47.87 %だった。
おれの持ってる資格は合格率数%のものばかりなんでたぶんすごくないと思う。 過去問見る限り2級はヘボい
1級と2級の差は相当ある、英検とかと一緒だな
2級落ちてるやつは強制受験か棚ボタ狙いだろ
ちゃんと勉強したのに2級落ちるやつは残念ながら相当頭弱い おれもここで初めて存在を知ったし、受験地も東京と大阪だけだし、
受験者数も1000人程度と少ないし、一体誰が受けているんだろう? >>46
相当、統計に自信がある強者ばかりが受験している最高峰の試験だよ。俺はかなり出来る方だけど、まだ3級挑戦中 >>48
その割には半端なく合格率高いし、問題が簡単ですねw 実地で統計使ったことある人なら2級まではカスみたいなもんだろ
座学オンリーの奴には難しいのかもしれん 子どもの勉強と違って「わからないことがあったら質問できる人」が
存在するかどうかがとても大きい。 大学受験合格率
A判定 80%
B判定 65%
10000人のA判定の人間が試験を受けたら2000人は落ちる計算
嘘つけよ
実際そんなに落ちてねーだろ
ちゃんと数えて統計採れよ
80%は事実上の98%くらいだろ
それでも200人は落ちるって考えられんけどな
そこまでの御墨付きをもらって何をどうやったら
落ちるんだよ
不調でも受かるだろ 統計検定の受検対策にはアクチュアリーの過去問がいいね SPSSとJSTATってそこまで検定結果に差が出たりします?
ANOVAとF検定、Tukeyによる多重比較くらいしかしませんが… ドアホ
同じことやらせたら同じ結果がでるに決まってるだろ
各ソフトで同じことやってるのか違うことやってるのか解らない脳なしはSPSSでがちゃがちゃぽんやってろ
ま、p値算出以外ならExcelでいけるような検定なら好きなソフト使えばいいよ ソフトの信頼性がどうなのか聞きたいんじゃない?
聞き方がアホなのには変わりないけど だったら複数ソフトで同じデータの検定すれば良くね?
データ量が多くなければ手計算もやって正しいかを確かめれば良い。 >>58
基本的なのだったらpeachもExcelで計算できる
T検定とかanovaとか 単回帰分析で惜しくもp<0.05にならなかった因子が、
重回帰分析で他の因子との組み合わせによりp<0.05になることはありえますか? とりあえず>>62は回帰分析についてまるで解っていないことが解った
勉強しろ、率直にいって凄く間抜けな質問してるぞ?
ありえるに決まってる
例えば「体重」の「身長」による単回帰分析と「身長」と「ウエストサイズ」による重回帰分析を考える
「体重」よりも「ウエストサイズ(つまり体型)による影響を取り除いた体重」の方が「身長」ときれいに相関するだろうから、
重回帰分析の方が「身長」のp値は下がる >>63
3回読んで納得しました。
ありがとうございました。 つーかある因子のp値から逆算して他因子を考慮するか考えるなんて、クソにもほどがある >>1
スレ趣旨テンプレを省略するなよ。
以下のお約束を守った上で統計学について何でもどうぞ。
1)学校の宿題の丸投げはやめましょう。
2)質問者は質問の前に相当程度調べるなり、考えるなりしましょう。
3)荒らしは基本的にスルーでお願いします。 >>66
スレ趣旨テンプレは同意するが、関連スレは居るか?特に死んでるスレ 質問の仕方でアンケートの結果が変わるって言うけど
その質問の仕方の違いによるアンケート結果の違いの統計ってないの? そんぐらい自分で探せよ・・・
ありがちなテーマだし先行研究なんぞ山ほどあるでしょ レジの違算に関してですが、違算に作為が無ければ長い目で見れば結局は±0で落ち着くと言うことで大丈夫ですか?
お釣りが少ない場合は言いに来るは排除で。
知り合いの相談で聞けば聞くほど可笑しいなと思ったので。
そもそもマイナスの違算ばっかりなのに客からお釣りが少ないと言われた事が一度も無いらしい。
など総合的に考えて作為を疑っているので意見をお願いします。 昔のコンビニバイトの経験からの話なんだが、レジミスは長期的に見て±0には絶対にならない
なんでかというと、レジは大抵弾くような動作を繰り替えして金を取るんだが(基本的に1弾きで1枚)、
人間の感覚的にいって、1弾きで2枚取ったことを見逃す率よりも、0枚を見逃す率のほうが明らかに少ない
この動作を山ほど繰り返すため、釣り銭ミスは少なく渡すよりも多く渡す方が絶対に発生しやすい
さらに、少ない場合のみその場クレームが発生する可能性があるのでこの傾向に拍車がかかる
なのでレジ違算は長期的にみると基本マイナス方向に偏るため、それだけでは盗難の有無の推測は難しい
しかしまぁ個人的意見だけど、店長が怪しいと感じたのなら十中八九店員が盗んでるよ
ダスキンへの支払い等、レジ金を使った客以外とのやり取りの計上ミスはないというのが当然の前提だけどね >>75
釣銭の間違い金額を確率変数として一定期間でのその分布の母平均値の点推定値が0
と言う帰無仮説を立ててT検定すれば?
仮説より事実の方が正しいと判断するのが普通だと思うけど
なぜその事実になるのかは詳しく調査しないと分からないだろうけど回帰分析とかでわかるかも
誰かの時に有意に外れているとか >>77
測定できるのは現金の実際額とレジの記録との差額だからこれを目的変数にするのかも >>75ですが違算のデータが無いのでアレですが参考になりました。 GJ = 1.4 HP + TMP + .72 AGR + .43 (TMP) (AGR)
HP = HR^+ + LDGBR + LBI - HPM
TMP = 3.6 EJG + 4.7 √PT + KR - TMPavg
AGR = 1.5√T^2 + CP + 1.3HBP + 2.2TOSEB
薬物使用の証拠を示す方程式・・・
使われてる統計手法はアレです 今更だけど、>>75は単位時間1レジを1標本として、
レジ違算〜会計回数+勤務従業員+会計回数:勤務従業員、で推定できそうだな
万人共通の偶発ミスなら会計回数が、ミスしやすいアホがいるなら交互作用が、
盗まれているなら勤務従業員が反応するはず クラスタリング(?)の方法について教えてください。
標本サイズ100のデータが50種類あるとします。そして、この50種類のデータは10グループ、
各グループ5種類に分類されており、グループ内の相関はあるが、グループ間の相関はないと仮定します。
ここで、各データがどのグループに所属するかが未知であるときに、50種類のデータを正しくグルーピング
するアルゴリズムはあるでしょうか?もしあった場合、何種類くらいまで実際に計算できるでしょうか? ニック・マークスとかいう統計学者の唱える「地球幸福度指数」で
みると、世界一幸せな国はコスタリカ、日本は何と75位らしいね。
スーパープレゼンテーション 「統計学者が語る 世界一幸せな国とは?」
NHK-Eテレ 2014.10.15
http://www.nhk.or.jp/superpresentation/backnumber/141015.html 例えば「植物の成長期した長さや花の大きさと日照時間の相関関係」を調べたいときはどのような検定方法を使えばよいでしょうか
たとえば日照時間をなし、二時間、四時間、六時間…と多条件を立てた場合です すみませんこれだと相関分析ができてしまいますね
では「花の長さや大きさに影響を与えるのは葉緑体の数の増減ではないか」と考えたとします
日照時間によって葉緑体の数が変わり、結果として成長に影響を与えたということです
日照時間の違いとそれによる葉緑体数の変化、その結果生じる植物の長さと花の大きさの違いの相関を見るにはどうしたらよいでしょうか 背景がわけわかめ
日照時間長い>葉緑体密度があがる>光合成効率が増える>たくさん成長する、ってこと?
どっちかというと、日照時間長いとたくさん成長して葉緑体数が増える、んじゃない??
というか葉緑体数は推定値があるの? >>88
すみません、例を挙げたまでなので意味が分かりませんね…
日照時間が長いほど成長が良いという事実が得られたとして、では成長の要因はなんだ?となったときに、葉緑体数と成長に相関関係があるのか検定するにはどうしたらよいでしょうか >>89
>>83みたいな交互作用を考慮した重回帰分析とか
葉緑体のレベル毎に成長を測定して分散分析とか
なのかな?
単純な相関関係なら相関係数とか回帰分析のR^2でいいような気もする
ただ相関関係が有っても因果関係の向きや直接なのか、外や間に何かあるのかは判らないのでは? 相関関係と因果関係は別物だぞ?
手持ちのコマが日照時間と最終状態(長さ、花サイズ)しかないんだったら、因果関係の検証なんぞムリ
つか何が聞きたいの?例えが酷すぎる、実験系に問題あり、で終わり 知恵袋の質問ですまんが、これわかる人いる?
2chだと画像の貼り方がわからん。
結構困ってるので誰か助けてくれ... 2chに知恵袋のリンク貼って大丈夫かビクビクしてる >>96
まったく意味不明の所を見ると
これ以前に前提となる情報があるんだろう >>99
前提となる条件って言ってもモーメントの定義式くらいしか…
質問の意味はわかりますか…? >>99
前提となる条件って言ってもモーメントの定義式くらいしか…
質問の意味はわかりますか…? 統計はまったく知らない人なんですけど、教えてください
番組A 視聴率 11.8%
番組B 視聴率 10.0%
俺「番組Aに比べて番組Bは視聴率が落ちた」
友人「そうとはいえない。標本数600で調べた視聴率だから、標本誤差というのが2%超えるくらい出る。
だから意味のある差があるとはいえない」
俺「番組Bだけ誤差が発生したなんて考えられない。番組Aもその誤差が発生したとすれば結果としてでてる数字は
確かな物になるし何も変わらないじゃん」
友人「お前は馬鹿だ。さっぱりわかっていない。」
と、こんなやり取りだったんですが、俺どこかまちがってますか?
両方に誤差があるなら、結果としては同じことだと思うんですけど。
何がまちがってますか?
初心者なんで、わかりやすく説ほしいです。お願いします 物理より数学に近いと思って...
>>103
多分正しいとは思うんだけど、自分で考えて計算すると最初の2項目までしかでてこない...
Σijのijに1,1を入れるとμ_2ー(μ_1)^2になってこれは標準誤差の考え方と同じで分散の定義そのもの
がでてくるんだけど、やっぱり3項目以降がなんであるのかわからん。
普通モーメントってどの次数も独立だよな...? >>104
標本数が少ないとゆらぎが大きくなる。だからその揺らぎ2%だったとして、ABの差がその揺らぎ以上
の開きがないと本当にAの視聴率のほうがいいとは言えない。例えばABと名前のついた二つのサイコロ
があったとして、5回サイコロをふった時の出た目の平均がA:3.5、B:2.9だったとする。そこから「Bのサイコロより
Aのサイコロの方が大きい目の出やすいサイコロだ」という結論を出してしまうのは間違ってるのは明らかだよね? >>104
誤差があるので、データ通りにA>Bの大小関係があるとはいえない
例えば、目測で木の高さを測るとしよう
2本の木を同時に視界に入れて測るのではなく、1本目を単独で測った後、別の場所にある2本目の木を測る
1本目は12メートル、2本目は11メートルとなったが、目測には誤差があると考えられるので、
確実に1本目>2本目である、とは言えない というか、モーメントって統計学のジャンルであってるよね?? >>104
Aが高い誤差の値、Bが低い誤差の値
かもしれないからAの視聴率がBより高いとは言えない
全世帯調べる事が出来ないからサンプルを600とって調べるけど600の選び方によって視聴率の調査値は変わる
別のサンプルではB>Aの値になるかも >>96
分散共分散行列って2次モーメントの行列じゃね?
n次モーメントの分散ってなってるから
物理のモーメントって回転とかのヤツでは? >>112
そうそう、対角要素がそれぞれの次数のモーメントの分散(二次のモーメント)になってる。紛らわしいが。それで、普通に計算するとたとえば3次のモーメントの分散だとE[(x^3-μ_3)^2]でしょ?
これを計算するとμ_6-(μ_3)^2になって二項目までしか出てこないんだわ。
参考までによく出てくる算術平均の分散(一次のモーメントの分散)はE[(x-μ_1)^2]で、これを計算するとよく知られた式
μ_2-(μ_1)^2が出てくる。みなれた形で書くならE[x^2]-E[x]^2。 >>112
そうそう、対角要素がそれぞれの次数のモーメントの分散(二次のモーメント)になってる。紛らわしいが。それで、普通に計算するとたとえば3次のモーメントの分散だとE[(x^3-μ_3)^2]でしょ?
これを計算するとμ_6-(μ_3)^2になって二項目までしか出てこないんだわ。
参考までによく出てくる算術平均の分散(一次のモーメントの分散)はE[(x-μ_1)^2]で、これを計算するとよく知られた式
μ_2-(μ_1)^2が出てくる。みなれた形で書くならE[x^2]-E[x]^2。 >>104
どんなに誤差があろうと0.1%でも視聴率が高いほうが、
実際の視聴率も高い可能性が高い。 >>116
i,jに1,1と入れると>>114の最後で言った式がでてくるよ。μ_0=0だからこの場合は
3項目以降は消える。3項目以降がでしゃばってくるのは高次の時 >>118
Sigma_{1,1}=μ_2??μ_1^2
にならないか? 今μ_nはn時の中心モーメントを表しているので、
ああ、そういうことね >>127
A, Bを比較するんじゃねーの?
あと測定誤差が正規分布するとしてそのパラメータは同じなのか? Aの視聴率>Bの視聴率 という結論を出せるかどうか
Aの視聴率>Bの視聴率となる確率が、Aの視聴率<Bの視聴率となる確率より高い、という結論を出せるかどうか
この二つを混同している人がいるのかもしれません
>>104の「友人」が前者を問題にしているのは明らかですが >>132
誤差は視聴率の値と標本数によるから
一般的には調査値がA>Bだから
真の視聴率も同様とは言えなくね?
どんな組合せでも言える? >>133
ごめん、その若者言葉みたいなのやめて
文意が曖昧になってしまうから
そして、何故任意の組合せの可能性を持ち出したの? >>134
上の具体的な値も計算してみないと判らないのでは?
任意の値でA>Bなら計算しなくても良いけどな 視聴率に限定すれば
見た or 見てない の2値?
あと時間も関係するか
毎分とか毎時間とか >>130
その友人は屁理屈しか言ってないですよね。
体重計でも温度計でも測定誤差はありますが、
測定誤差±0.2度の温度計が22.1度から22.2度に上がったら、
上がってはいない、誤差の範囲だ、意味がないと言うつもりなのでしょうか。 >>138
マジレスすると
その測定誤差±0.2度というのは、温度計自分自身との誤差ではなく、(理論的に定まっていると考えられる)真の気温との誤差のこと
…流石に釣りで冗談言っただけだよね? >>139
大きな釣り針だなぁ。
基準電圧ひとつとっても揺れてるのに、計測回路はアナログ要素だらけで
真の気温とやらが一定でも計測するたびに結果も揺れるよ。 >>140
>>138に教えてあげたら?
答えはyesだと >>138
答えはYesらしいので、その人とは友達止めるべきです。 ここまで無知で調べる気すらないとさすがにもう相手にしてられないな。
ググレカス。 相関のあるAのデータとBのデータがあり
Bが0の時のAの推定値を求めるのに
散布図を作り線形近似曲線から切片を出そうとした場合
・AのデータをXに、BのデータをYにした時のX切片
・BのデータをXに、AのデータをYにした時のY切片
この2パターンがAの推定値となるのですがこの2つの値は異なる値となります。
相関係数が高ければ高いほどこの2つの値の差は小さくなり相関係数=1で差=0になるため
この2つの値の差は誤差のようなものと考えていいものなのでしょうか?
それとも「Bが0の時のAの推定値」を求めるにはXとYは必ず固定されなければならないのでしょうか? 解が異なるのは回帰直線を求める際の
最小二乗法をyで取るか、xで取るかの違いと同じ >>146
相関があると分かったら何をしたいのか?
ただ相関があると知りたいだけなのか? 気になっただけだよな?
その手の解析の切片の数値なんゼロかゼロ以外か程度にしか気にするもんじゃないと思う >>138
それは、完全に同じ条件で温度測定できてないと成りたたないですね。
測定誤差±0.2度の温度計が22.1度から22.2度に上がったとしても、
たとえば日光が温度計に直接当たって気温よりも温度計の温度が上がった、
温度計を持つ手の体温が伝わった、などの要因が発生していれば、
それは気温の上昇を示す変化ではないと思います。
いわば温度を計測したときの条件が変わっているわけですから。
視聴率もそれと同じで、標本となる世帯がつねに入れ替わっているし、
番組Aの時には残業で帰れなくて視聴できなかったが、番組Bは残業がない日
だったので家でゆっくり見られた、というふうに視聴の条件が常に変化しています。
このように番組Aのときと番組Bのときの標本の条件は同じではないので、
別の機械で計ってるようなもの。
同じモデルの温度計を2つ用意して、片方が22.1度、もう片方が22.2度だった
という例えのほうが近いのでは? そういうの含めて正規分布するのですよ。
みな全く異なる環境で育ってるのに身長が正規分布するようにね。 米国・SAT(大学進学適性試験)で中韓の学生の成績が正規分布から大きく外れていたそうなw パチンコ台みたいな釘が多段に打ってある板を斜めにして
上の中央からパチンコ玉を落とすと
最初の釘によって左右にほぼ同確率で分かれる
次の段でも同様に左右にほぼ同確率で分かれる
その分布がガウス分布 >>153
間違っちゃいないんだが・・・
二項分布に中心極限定理を用いて正規分布を説明するのはなんか違わないか? こちらで聞いていいのか分からないのですが・・・
二つのデータ群があってその二つの関係性(AがBにどう影響を与えているか)を分析したいとき
分散分析と正準相関分析のどちらが適しているのでしょうか?
正準相関分析は二つの相関を調べるので影響を与えているかを考えるときは分散分析の方が適しているのでしょうか?
つまらない質問だとは思いますがどうかご教授お願いします。 どんな解析やろうが因果関係なんてわからない
2群比較だけで因果関係があるといえるほど強い関係性があるのなら、どんな解析でも明白な結果がでる
2データ群の因果関係が言いたいのに手持ちがそれしかないのは実験計画の段階でミスってる >>156
>>155が研究デザインを明示しない状況でそんなことは断言できないのでは。
観察研究か実験研究かも分からないし。
例えば、AとBとが昨日と今日の気温データだったら、
自己相関としての因果関係はある程度存在すると思うぞ。 >>155程度の情報では>>156みたいな返事が関の山ということ
的を得た助言を求めるにしては>>155は情報量が少なすぎる ある雑誌に投稿したらreviewerから
“no real comparison between the different derived parameters
for sensitivity orspecificity (ROC curve or random effects analysis)
or Moment analysis.”のようなコメントを頂きました。
研究内容は、生体のある状態を知るために色々なパラメターを時間に沿って
測定したものです。生体のある状態は、動物実験では測定が出来るものですが、
生体では測定できません。
コメントにある、ROCは判るのですが、
random effect analysis, Moment analysisは判りません。
どなたか教えて頂ければ幸です >>117
分散はでかくてもいいけど不偏性の条件が必要だよー! ,.-─ ─-、─-、
, イ)ィ -─ ──- 、ミヽ
ノ /,.-‐'"´ `ヾj ii / Λ
,イ// ^ヽj(二フ'"´ ̄`ヾ、ノイ{
ノ/,/ミ三ニヲ´ ゙、ノi!
{V /ミ三二,イ , -─ Yソ
レ'/三二彡イ .:ィこラ ;:こラ j{
V;;;::. ;ヲヾ!V ー '′ i ー ' ソ
Vニミ( 入 、 r j ,′
ヾミ、`ゝ ` ー--‐'ゞニ<‐-イ
ヽ ヽ -''ニニ‐ /
| `、 ⌒ ,/
| > ---- r‐'´
ヽ_ |
ヽ _ _ 」
ググレカス [ guglecus ]
(生没年不明) 良いことを求めて受けるわけじゃないから
いいことがあるかどうかは知らん。 ホームページによれば来年の6月試験から準1級試験を開始するらしい。 ちょっと解いてくれ
非負実数値をとる確率変数X,Yが互いに独立であるとする。それぞれの分布関数をFX(x),FY(x) (x≧0)とするとき、X-Yの分布関数P(X-Y≦x) (-∞≦x≦∞)を求めよ
東大の友達に聞いてもわからんとよ 2要因混合計画の交互作用ってなんで被験者内要因として扱われるの?
S×A×BじゃなくてS×Bの自由度使うのが良く分からない
誰か詳しい人教えちくり なんか色々心配になってくる質問だな
ググったら出てきたサイト
http://mcn-www.jwu.ac.jp/~kuto/kogo_lab/psi-home/stat2000/DATA/08/09.HTM
その三というのが2要因混合計画にあたるんだが(次のページでもう少し詳しく説明されてる)、
一人あたりの条件Aと条件Bの全組み合わせデータが得られていないので、S×A×Bは見れない
その一その二その三と例を眺めればなにか気づくんじゃないかな >>175
一人あたりの条件Aと条件Bの組み合わせ とは
理解力なくてすまぬ 自分の書き方が悪かった、すまん
>>175のリンク先の人名が載ってる表を見て欲しいんだけど、
その二では佐伯さん等について6通りの組み合わせすべてのデータが得られているのに対し、
その三(混合計画)では村山さん等について3通りしかデータが得られていない
つまりS(個人差)×A×Bは該当するデータが無いので解析できない、ということ >>177
いや答えてくれるだけ感謝や
その一も一人における全通り分は得られてないけど? >>178
うん、そう
だから個人に個人差の扱いがその一〜三で変わってくる
その一では一人一データだからS、その二ではSxAxB、その三ではSxB、という風になっている >>179
何回もありがとう
なんとなく分かってきた この板に書き込むのが初めてなので質問の仕方が合っているか分かりませんが質問させて頂きます
全国(or1世帯あたり)でのゲーム機保有台数の載っているサイトは無いでしょうか?
一応総務省の統計データやググって出てくるPDFなどを読みましたが有りませんでした
どなたか知っている方が居られれば教えていただきたいです 数学を中学レベルくらいの基礎から統計学に必要なものだけに絞って勉強するとしたらどうすればいい
統計学はこれからくる学問だと思う ごく普通に、大学のカリキュラム通りに、微積分→確率・統計 尤度比をλとしたとき-2logλは近似的にカイ二乗分布に従う
これどうしてこうなるのか誰か詳しく教えてくれ
手持ちの本見ても定理の一言で済ませてやがるちくしょう >>186
大学は文系なんだが公認会計士で統計学選択しようと思っている
データサイエンスに興味がある 統計学、あるいは統計学の基礎となる範囲の確率論で、確率積分を使う機会はありますか? >>189
データサイエンスは確率論よりもまずはプログラミング
>>190
ある >>191
プログラミングはもちろん必要だ
でもそれはまた別のカテゴリーになる
データを分析するのに統計的思考が必要になってくる >>192
統計検定を下の級から順番に受けていったら?
数学検定も。 検定とかはどうなんだ
あくまで最短距離をあゆみたい 『漫画でわかる統計学』でも読んどけ
タイトルから想像されるような酷い内容ではないから それはみた
鳥居先生の本ってどうなの?評判いいみたいだが 統計用語と実際の計算を教えて下さい。
掃除の危険度を計算するとします。
転んでケガをする危険度(確率)が0.1だとします。
塩素系の洗剤の危険度が0.0001だとします。
酸素系の洗剤の危険度も0.0001だとます。
塩素系と酸素系が合わさると危険度が0.7になるとします。
この2つの要素が合わさると寄与率が高まる事を統計用語で何と言いますか?
タバコだけ酒だけではリスクが低いが合わさると高まるみたいな時にどんな用語を使いますか?
実際の計算式はどうなりますか? 交互作用が存在する
危険度=転倒+塩素系+酸素系+a×転倒×塩素系+b×転倒×酸素系+c×塩素系×酸素系+d×転倒×塩素系×酸素系
>>199の情報だけでは各交互作用のパラメータa,b,c,dの具体的な数値は求められない 単純化して考えた時の話ね
きちんと考える場合には誤差構造に二項分布を仮定するなどもうちょい複雑になる 階差系列とは何ですか
ググっても用語解説が出てこないんですが >>202
{a_n}の階差系列は{a_(n+1) - a_n} 教えて下さい
私達の分野(医療)で改善率という指標があるのですが、ある評価基準について、満点を100点として、治療前の点数が治療後に100点にどれぐらい近づいたかということで表されます。
例えば、治療前60点が90点になったら,
(90-60)/(100-60)=0.75
という具合です。治療後100点になれば1、治療後に治療前より点数が悪化すればマイナスとなります。この手法の問題は治療前の点数が100点だった場合には計算できないことにあります。
私の質問は、治療前の点数が100点だった患者を含んでいた場合の統計処理方法についてです。
(治療前100点でなぜ治療を受けるのかという点ですが、主の治療目的と別の、副次的な項目についての治療効果を調査したいためです。)
以下の2つの方法を考えたのですが、2.についての統計手法が分からずに困っています。
1. 100点だった患者を除いて、各患者の治療前後の改善率を計算、その平均について各治療法間で比較する。
2. 100点だった患者を含めて、治療前の点数の平均と、治療後の点数の平均を算出し、平均値の改善率について各治療法間で比較する。
1.については、治療法ごとの平均値の検定で対応できますが、2.については、治療法ごとの改善率を計算することは出来ますが、その差について有意かどうかの検定方法がわかりませんでした。
よろしくおねがいします。 治療前の点数が100点だったということは、検査値に異常はないのに
患者さんにとっては具合の悪い自覚や他覚があるってことでしょ。
検査値に出てこないものを数値化しようとする時点で無理があるんじゃね 正直まじあるかも。どっからどう見ても体に出てるだろ、けど検査値
異常なしって鈍感なおれが見てもたまにある。ただ検査値にあがってこないだけで。
めっちゃ悩む ありがとう。あくまで例えですが、もう少し具体的に説明します。
歯の治療をしたときに、肩こりが良くなるか、良くなるなら歯の治療の方法によって違うか、みたいなことを調査したい時。
治療前に肩こりが全くない人(100点)、とてつもなくひどい人(0点)とすると、
歯科治療A(患者1、患者2、患者3、患者4、患者5)として、
治療前、
100、80、60、40、20
治療後、
100、75、85、75、80
歯科治療B(患者6、患者7、患者8、患者9、患者10)として、
100、100、90、80、70
治療後
100、90、90、95、90
みたいな状況です。
治療前100点の患者1、患者6、患者7を除いて個々の患者の改善率を平均すると、治療A 0.43、治療B 0.47、
すべての患者の治療前の平均、治療後の平均を用いて改善率を計算すると、治療A 0.58、治療B 0.42
となります。
治療前100点の人が100点のままなのも意味があることだし、80点とかに悪化するようなケースを無視して優劣をきめるのもどうかと思ったわけです。 >>210
治療法Bの副作用とかで悪化した度合いを数値化してやればいいだけでは?
(90-100)/100=-0.1とか
元々が100だったら100で割る >>211
元の改善率は改善する方向の余裕のうちどのくらいの割合で改善したかを表すものだった
ところが治療前が100だと改善方向の余地は無い
そこで悪化方向の余地のうちどのくらいの割合で悪化したかを表して、符号を改善方向に合わせると言う考え方 カンだけど、いくつかの治療法があっても上手くいかない場合
たとえば今まで痛くなかったのに痛くなったとか、かえって悪く
されたんじゃないかとか、実際あってはならないことへの線引の
基準って気がする。歯医者は底辺でそんなに凄いことにはなっては
いかないけど >>210氏、気をつけなよ
紙の上ならいいけど時として生きるか死ぬかって患者さん家族とトラブったら
まじ人生詰んじゃうって聞く。ヤバそうだなっと思ったら大きな病院に送るとかw >>210
官能検査の範疇じゃないかと思う。
それと何となくだけど、株価チャートやWACCのβ値を出す時のような発想が使えるんじゃない?
こんなのが参考になると良いんだけど。
http://www.asevjpn.wine.yamanashi.ac.jp/JAJ/Vol/Vol-8-1997/2/105.pdf >>211, 212
ありがとう。参考になります。
ただ、そうすると、100点が99点の場合は-1/100ですが、
99点が98点になったときに、-1とするか、-1/99とするのか
さらに、99点が100点になったとき1とするのか、1/99とするのか、
という新たな問題がでてきてしまいます。
もともと、この評価方法自体が、60点から100点への改善と80点から100点への改善が同じ価値になってしまうなど、突っ込みどころが多い方法なのです。
かといって、単純に差で比較するのも、20点が60点になることと、60点が100点になることが同じ価値になってしまうのもどうかと思います(この場合は後車の方が圧倒的に満足度は高い)。
もっと良い方法があるとよいのですが。
>>213, 214
たしかに、一人の患者さんを相手にするときは、こんな紙の上の計算は役にたたないんですが、自分の治療法や他人の治療法が本当に意味があるのの物差しとして、統計などの紙の上の勉強が必要になるんです。 (y2 - y1)/(100.001 - y1)とでもすれば充分な精度に思えるが駄目なんか? 肩こり治療に対して、有意かどうかは単に2群のt検定をすれば良いのでは。 t検定は正規の仮定があるから使えないのでは
あくまで改善率にこだわるなら2つの改善率の比較したほうがいいと思うけど
ノンパラの検定になりそうでめんどくさそう >>215
官能検査やβ値始めて知りました。完全には理解できていませんが、面白いですね。
導入できないか考えてみます。
>>217
それだと、100点が100点になったときの改善率0となってしまうのがちょっとよくないんです。
>>218, 219
両郡の治療前の点数がそろっていれば、単純に治療後の点数に対して、t検定なりノンパラの検定なりで比較しればいいんですが、
今回のケースでは治療前の点数がそろっていないことをどうするかということが問題になっています。
自分の分野ではこの改善率という方法をつかうのですが、いろいろ問題があって困っています。 >>220
いや改善率の二群ね
2つの改善率を比較してるんでしょ?
それか回帰にして100の場合をダミーにするか
変数とデータが十分にあれば意味があるかな >>216
治療前が100の時だけ例外計算する
元々の改善率の計算も治療前が100だと計算出来ないわけだし
あと改善率と言うからには100→100の改善率は0で良いと思うけど
治療前が100の時は近似的に99として改善率を計算するのでも良くない?
どれくらいの精度が必要か知らないけど >>222
それは一番やっちゃいけない
悪化する可能性もあるんだし、pハックとやってること変わらん >>206
医学(疫学)の人間だけど、改善率って初めて聞いた。
治療前100点の患者を除くと、
治療後に悪化する(つまり100点を下回る)ケースの情報が欠落する。
やっちゃダメだ。
こんなところで質問するよりも、
改善率をアウトカムにした先行研究と同じ方法をとるのが無難だよ。
自分で勝手に定義しても良いアウトカムなら、
>>217のように、無限大になる指標を補正するときによく使われる手を使う。
補正パラメータを0.001として、
(治療後 - 治療前)/(100 - 治療前 + 0.001)とかね。
結果的に>>217と何にも変わらないが。 あけましておめでとうございます。
皆さんありがとうございます。だいぶ理解できました。
>>224
多分医学のなかでも、こういうやり方をつかっているのは私達の分野(整形外科)だけなのかもしれません。
改善率をアウトカムにした先行研究は基本的に、もともと調子悪いところの改善率を対象にしているので、inclusion criteriaで治療前70点以下などになっていて100点を含まないものがほとんどなんです。
補正パラ-メーターを使用して、改善率をノンパラの検定でやってみます。
よく考えずに、プロトコルに改善率をアウトカムに入れてしまい、いざ解析を始めてから困ってしまったんですが、
この研究では、改善率をアウトカムすること自体が、適していないような気がしてきました。 >>225
まぁというか、ちゃんと統計学者に聞いたほうがいいぞ
ここじゃ細かい話はできないし、特にパブにするなら、ちゃんとやったほうがいいと思うけど 研究者のための統計的方法 POD版
R.A. フィッシャー(原著) 防衛大学教授・武蔵工業大学教授遠藤 健児(訳) 一橋大学教授鍋谷 清治(訳)
https://www.morikita.co.jp/books/book/2641
これって、どのレベルの人が対象ですか? 統計学全然わかんねえんだが実験結果の統計結果を出せって言われた・・・
助けてくれ 平均と分散、最大値と最小値、中央値と四分位
比較があるなら各種検定でOK 水の入ったコップをガラスにぶちまけると、ガラスに水滴模様ができますよね。
それを何千回繰り返して、同じ水滴模様が出来る確率を割り出すのは
ほぼ不可能ですか? >232
冗談で言ってるのはわかるけど、
・ぶちまける先のガラスの大きさと
・同じ模様の定義
くらい書かかないと、ほんとのウソにしか見えないじゃん。
前提がそろってないから、ほぼでなく、完全に不可能。 N(0,1)^2〜Γ(x.y)となるx,yを求めよという問題で、
N(0,1)^2の分布関数が、
Φ(x)をXの分布関数とした時、
F:N(0.1)^2 = Φ(√x)-Φ(-√x)となるところまではわかるのですが、
そこから両辺微分して
=1/(√2πx)*e^(-1/2*x)
となるようなのですがその過程がわかりません。
(密度関数 1/(√2π)*e^(-X^2/2)を
区間 -√x〜√x で積分したものを微分する気がするのですが、、、)
よろしくお願いいたします 標準正規分布に従う確率変数の二乗はカイ自乗分布に従う。 大学生の名前から、ベイズ統計で親の年収と学歴を推定できるの?
640 :自治スレでLR変更等議論中@転載は禁止:2015/01/18(日) 17:38:49.90 ID:3uP4//2C0
>>630
ベイズ統計で簡単にカテゴライズ可能です。
ベイズ統計を利用してスパムメールを高精度で同定できている実績から明らかですが、
意味のないメールを高精度で同定できるのと同様に、
意味のない親から生まれた意味のない子供を高精度で同定することが悲しいけど可能です。
【社会】男の子は「蓮」、女の子は「陽菜」…「正一」「千代」の大正時代から見ると浮かび
上がる“世相” [転載禁止]c2ch.net
http://daily.2ch.net/test/read.cgi/newsplus/1421537966/625-640 そんなのprimary outcomeにさがなかったから改善率とか出して誤魔化そう的な発想が見え見えじゃん
解析する価値すらないことに何を悩んでるのかね?
バカバカしいこと考えてないでもっときちんとしたデザインとかを考える方がずっと有用な時間の使い方な気がする キイロショウジョウバエの野生型+の雄と、常染色体上の劣性突然変異遺伝子である黒檀色eホモ接合体の雌を交配したところ、F2では、各表現型について下に示す数の個体が得られたとする この結果は、+:e=3:1、♀:♂=1:1と合致してるが、メンデルの遺伝の法則から考えられる分離比といえるかどうか、カイ二乗法を用いて検定し、その結果について考察せよ 有意水準5%、カイ二乗分布の累積確率は自由度1、2、3でそれぞれ3.841、5.991、7.815である +♀70、+♂50、e♀10、e♂30
よろしくお願いいたします すいません、自分なりに解いてはみたのですがそれが正しいのかわからないので質問しました。期待分離比をメンデルの独立の法則の9:3:3:1で考えて検定した結果独立の法則の分離比とは異なるという結果になりました ただ、一つ引っ掛かったことがあって、問題には自由度が3つ提示されているのですが上でやったような場合だと自由度は3しか使いません。自由度1、2は無視しても良いのでしょうか?または、優劣の法則の分離比などの検定も行うということでしょうか? 松岡修造がいる場所の気温が高いことについて
有意な相関関係はありますでしょうか?w >>250
そもそも期待分離比が間違っているのでしょうか? 修造がいる場所の気温が高くなったデータと、
修造がいなくなった場所の気温が低くなったデータと、
両方あつめて分析しないとだめだぞ。 >>245
クロス集計表を使って適合度検定かな
性別と+eの2次元の表で
理論値と観測値の適合度を計算する 統計上、秋田県産少女の体格は全国有数?
【教育】5〜17歳の体格、秋田は全国トップ級...肥満・虫歯の割合も高め - 学校保健統計調査 [15/02/01]c2ch.net
http://daily.2ch.net/test/read.cgi/newsplus/1422773221/ >>244
有意水準の定例値5%の出所が、この専門誌1月号に記述されていますね。
検定と推定・再入門 第1回 検定の考え方―有意水準 5%説はどこからか
『標準化と品質管理』 Vol.68 2015年1月号
http://www.webstore.jsa.or.jp/lib/lib.asp?fn=magazine/mg1_1501.htm 質問です。株やってます。高卒です。
100円の株価が9割位の確率で10分以内に103円になります。9.5割位の確率で15分以内に108円になります。1割位の確率で15分以内に90円になります。
ただし、これらは平均しての結果であり、場合によってはもっと極端な値をつけることもあります。その場合、70円とか、マイナスの場合のほうが幅が大きいです。
さて、これらを踏まえ、利益確定・ロスカットの値段、時刻を決めたいと思います。
自分なりに統計データは取っており、利益確定・ロスカットの値段は決めていますが、感覚的なものなのでアテになりません。
トレードにおける感覚は全くアテにならないということも分かってきました。
つきましては、どのようなデータを取り、どのような判断で利益確定・ロスカット値段、時刻などを決めればよいでしょうか。
スレチであれば申し訳ありません。また、スレチである場合、どの板で質問すれば良いでしょうか。
何卒、高卒無職に知恵をお授けください。よろしくお願いします。 ちなみに上記の結果をもとに感覚をもとにしたトレードを繰り返した結果、資金は微増程度で、全く儲かっておりません。 儲かっていない理由は損失がデカくなる傾向にあるためです。
勝率はまあまあ高いのですが、たまにやるロスカットがデカいのです。 あと、9.5割位の確率で108円と言うのは、いったん大きく下げてから急騰している場合も含みます。
この場合にブン投げ(泣きわめきながらロスカットすること)する場合も少なくありません。
2時間くらい我慢していたら結局+10%以上儲かっていた、なんてことも少なくないです。 連投、失礼いたします。
感覚的なものが当てにならないと言うのは、最近のノーベル経済学賞の結果だけ読んだら、人間の本能として状況によってリスク選好の度合いが変化してしまうとのことでした。
損失が出ているとハイリスクを取り、利益が出ているとリスクを取らない、という行動パターンが本能として固定的であるため、結果が悪くなってしまうということです。
これは教育や訓練の程度によらない、本能的なものらしいです。
結論として、統計データをもとに機械的にトレードするほうが効率が良いらしいのです。 つまり、かなり高確率で値上がりするが、下がるときには大きく下げてしまう。
しかも、値上がっていてもどこで反転、下落するかわからない。
そういう場合に、価格及び時間の両面で売るタイミングを決めておきたいわけです。
損切り値を少しでも上に上げると、すぐにそこに引っかかってしまい、勝率が下がる。
下にすると引っかかりづらくはなり、勝率も上がるが損が大きくなる。
もっと下にすると勝率はさらに上がるが損が大きくなる。
そこで、試行回数を増やした場合にトータルの利益が最大となるような最適値を割り出したいのです。 >>263
レスポンスありがとうございます。
投資板、株式板では数学を背景にした回答はまず期待できません。そういうスレも一部にありますが、商材屋さんのステマとかが多いんです。
また、自分は初心者でもないんです。 >>265
申し訳ありませんが、儲かってないので払えません。
でも経験上知り得たことをお教えすることはできますよ。
この板の知恵ある方々にはそんなもの必要ないでしょうが…。 頭が悪いのにギャンブルやる奴は屑だということがよくわかる rのdecompについて調べようと思ったら画像がやばかった デコンプみたいなの使えば良いのですか?
使い方がわからないけど… てか、そこまで自分の行動を振り返っていながら、
なぜ足を洗わないのかが分からない・・ ニコニコ動画の
みんなで決めるフリゲ音楽ベスト100【03:309位(1位票1票) 3/3】という動画を見ていてふと思ったんですけど
何人投票したか知りませんが一票しか入ってないのに299位とかにランクインしてあまつさえ動画内順位に乗るのってなんか変な感じがします。投票してくれた人の票を尊重するために敢えて(たとえ一票でも)順位を付けているのだと思います
もし一人一票ではなく例えば好きな曲3つをそれぞれ選んで投票する形にすれば同じ曲がXXX位の様な低い順位にランクインしても(一人一票の一票ではなく3番目に好きな曲として投票した人が数人とか居るかもしれないので)、まだランキングとして意味づけができると思うんです
最高なのは全国民に強制的なアンケートを一人一票で取ることでしょうが、それは不可能であるので、一票(ないしたったの数票)でXXX位にランクインなんて信頼性があるんだか無いんだか分からないようなランキングにせざるを得ないんだと思います
@一人数票にする
A1位2位3位で投票させ1位3pt2位2pt3位1ptなど重み付けをする
のどちらかをした方が良いと思いますが少ない投票人数ではどちらがいいと思いますか?
またそのような集計法を取ることによって何か統計上のデメリットが発生したりするのでしょうか?
すくなくとも、少ない投票数で一人一票で行うよりはランキングの信頼性が上がると思うのですが
素人考えですが、ご意見ください y = Xb + eの線形回帰でeが多変量正規分布Nn(0, (s^2)I)に従うなら、yはNn(Xb, (s^2)I)に従いますよね?
だったら、
y_i 〜 N(x_i b, s^2), indep.
は
y_i = x_i b + e_i
E(y_i) = x_i b
e_i 〜 N(0, s^2), i.i.d.
と同じ意味だと思うのですが、なぜ
正規線形モデルでデータが独立に正規分布に従うと仮定するのが間違いになるんでしょうか??
実用上は正規性を残差で確認するからデータの分布を考える必要が無いことは分かります。 2chとかでよく「母数」という単語を見かける。
おそらく、サンプルサイズのように使っているのだろうけど、統計学の場合だと分布のパラメータなどの分布を表すものに使われる単語だと思う。
まあでも、母数なんて言わずにパラメータって言うよね。2母数ロジスティックとかは言うのかな 中部地方の2小学校の今年度新1年生全員が、女子だったらしい。
6歳児年代の男女人口比1.05という統計値に大きく外れるこの実勢値は、
何による異常値と分析されるのだろうか?
【石川】学校生活へ希望の笑顔、石川県内小中で入学式…女の子だけ14人元気に、七尾市和倉小[04/09] [転載禁止]
http://anago.2ch.net/test/read.cgi/femnewsplus/1428562128/
【岐阜】新1年生13人はすべて女の子!岐阜県七宗町・上麻生小[04/09]
http://anago.2ch.net/test/read.cgi/femnewsplus/1428562018/ 実験の授業で、
イモムシに@光A水B食べ物 て条件で各+/−で、サナギになるかの+−を見る実験なのですが、
光+、水+、食べ物+
光+、水+、食べ物−
光+、水−、食べ物−
・・・
という感じで全通りやって、光がサナギ化に影響するかを見たいのですが、
どういう検定方法をやればいいですか?
T検定しかやった事ないのでわかりません。
光+で他−と
光−で他−だけを比べればいいのかとか、それもわかりません。 なんで統計学が数学板にあるの?
寧ろ工学寄りじゃん 大阪都構想は住民投票で否決されたっぽいですが、
僅差に感じられました
もし、反対賛成の有権者はが1:1としたら、有意水準5%
でカイ二乗検定したら有意差あるレベルですか? ポアソン分布は確率pが著しく小さい限り
n pが100とか1000とか、どんなに大きい場合でも
二項分布を使うより精度が良いのですか?
それともn pがある程度大きい場合は二項分布に切り替えた方が精度良いとかあるんですか?
(nはサンプル数です) メディアの信頼度の調査のデータです
http://www.chosakai.gr.jp/notification/pdf/report7.pdf
18歳以上男女個人(5,000人
回収数3,270(65.4%
年代別
18〜19歳 78人 2.4%
20代 286人 8.7%
30代 454人 13.9%
40代 595人 18.2%
50代 517人 15.8%
60代 672人 20.6%
70代以上 668人 20.4%
有効回答数3270件は信頼できるサンプル数でしょうか?
それから10代のサンプル数78人は信頼できる数字なのでしょうか?
因みに18才以上の人口別データを貼っときます
http://blog-imgs-62-origin.fc2.com/k/a/p/kapokpokpok/jinkotable20130501.png
18〜19才 242万(604万÷5×2) 2.23%
20代 1317万 12.3%
30代 1690万 15.8%
40代 1785万 16.7%
50代 1550万 14.5%
60代 1840万 17.2%
70代以上 2296万 21.4%
18才以上 10720万 RMSEの信頼区間の求め方を調べているのですが、糸口すらつかめない状況です。参考となる書籍やサイトがあれば教えていただきたいです。 カイ二乗とかでなんかあった気がするなあ
MLEならvarianceじゃダメなの >>291
ありがとうございます。
教えていただいたキーワードで調べてみます。 RMSEの信頼区間て何?
推定分散か標準偏差の信頼区間じゃないのか? 真値ありだからbiasも評価してるってことじゃないの YとXを確率変数として
Y = 3X
Var[Y] = 9Var[X]
Y = X + X + X
Var[Y] = Var[X] + Var[X] + Var[X] = 3Var[X]
これって何が間違ってる? 母集団の平均μ、sd=σだとすると
E(X1)=E(X2)=・・・=E(Xn)=μになるのと
V(X1)=V(X2)=・・・=V(Xn)=σ^2になるのなぜ?
X1の期待値とX2の期待値は別物じゃないのか?
あとX1の分散って考え方が分からない
分散は複数のXで考えるものじゃないのか?
誰か頼む! そのX1とかX2は確率変数なんじゃないの?
変数はひとつなんだけど、その変数が確率的にいろんな値を取る、
ということじゃないの? うーん、
X1=5で確率が1/6
X2=4で確率が1/7だったら
E(X1)とE(X2)は同じにならないよね? すまんググっていろいろ読んでみたけどイマイチみんなが意図していることを読み取れなかった・・・ 同じ確率分布に従うからX_1だろうがX_nだろうが平均値も分散も同じになるぞ 左側の裾が広いガンマ分布の逆みたいな分布ってなんかある? 形状パラメータがあれば裾がどっちか調整できるイメージ 文系SEなんだけど統計検定準1級取れば転職に役に立つかな?
実務ではまったく統計学を扱ってないです。 どんな資格も実務経験なければ採用の決め手にならない
分布の名前を知りたいんだけど。
ある集団があって、その中でゲームをするとする。
一対一の対戦でそれぞれ勝率は50%とする。引き分けはなし。
対戦相手は、N勝M敗の人はN勝M敗の人とだけ対戦できる。という条件がある。
すべての人は同じ対戦数とする。
このとき、勝ち数の分布ってなんていう分布になるの? >>302
> 「確率変数」の定義を読め
おいおい、おまえは統計学を勉強してないのか?
それは可測関数の定義をよんでもわからないよ。
上から目線でまちがったこと書くなよクズ。 >>298より引用
>あとX1の分散って考え方が分からない
>分散は複数のXで考えるものじゃないのか?
質問者は確率変数の直観的意味すら誤解してるんだよ 協力してください。
とある問題集の検定の問題に誤りと思われる部分があり、
問題集が間違っているのか、自分の理解が間違っているのか確認のために、
Yahoo知恵袋に質問したのだが、せっかく返信をもらったにもかかわらず、
どうも書いてあることが理解できない。
http://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q13146837063
この問題なのだが、詳しい人は見てもらえないだろうか? ここを見たのかどうかは分かりませんが、
その後追加で回答をもらい、やはり問題の方にややおかしい部分があったとの理解に落ち着きました。
ありがとうございました。 無作為に選んで統計を取るなら、サンプルは4パターンあれば十分 >>316
4パターンとはどのようなものでしょうか?
教えてください。 >>316
しりたい。
面倒なのでやたらデータを取ってガウスに近似するのが普通だけど、
10個ぐらいしかデータ取りが出来ない場合があるので、迷うに迷う分布関数。 先日経済誌が、以下の統計手法で全国790余市の『住みよさ』順位を
発表した。各指標毎偏差値の単純平均の大きさ順というのは、安易
過ぎだ。もっと妥当な統計処理方法がないものか?
”公的統計をもとに、それぞれの市が持つ“都市力”を、「安心度」、「利便度」、
「快適度」、「富裕度」、「住居水準充実度」の5つの観点に分類し、採用15指標に
ついて、それぞれ平均値を50とする偏差値を算出、その単純平均を総合評価として
ランキング・・・・・・・・・・・・・・・”
「住みよさランキング2015」トップ50 トップ3は印西(千葉)長久手(愛知)能美(石川) 東洋経済新報 2015年06月23日
http://toyokeizai.net/articles/-/74144 統計学の問題で解けなくて困っています。
得意な方いらっしゃいましたら解説していただけるとありがたいです。
問
ある県のフットボールリーグに所属する選手の平均年齢を把握するため、10 名を標本に調査したところ、平均年齢20歳、標準偏差4歳となった。この問題では標本数が小さいため標本標準偏差を母集団の標準偏差としてあつかえない。
1.普遍標準偏差を求めよ
2.スチューデントのt分布を用いて母集団の平均年齢を求める。この場合における自由度を求めよ。
3.母集団の平均年齢を95%の信頼区間で推定せよ。
以上です。
よろしくお願いします。 一度発生すると一定時間発生しない
それ以外はランダムに発生する
この場合n回事象が発生するまでにかかる時間
の確率分布はどうなりますか?
つまり、アーラン分布が、発生直後は絶対に起こらないという条件を加えるとどうなるのか知りたいのです ベイズの定理について、質問です。土日かけて色々考えたのですが、どうもよく分かりません。
事象A、事象Bについてのベイズの定理は以下の式です。
P(B|A)=P(A|B)P(B)/[P(A|B)P(B)+P(A|~B)P(~B)]、 ~BはBの余事象
ここで、分母第2項にあるP(A|~B)ですが、これはP(A|B)の余事象なのでしょうか?
石村園子「やさしく学べる統計学」(共立)p.29や、田栗正章ほか「やさしい統計入門」(講談社ブルーバックス)p.95では、
P(A|~B)=1-P(A|B)
として計算されています。どちらの本も、病気(B)と精密検査(A)の例。
私に言わせると
P(A|B)=n(A∧B)/n(B)=P(A∧B)/P(B)
P(A|~B)=n(A∧B)/[n(U)-n(B)]=P(A∧B)/[1-P(B)]
であって、P(A|~B)=1-P(A|B)は成り立たちません。
n(U)は全体の場合の数、n(B)はBの場合の数、n(A∧B)はA∧Bの場合の数。 http://i.imgur.com/MOSYo0Xl.jpg
この問題の解説,データのサイズは5なのになんで4で割ってるの? >>326
不偏標準偏差と標準偏差どっちを計算すればいいかがわからん
そういうのは問題のどこから読み取ればいいんだ? 母集団の標準偏差を推定するのか、サンプルデータの標準偏差を計算するのか、問題文には指定がないから4で割るか5で割るかは不定。
アホが問題を作ると本当の「問題」になる。 >>327
たしかに迷うけど、このあとt検定しそうだし、そしたら不偏の方を求めるのが自然じゃね >>330
>>326
まーとりあえず標本調査の時は不偏て覚えとくは
ありがとさん >>324
上はU=P(A|B)+P(A|~B)が前提なんじゃない http://i.imgur.com/fFAdGVOl.jpg
このデータでt値求めて片側検定するとき自由度8でかんがえるらしいんだけど、女の平均と女の標準偏差と男の平均3つ解ってるから、10-3で自由度7だとおもうんだけどなんで8なの? >>334
ありがとうございます。
病気と精密検査の例について、P(A|B)とP(A|~B)が余事象になっていない例を見つけました。
私の持っている2つの本がタマタマ余事象だったので、頭をかかえていました。 この統計の問題の解説について質問です。http://i.imgur.com/N8XggQAl.jpg
@「標準誤差が1/√n」と書いてありますが、標準誤差は「母標準偏差/√標本数」なので、母標準偏差を1としているようで
すが、母集団の変動係数を1としたところでなぜ母標準偏差も1となるのでしょう?
A「標準誤差が1/√nとなることより、変動係数は1/√nとなる」とありますが、変動係数は「標準偏差/平均」なので、なぜこの場合標準誤差=変動係数となるのでしょう? 入門書にも証明抜きで特性関数くらい載せておけばいいのにね 大学のときに少し統計学を学んで、統計検定の2級を取得しました
それかな3年ほど統計学にはほぼ触れてなかったのですが、
このたび仕事上で必要かなと思い、統計学を再度勉強しなおそうと思っています
2級の内容も少し忘れているので、復習しつつ、準1級を取得しようと考えています
ここで質問なんですが、2級程度から準1級レベルに引き上げるのにおすすめの本を教えてください 100%の120%は120%
120%の100%は100% 統計学の線形モデルについて質問です
帰無仮説や対立仮説の線形モデルを示す場合どのように示せばいいのでしょうか?
変動因や自由度など、グラフなどは示されているのでどこを参照すればいいかも教えてくださると幸いです >>340
> 日本統計学会公式認定 統計検定1級対応 統計学
統計学の先生方が、威信をかけて書いてチェックしているので
間違いがないし、大変にわかりやすいと思いますよ。 ポアソン過程って時間t1で平均してλ回起こるとき、時刻t1'(0≦t1'≦t1)までにn回起こったら、そこからt1までにパラメータ λ-n のポアソン過程になるってこと? とあるネトゲで正規乱数を用いているかどうかひたすらデータをとっているのですが
とある値 10〜80までを取りうるサイコロのようなものがあり 420回振ったところ 後述のようなデータが取得できました。
これを見ても正規乱数か偏りのある乱数かさっぱり分からないので
■71面のサイコロが取りうる シャノンのエントロピーの理論計算値 ln71/ln2 = 6.149 と
取得されたデータから演算されたエントロピー量 6.0348600 が異なっていることから
いまのところ乱雑さが不均一である と結論付けているのですが この推論で正しいでしょうか。
■母数を今後増やしていく予定ですが
乱雑さが一様である指標はどのような検算手法があるでしょうか
教えてくださいよろしくお願いします。
#データ
Mean 45.6857142857143
Standard Error 1.01877620542104
Median 47
Mode 61
Standard Deviation 20.8786992369611
Sample Variance 435.92008182748
Kurtosis -1.24389590175393
Skewness -0.04860680391101
Range 70
Minimum 10
Maximum 80
Sum 19188
Count 420 あんまり乱数の検定とか知らないけど、10〜80だったらすでに正規乱数ではないのでは 乱数と言われるサンプル列が正規分布に従っているかと
そのサンプル列がどの程度ランダムであるかは意味が違う
例えば正規分布に従うサンプルを昇順に並べ替えても
正規分布に従うけど、それをランダムとは普通は言わない
前者は統計的な分布の検定の問題で
後者は時系列的な相関性とか周期性の問題 >>346,347 ありがとうございます。根本が相当おかしかったようです。
取っ掛かりが見つけられそうです。
周期性の観点からある程度均一な時間間隔でサイコロをふるようにしてみます。
乱数の検定は https://en.wikipedia.org/wiki/Diehard_tests このような物があり
どうもサイコロのような周期性を持つ物の測定はできないようですが
乱数表を渡すと各種検定を自動的に行う
linuxやUnix用の http://www.phy.duke.edu/~rgb/General/dieharder.php
ソフトもあるようです。
検定/母数/母対数 という言葉も345を書いた時点ではイマヒトツだったので勉強してきます。
大変参考になりました!ありがとうございます。 統計学入門 (基礎統計学)の次に読む本は何がいいですか? RMA回帰の簡単な計算方法おしえてください。
↓ここに書いてある(yの積和)、(xとyの積和の符号)って何のことだかわかりません
http://www7.atwiki.jp/hayatoiijima/pages/23.html#id_f9dfc20e 正規分布についてわからないところがあるので、ご存知の方がいたらご教授お願いします。
「正規分布は、2項分布P(N,n)=binom(N,n)p^n(1-p)~(N-n)において、Nを大きくしたときの極限である。」
と、どの教科書にも書かれています。(binom(N,n)は2項係数)
ところがその証明になると、log(n!)に対してもStirlingの公式を使っていて、Nだけでなくnが大きい場合でないとその証明は成り立たないようです。
正規分布は、2項分布においてNとnを大きくしたときの極限なのでしょうか? Nがいくら大きくても、nが小さいと正規分布にはなりませんか? >>354
回答ありがとうございます。
なるほどそうですね。
Nも∞、nも∞、平均も∞、n-Npは0、そんな海の中を漂うわけですか。 >>353の疑問はボクも感じていたところ。
たいていの教科書では2項分布の対数をとって、平均の周りでtaylor展開して2次の項まで求めるんだけど、対数を2次でとめてりゃ、そりゃgaussianになるはずだ。
もうちょっとしっかり書いてある本ってないのかな? 初歩すぎるかもしれないけど質問です。
E(Xバー)=μ
V(Xバー)=(σ^2)/n
になるという結論は覚えられます。でも結論を覚えただけって感じです。
E(Xバー)=E(1/n・ΣXi)
=1/n・E(ΣXi)=E(X1+X2+…Xn)ってなってE(X1)=E(X2)=…=E(Xn)=μだから
E(Xバー)=1/n・nμ=μになりますよね。
でもこのE(X1)=E(X2)=…=E(Xn)=μってのがよく分かりません。そもそもX1とかXnなどは何を指すのですか?
100人の母集団の身長を調べるとき、10人の身長を抜き出すとして、10人の身長のデータ自体がそれぞれX1とかX10になるのでしょうか?
それとも、10人の身長のデータをまとめてX1と呼ぶのでしょうか?
そして1つのデータだけでX1と呼ぶのなら、なぜその1つのデータの平均(期待値)である数が母平均μとなるのでしょうか?
もう訳が分かりません。
拙い文章ですみません。とても混乱しています。どなたか教えていただける方、よろしくお願いします。 >>362そうなんだと思います。
確率変数と実測データの違いはなんですか? あってるか分かりませんが自分なりの考えを書きます
袋に100個の玉が入っていて、それぞれ1から100までの数字が書いてあるとします
その玉を1個取り出して数字を記録して元に戻し、また取りだして…という試行をn回繰り返したとします
この試行で玉に書いてある数字を確率変数Xとすると、1回目に取り出した玉に書いてある数字がX1、2回目がX2、n回目がXnということでしょうか?
そして、X1というのは取り出す可能性のある母集団である1から100までの数字のすべてを取りうるので、E(X1)=E(X2)=…=E(Xn)=μ=50.5ということでしょうか?
アドバイスいただけると助かります >>365実測データは測った値そのままだから定数で期待値などなく、確率変数は母集団から持ってくるあらゆる値を取り得るのだから期待値は母平均μということでしょうか? >>360 >>364の例で説明してみる。
n回繰り返すのはおいといて、1回の試行で考える。
1回の試行で、取り出される数は1〜100の100通り。
この100個の数のいずれかを取り得るという意味で、
確率”変数”としてXを与える。
この例ではX=1,2,3,・・・,100のいずれかで、それぞれの
値をとる確率はすべて1/100である。これが確率変数Xの
”確率分布”になる。
このとき、確率変数Xの期待値はΣ_{k=1}^100(k*(1/100))で
5050/100=50.5(=μ)。分散はΣ_{k=1}^100(k-μ)^2*(1/100)で
3333/4=833.25(=V)。因みにこの分布は一様分布なので、
そちらの公式を使った方が計算は速いです。
さて、ここから>>360の公式ですが、確率変数X1〜Xnは同じ
”確率分布”に従うものとします。今回の例では、n回取り出すと
考えて、k回目に取り出した数が確率変数Xkの値としてよい。
n個の確率変数から、新しい確率変数XバーをXバー=(ΣXk)/nで
定めると、Xバーについて、>>360の公式が成り立つわけです。
で、恐らく公式の意味するところがイマイチ実感出来ないと思われる
のですが、これはXバーの確率分布を考えれば理解出来ると思います。
Xバーの取り得る値の範囲は1〜100ですが、一様分布になって
いないのは明らかでしょう?(Xバーは1や100の値はとりずらく、
平均値付近の値はとりやすい。だから分散の値は小さくなる) >>367解答ありがとうございます
試行が1回だと確率変数はXだけで置けるけど、2回も3回も繰り返すから添え字をしてX1やらXnやらとするのですね。
うーん分からないことが多すぎて何が分からないのか自分でも分からなくなってきました。
表記のしかた(Xとxの違いとか)や、無作為抽出といいますが、標本抽出の仕方自体(n個の標本を抽出するということは、n個の測定値を1回取り出してそれを1つの標本とすることをn回するのか、1個の測定値を1つの標本とすることをn回するのか)
難しく考え過ぎですかね。ここまでここで考えすぎない方がいいですかね >>368う〜ん、うまく伝わらなかったか・・・
試行の回数は関係ないよ。たとえば、さっきの例で言うと、
5回やってその平均の値を確率変数Xにしてもいいし。
そのときは各確率変数Xkも5回やった平均値とすればいい。
ともかく、確率変数と確率分布のことをもう一度最初から
テキストを確認するなどして勉強し直すことおすすめ。 >>369そうですねー…丁寧に教えていただいているのにすいません。
高校数学までは納得できることが多いのですが、統計学となると納得できないことがまだ多いです。
もう一度分からないところをテキストなどで見てみます。 かなりしっかりした統計のテキストでも確率変数に関しては曖昧な定義で留まっていることが多い
どうしても納得できないならルベーグ積分の可測関数を勉強することをおすすめする と思ったが
>高校数学までは納得できることが多い
これだと可測関数までに勉強することが多すぎるかな 結局、実測値と確率変数を混同してたので混乱が広がってたってのが大きいので、それに気付けただけでも大きな収穫です。
>>371統計のテキストって曖昧な定義も多いですよね。
元々数学は好きではなかったので、具体的な例から公式などの抽象的なイメージにしていけると一番理解が進みそうなのですが、そんな都合のいいテキストなかなか無いですよね 確率空間が定義されないと「確率変数:確率空間で定義された写像」も定義できんわな 写像なら関数と呼んだほうが良いような気がして20年 教えてください。『21世紀のジェンダー論』『法社会学への誘い』で
二宮周平という著者が杉並区の調査(区内に住む20歳以上の男性935人が回答)から
日本全体を語っているのですが、信用していいのでしょうか?
他にも杉並区内の調査と内閣府の全国調査を突き合わせて語っていますが…?
レベルの低い質問ですみません。 A群の調査結果からB群もたぶん同じだと仮定すること自体は自由
この仮定が正しいかどうかは実際にB群を調べるまで分からない
その分野の専門家として合理的な推論だと思えたら信用すればよい
純粋に統計的に云うならば全く信用できない論法だと思うが、
逆に統計的に反論するには自分で全国調査をする必要がある 一般社会では「期待値」という言葉が
期待で盛った値
という意味で使われていて紛らわしいです
これはexpected valueに対する日本語訳が適切でなかった事が原因に思います
「見込値」
とかに変えたら? >>380
ありがとうございます
>>382
挙げられている杉並区の調査(男性935人が回答)は
(1)「男性の持つ女性の働き方についての意識と、夫婦の姓の選択」
(2)「性別役割分業意識と、夫婦の姓の選択」の結果です。
結果は相関関係あり(ただし相関係数は出してない)、とのことですが、
(1)の人数をすべて合わせても802人、
(2)の人数をすべて合わせても929人にしかならず困惑しています。
また、選択的夫婦別姓という制度が認められた場合どうするか、
という仮定の上での質問が含まれていて、信用していいのかどうか…。
もっと言えば、意識と意識の関係を集計して見ていますが、
社会科学の統計でよくあるんでしょうか。珍しい気がしています。 >>379
信用できるできないの基準が不明なので回答不能だが
全国調査されたものと比べれば信用ならんが
杉並区の特殊性を疑う根拠すら提示できずに類推にケチつける奴よりかは信用できそうだ
>>383
>珍しい気がしています。
珍しいか珍しくないかが分かる程度にお前が社会科学に詳しいなら珍しいんじゃねーか? >>383
意識と意識ではないでしょう
意識と行動でしょう
意識と意識だとしても何か問題ある?
仮定だと何か問題ある?
確かに相関係数がわからないのでなんとも言えませんが
相関係数によっては十分なサンプル数でしょう 困惑していますだの珍しい気がしますだの心情吐露されても知らんがなとしか
ID:le3B6dtsが困惑してるかどうかなど誰も興味ないからな 位相変換 p点とp'点では異なる位相で観測
http://faustus.xii.jp/uploda/src/file747.htm
設問 SVG数学
正弦波とpとの交点から
正弦波とp'との交点を
結んだ直線を黄色で描け >>384>>386
文章の意味が不明確で答えるのが難しいですね。
質問させてもらい、調査結果に興味を持つ人が現れたから
結果を示し、関連した疑問を記したまでのことですが?
「困惑」「珍しい」ことについて信用できるかとの趣旨の質問なわけで
珍しくないなら既存の統計を紹介するなりしてくれればいいのですが、
詳しくないなら無理に答えてもらわなくて結構ですよ。
社会科学の統計では階層と意識の関係を見る場合が多く、
意識と意識の関係を見るのははっきり言って珍しい。
心情しか理解できない、詳しそうでないアナタにはそう言えます。
もし選択的夫婦別姓制度が認められた場合、夫婦の姓をどうするか、
という仮定の上での質問も珍しい(後述)。アナタにはそう言えます。
一部の地区から全国を類推する統計も珍しい。
都市圏と地方を比べる統計は多く存在し意識傾向が異なるので、
杉並区から全国を類推するのは不適切です。アナタにはそう言えます。
『21世紀のジェンダー論』で二宮周平という著者も全国調査を元に、
大都市で導入に賛成と回答した人が多いと書いているくらいです。
ちなみにこの著者は選択的夫婦別姓制度導入に反対する人たちの
理由は何なのかを論じています。
ここはまずどんな人たちが制度に反対しているかを見るべきところです。
すなわち上述の仮定そのもにどんな人たちがどんな認識・意見を
持っているかが重要でなわけで、(1)(2)ではそれが分からないのです。
偏愛する杉並区調査には制度に反対かどうかの質問が
元々なかったのか、この著者は示すことができていないのでした。 複数科目の偏差値は単独科目の偏差値より低く出るって本当? 「複数科目の偏差値」を定義しないとその質問には答がない >>389
>都市圏と地方を比べる統計は多く存在し意識傾向が異なる
意識傾向が同じならそもそも類推にならない
>杉並区から全国を類推するのは不適切です。アナタにはそう言えます。
類推の適切さ不適切さを判断する基準は? >>391
定義くらい文脈から推定して適切な回答しろやボンクラ 【悲報】統計学を理解していない低能モメンがフルボッコに論破されるw
http://fox.2ch.net/test/read.cgi/po verty/1443208917/ >>395
2chのアドレスって、そのままだと目玉が出るんだっけ? こういうのだろ
http://mathmathmath.dotera.net/ ・
Rock54: Caution(BBR-MD5:4d530d62ff3cf059fa11550d53e73292) 👀
Rock54: Caution(BBR-MD5:4d530d62ff3cf059fa11550d53e73292) >>379
杉並区のデータから推定した母数と
全国のデータから推定した母数を
等しいとする帰無仮説を立てて検定してみるとか? >>390
複数科目の偏差値を
複数科目の得点の合計値の偏差値とすると
単独科目が比較優位の有無で違う気がする 他の数学スレはレベル高いのに統計学スレは小学生みたいな質問ばっかりだね。
やっぱり統計学は数学じゃないのかなあ もし2つのサイコロの同時分布関数を考えた時に、出る目は36通りある
このときに(1,1)の目が出た時は1/6かける1/6
(1,2)が出た時は1/6かける2/6みたいなイメージでいいの?
(6,6)がでたときの値は1であってますか?
あまりよくわかってないので質問が拙いですが、どなたかご回答お願いします >>404
数学を使うからって統計学自体が数学なわけないさ >>405
何を質問しているのか不明確なので答はない。 >>405
どの組み合わせでも1/36の確率じゃないかな
2つの合計値を確率変数としたら違う分布になるだろうけど >>408 どの組み合わせも1/36だということは理解しているのですが、分布関数は累積されるという認識なので、確率変数が二つ以上の場合はどう考えるのがよいのかと悩んでいます >>409
xy平面上に確率分布が1/36で広がるのでは?
2次元の確率分布 >>409
確率変数が連想型の場合は
確率密度関数だけど
離散型は確率分布関数
確率密度関数を積分して確率を求める >>409
累積分布関数の定義なら
Φ(x)=P(X≦x), Φ(x,y)=P(X≦x,Y≦y) 箱が5個あります。それぞれ A,B,C,D,Eとします。その中に一つ当たりが入っています。
司会者は当たりの入っている箱を知っています。
司会者は回答者に「当たりが入っていると思う箱をお選びください」といいました。
回答者はAの箱を選びました。
司会者は「当たりが入っていない箱を一つ開けます。ただし回答者が選んだ箱Aは、当たりが
入っていてもいなくても開けません」と言いました。
そして、当たりの入っていない箱Eを開けました。
問題
残りの箱はA,B,C,D,の4個です。
それぞれの箱に当たりが入っている確立を求めて下さい。 >>404
数学の大半は素人には興味も理解もない分野だからね
一般人が関心を持つのは、統計学くらいじゃないの? それと確率もね
この板には時々パチンカスとかが質問しにくる 確率分布は確率変数xに対応する確率で、分布関数は確率変数がある値までとる確率ですよね。
同時確率分布は変数が2つの場合、2つの確率変数が同時に起こる確率。
では同時分布関数はどう解釈すればよいでしょうか。
2つの変数の分布関数の積を確率としたものでしょうか 入門数理統計学(ホーエル)の11章問題5の解答が理解できずにいます。
問題はこんなかんじ
「10行4列の実験データの分散分析で列平均が等しいという仮説の検定を行い、有意となった。
そして列平均のうち最初の2つが他よりも大きい値を示していた。
Fの分母に当たる自由度36の誤差項平方和は180だった。
今仮説H0:u1=u2を対立仮説H1:u1>u2に対して検定したいとして、差u1-u2=1を
確率0.9で検出するためには各組み合わせ(最初の2列に対応する処理と後の2列に対応する処理)に対して
とるべき等しい標本の大きさはほぼいくらぐらいにすべきか」
これで解答は86(原著の解説ではn=85.3より86とだけ書いています)になっていました。
ここでいうFの分母はたぶんΣΣ(Xij-E(X.j))^2のことっぽいのですが、
これだとこの変数の分散の期待値は5になるため、せいぜい30くらい標本をとればいいんじゃない、と思えてしまいます。
どなたか統計に詳しい方、解説していただけないでしょうか? 正規化しない分散の値の大小を論じる意味ってあるのかな >>424
分散の正規化、というのはなんなのでしょう?
確率変数の標準化ならわかるような気もするのですが…
(ホーエルには標準化という単語はありませんでしたが、
たぶん変数から平均を引いて標準偏差で割る操作のことですよね?)
以下私がどう解こうとしてしくじったか言葉足らずだったので追加します。
たぶんですがこの章(実験計画法)では「変数の分散はすべて等しい」という条件があるようです。
その条件のもと、とりあえずFの分母が分散×自由度を示しているようなので、分散=5くらいかと計算しました。
(試しに(標本分散×標本の大きさ)/母分散がカイ二乗分布に従うことを使って推測してみても、有意水準95%で
せいぜい7以下程度に収まるようです)
そのうえで母分散を約7(正確にはカイ二乗分布から推測した区間の端の値)と置き、
大標本法で計算したところだいたい40以下という結果になってしまいました。
アクチュアリ試験用の教科書とのことなので、この問題を実際に解いた方、
もしくは解ける実力をお持ちの方がこちらには多数いらっしゃると信じております。
ぜひよろしくおねがいします。 P( sqrt(n/2) * (µ_1 - µ_2)/sqrt(5) - z(0.95) ≥ z(0.90) ) = 0.90
で
µ_1 - µ_2 = 1
なんだから
n = 2 * 5 * (1.645 + 1.282)^2 >>427
なるほど、私はz(0.95)の項を考えていなかったんですね。
確かに90%の確率で有意水準95%を満たすようにnを設定しろ、という意味なんですから
u1-u2そのままの1ではなくz(0.95)を使うべきでした。
ありがとうございました。
一緒に問題を考えてくださった他の方にも、お礼を申し上げます。 統計の読み方がわからないんですが
質問させて下さい
http://i.imgur.com/ofGD8OY.png
この論文の表現で、red meatとprocessed meatのリスクには有意差があると言えますか?
どのような検定をすれば良いでしょうか >>429
risk の定義がここに書いてない (リスクマネジメントでは不確実に起きるものはプラスの影響もリスク)
increased risk しなかった人がどういう状態なのか書いてない
データ数が書いてない (少ない場合はベイズ的検定をする)
red meatとprocessed meatを両方食ってる場合はどういうふうに変数分離してるのか書いてないので検定のしようがない
検定以前の問題 「相関」を統計学擁護だと言い張る北退が自作自演で頑張っているので、数学板の皆さん、ぜひこの自作自演老人に
正しい言葉の意味を教えてやって下さい
942 名前:名無しさんの次レスにご期待下さい@転載は禁止[sage] 投稿日:2015/11/11(水) 21:27:19.94 ID:jL1fuIcZ [3/6]
>>938
まあ所詮は、「相関は統計学用語!(キリッ」とか言い出しちゃう中卒工場上がりだからねぇ
943 名前:名無しさんの次レスにご期待下さい@転載は禁止[sage] 投稿日:2015/11/11(水) 21:28:22.43 ID:4G8Z3DhZ [2/3]
違うのか?
946 名前:名無しさんの次レスにご期待下さい@転載は禁止[sage] 投稿日:2015/11/11(水) 21:47:44.28 ID:jL1fuIcZ [4/6]
>>943
違うんだなあ、それが
そろそろタネをバラすと、相関関係を分析するのに統計を使うことがあるというだけで、
相関が統計学用語という訳じゃない
ノースは低偏差値だから相関の意味が理解できず訳も分からずググったら、統計学のサイトかなんかが
出てきたから、そのまま「統計学用語!(キリッ」ってやっちゃった訳だ
あとはひたすら恥の上塗りだけど、50過ぎて荒らしやってる病人なんだから、今さら恥も外聞ない 相関(Correlation)が、統計学が扱う前から、統計以外の数学全般での分析対象であったかどうかは即答できない
今現在、統計学以外の数学の対象になってるから統計用語ではない、という意味なら、ヒストグラムですら統計学用語ではない 基本統計学〔第4版〕出てたのか!知らんかった
16年ぶりの改訂か、買ってくる ゴルトンさんのCo-Relations and their measures(1888)が最初っぽい マジかー
検定料払ったのに私用で受験できなかったから悔しい 通信可能なコンピューター持ち込み可でスクリプトで検算するのもOKにしないと統計力は分からない 10打数4安打の選手と100打数30安打の選手のどちらを代打に使うか
というのを決めるのはどうすればいいんですか?
なんていう分野を勉強すればいいですか? >>443
ベイズ推定
俺が出席した学会では患者4人に対する試験で薬の効果を力説してた >>447
確かに、堅くいくなら母比率の低側の値で比較、ばくち打つなら高い側の値で比較でいいのかも。
どういうとき堅くいくべきか、どういうときばくち打つべきかによるだろうけど。
ゲーム理論のミニマックスとかマキシマックスとかそんなのに近いか。
>>448
ちょっとそんな気はしたけど、詳しくは知らないんで勉強してみる。 ある大学ある学部の男性25人について調査した。身長の平均171.3p、標準偏差9pで、身長を確率変数Xとし、Xは正規分布に従っているものとする。
全国の同年代男性の平均身長は171.65pである。男子生徒の身長は、全国平均と同程度といえるか。
(1)仮説をたてよ。
(2)検定統計量の実現値を求めよ。四捨五入で小数第3位まで
(3)有意水準5%で棄却域を定めよ。四捨五入で小数第3位まで
(4)検定結果を示し、結論を述べよ。
これを教えて下さい >>455
「有効桁数が全部違うので問題として不成立」 が正解 数年ぶりにR開いたらデータの読み込み方から忘れてて笑った 助けてください。
卒論で統計学使ってる学生です。
わからないことがあるのでご教授お願いします。
ある商品の購入時に重視する点について項目(価格の安さ、製造国など)を設けて5段階で重視するかしないかのアンケートを行いました。その後その商品に関するプレゼンテーションを行い、同様のアンケートを行いました。
この時ある項目aの重視度合いが3から4になったとします。そうするとプレゼンテーションによって重視度合いが1高くなったことがわかります。
ただ、重視度合いが2から2になった人の0と5から5になった人の0はプレゼンテーション前後の差を得点として考えると同じ値になってしまいます。
なので前後の差に1つ1つ意味を持たせたいのですがどのようにすればいいでしょうか。前後の差に重みを付けて、その差を得点として因子分析を行いたいと考えているのですが、どのような方法がありますか?
統計学の知識は統計検定2級レベルです。
とても困ってます、よろしくお願いします。 >>459
マルチノミアルプロビットはどうだろう
しかもマルチバリエート
でプレゼンダミーをいれる
データ数にもよるけどね >>460
ありがとうございます。
サンプルサイズは40です。
1度試してみます。 459です。
先程の質問なんですが2から2の差0と5から5の差0に意味を付けたいといいましたが、
そもそも前後の値の平均値でt検定をおこない有意差がなかった場合、前後での変化はあるともないともいえないという風に解釈すると、前後での差に1つ1つ得点を付けることは不毛なことなのでしょうか? >>462
そもそも正規じゃないからt検定は使えない
結局マルチノミアルプロビットのプレゼンダミーをプレゼン前の値で表すようにするのがベターだと思うけど
マルチバリエートは勘違いだった、すまん >>463
マルチノミナルプロビット分析は0から1の値を推定?する分析だと思ってたんですけど(購入率とか)、どうなんですか?
ちょっと分析結果をどう考察していったらわからなくなりそうです。
この分析をするとどういう値が求められるのかざっくりとでいいんで教えてください。
勉強不足ですいません。 >>459
> 重視度合いが2から2になった人の0と5から5になった人の0はプレゼンテーション前後の差を得点として考えると同じ値になってしまいます
そりゃ、前後で変化していないんだからプレゼンテーションによって変化はなかったとしか
結論づけられないと思う。そんなところに無理やり意味付けを与えようとして分析しても、
意味あるように思えん。卒論ならもっと素直にデータ解釈すればいいんじゃないの、と思う。 数字ではあるけど間隔尺度や比例尺度ではなく
順序尺度か名義尺度じゃないの?
数値比較に意味が有るのかな? 459です
>>465
確かにおっしゃる通りだと思います。
前後での差とプレゼンテーションに対する興味度合いで重回帰分析をして、プレゼンテーションが与える効果を考えたかったのですが、差があまり出ずに困っていました。
少し血迷っていた部分があると思います。もう少し色々と試してみてダメだったら、差がなかったことも結果と考えて考察していこうかなと思います。
>>466
どうなのでしょう?
5段階満足度と同じように間隔尺度として扱えると思っていたのですが、間違いでしょうか? >>464
マルチノミアルというかこの場合オーダードプロビットだけど、0-5の被説明変数に対して説明変数がどのくらい寄与するか測れるよ
データ数によるけどプレゼン前を0-5のダミーにするか0-2,3-5みたいにわけるかして
でその係数が有意か見る感じ
それかせめてノンパラ検定かね
ただプレゼンの効果が評価低い人を高くするならそれをどうにかモデリングしないといけないし、それに意味はあると思うけど 459です。
すいません、
少し頭が混乱してきました。
オーダードプロビットについて1度調べてきます。ありがとうございます。
プレゼン前後での変化量について、因子分析をおこない、変化量の共通因子を把握して、それがプレゼンによる効果であるという風に結論付けたいと思っているんですが、このオーダードプロビット分析をおこなえばそれが可能ということですよね? >>469
プレゼンの効果があるのならば他の因子でコントロールして測るべきだとは思う >>469
https://en.m.wikipedia.org/wiki/Ordered_probit
これの説明変数にAR1みたいにプレゼン前をダミー変数としていれるかんじね
ただデータ数少なかったら識別できないからグループに分別するのもありってかんじ
Rにパッケージあるはず あるサイトによると
ベイズ統計においては、パラメータは確率変数、データは定数ってことになってます
しかし、ベイズ統計を使った画像修復においては
パラメータ(原画像のピクセル)もデータ(劣化画像のピクセル)も確率変数です
データも確率変数だと思いますが
定数 or 確率変数、正しくはどちらですか? >>472
一枚の画像と考えたらピクセルは定数と解釈出来るのでは?
対象とする画像が複数あるならピクセルも確率変数と考えられる
定数を確率変数の特殊な場合
ある値を取る確率が1
と考えれば確率変数とも解釈出来る >>473
ありがとうございます
やはり、ベイズ統計においては、データも確率変数だと思うんですよ
ベイズ統計を使って画像を修復するとき
原画像にノイズ(確率変数)が加わって劣化画像になったという劣化モデルを想定します
手元にある劣化画像は劣化モデルに従って変化するもののうち
たまたま得られたものと考えられるので、データも確率変数だと思います
画像修復に限らず、ベイズ統計は事後分布を求めるために尤度と事前分布が必要で
尤度はP(データ|パラメータ)であり、データが定数なら
P(データ|パラメータ)はナンセンスでしょ
パラメータは定数である伝統的統計だってP(パラメータ)はナンセンスでしょ
ベイズ統計ではデータは定数ってことに納得できません ポアソン分布に従うとき、その事象の発生時間間隔は指数分布に従うとあります。
この逆は成り立ちますか? つまり、事象の発生時間間隔が指数分布に従うとき、λt時間の間に事象が発生する回数の確率分布はポアソン分布に従いますか? 統計学のど素人なんですが一般にサンプル数が多いと有意性は出やすいので
サンプル数に応じた有意水準を設定したいのですがそういうのはダメでしょうか? 統計を勉強しないで統計を使用するとは、松原先生もきっと嘆くであろう >>477
ポアソン分布との適合度検定をしてみるとか >>477
ポアソン分布はもともと
馬に蹴られる事故が発生する時間間隔を変数として
その発生確率をプロットした分布じゃなかった? ああ、ググればそう書いてあるね。
(私は皮肉を言っています)
運営おつ 一度事象が発生してからの時間を変数とすると
その時刻までポアソン分布を積分した確率で
次の事象が発生するという事だよな
電話の呼とか 違った
ポアソン分布は
単位時間に平均λ回起きる事象が
単位時間にk回起きる確率か
確率変数は回数
アーラン分布は
kフェーズ掛かるサービスが完了する時間の分布
確率変数は時間 ポアソン分布のパラメーターλが未知で、これまでのサンプルによる平均値しか得られていない場合、λの区間推定はどうやりますか? >>477
逆も成り立つ
確率論の本でポアソン過程を調べれば、たぶんすぐ見つかる マ イ ン ド コ ン ト ロ ー ル の手法
・沢山の人が、偏った意見を一貫して支持する
偏った意見でも、集団の中でその意見が信じられていれば、自分の考え方は間違っているのか、等と思わせる手法
・不利な質問をさせなくしたり、不利な質問には答えない、スルーする
誰にも質問や反論をさせないことにより、誰もが皆、疑いなど無いんだと信じ込ませる手法
偏った思想や考え方に染まっていたり、常識が通じない人間は、頭が悪いフリをしているカルト工作員の可能性が高い
靖 国 参 拝、皇 族、国 旗 国 歌、神 社 神 道を嫌う カ ル ト
10人に一人は カ ル ト か 外 国 人
「ガ ス ラ イ テ ィ ン グ」 で 検 索 を ! >>474
いっとくけど一般にベイズ統計でも観測データが確率変数だとすることはできるよ
ただ、そうすると分析が複雑になるからしないだけで >>487
中心極限定理から平均値の分布は正規分布になるんじゃね?
平均値の区間推定と同じ感じで出来ると思う >>490
ベイズ統計で観測データを確率変数とすると、定数とするときより分析が複雑になるのはなぜですか?
具体例も教えて頂けるとありがたいです
お願いします 具体例も何も例えば単回帰みたいな簡単なモデルでもつくって
説明変数が定数の場合と確率変数の場合でどうなるか計算してみるといい
すぐに後者の方が難しいと気が付くだろう
気が付かないのなら、そもそもベイズ統計学理解してないだろうから説明しても無駄になる (未来に見つかるかもしれない)簡単な分析手順をしらない
と
本質的に分析が難しい
は違うと思う 数学一般についての不完全性が統計的手続きにより証明された以上、数学と統計は同じモノです 役に立たなければ価値が低いんじゃね?
サイエンスなのかエンジニアリングなのかの違い 統計学は数学だとか言ってる人って数学は自然科学とか思ってそう・・・
ようするに科学分類の基礎的な知識がない 数学には純粋数学と応用数学という分類があるのを知らない人、
もしくは意図的に応用数学を無視したい人が>>502のようなことを言いそう ん?統計学は応用数学に含まれるよ
そんなの誰でも知っていると思ったんだが、>>503はそんな低レベルな事から言い始めるの? やっぱり「もしくは」の方に含まれる人だった
おまけに負けず嫌いらしい 俺の当初の推測通りだったんだから、言い返すことなんてあるわけないだろ?
>>505の意図は掴みかねるけど…もしかして「応用数学を数学とは認めない高貴な俺様の精神的勝利!」ってところ? さすがに応用数学がー純粋数学がーとかいってるのは高校生だろ 本当に負けず嫌いだねえ
誰でも知っているはずの「統計学は応用数学に含まれる」という事実を差し置いて、
「科学分類の基礎的な知識」を自分の好みで歪めた時点で決定的に矛盾してるんだよ君は
それとね、>>503の二択を提示された時点で君がプライドを守るためには、黙秘か>>505のような煽りしかなかったんだけど、
後者を選んだから負けず嫌いだと判断できた
誘導されてたことに気付いてなかったでしょ 分類よりも
>>497
が元々のテーマじゃね?
理論的に解決できても現実的じゃなければ産み出される価値は少ないと思う No
応用数学を工学部に押し込める日本の学術体制のダメなところだね
そもそも経済とかにも統計学者はわんさかいる >>514
マーケティングとかにも応用されてると思うけど 理論だけじゃなくてフィールドとか実践と両輪が必要だと思う
物理でも実験で確認できなければ仮説に過ぎない
近大が話題になったのは実践が伴っているからだろう すみません、どなたか助けてください。
統計初心者で、調べても調べても分からず、藁にもすがる思いでここに書き込んでいます。
例えば、↓で示したような複数のトライヤル(1〜4)で、ZとYの相関を調べたいんです。
順番は関係なく、ZとYが同じトライヤルで出現する確率?というのでしょうか…。
実際にはトライヤル数ももっと多いです。例として4つ書きました。
ちなみにエクセルしか使えるソフトがありません。
1 ABCAXYABCZAB
2 ABCABCZABCAB
3 ABCABCABCABC
4 ABCBAYZABCAB
ピアソンで処理していたのですが、ピアソンは数量の相関だと聞き、
今回調べたいのは出現の有無(yesかno)なので当てはまらないのではないかと
かなり焦っています。
どなたかどうかお助けください。 >>517 です。
調べていたら、 エクセルの CORREL にあたったのですが、
この場合使えますか?
Y Z
1 1 1
2 0 1
3 0 0
4 1 1
:
という風に、出現=1、出現しない=0 に置き換えて、
CORREL(全セル) したら、それっぽい数字が出てきたのですが…。
困り過ぎてひっくり返りそうです…はぁ…。 ??
ただ単にYとZが出てるトライアルの数を全体で割ればいいんじゃないの? >>519 さん、ありがとうございます。
それだと、YZ両方出てきたときの確率になってしまいますよね?
Yは出てきたけどZが出てこなかった、
Zが出てきたけどYは出てこなかった、という結果も含めて
相関を出したいと思うのですが…
すみませんなんだかよく分からなくなってきました。
>>ただ単にYとZが出てるトライアルの数を全体で割れば
これで出てくる数字で、「YとZに相関があるかどうか」と言えるのでしょうか?? >>521 さん、ありがとうございます。すごく近い、気がするんですが
これはどうもエクセルでは出来ないようですね…?
とりあえず今あるデータはエクセルで
出現→1 出現しない→0 という風に表にしました。
Y Z
1 1 1
2 0 1
3 0 0
4 1 1
・
・
・
10 1 1
という具合に。エクセルの CORRELを使うと、0〜1で相関が
出てくるのですが、統計学的に間違っているということですよね? χ^2検定では、次のようにします。
トライアルを次の4つのいずれかに分類し、数え上げます。
T0:YもZも出現しないトライアル数
T1:Yは出現するが、Zは出現しないトライアル数
T2:Yは出現しないが、Zは出現するトライアル数
T3:YもZも出現するトライアル数
そして、χ^2=(T0+T1+T2+T3)*(T0*T3-T1*T2)^2/{(T0+T1)*(T2+T3)*(T0+T2)*(T1+T3)}
を計算します。これが3.84より大きければ、YとZの間に相関があると考えて良い。
(3.84というのは、自由度1のχ^2分布 のα=0.05の値です) >>523さん、ありがとうございます!!!やってみます!!! 偏相関係数と言うのがあるみたい
頑張ればExcelでも計算出来るのでは?
アソシエーション分析も条件付き確率とか計算していけばできない事は無いと思う
大変そうだけど 皆さんありがとうございます。
YとZとの相関だけではなく、例えて言うならA〜Z全ての相関を見て、
どのアルファベットとどのアルファベットがよく一緒に出てくるかを表さないといけませんでした。
数が多すぎてアソシエーションだとかなり大変そうだと気が付きました(進めてみたのですが) >>526
それらの組合せも必要だと思う
AとCが同時に現れる時はZが現れやすいとか 統計学を学び始めたばかりの初心者なのですが
『n=100、標本平均=38.21、標本標準偏差=1.23で、「母平均μは40より小さい」という仮説を有意水準1%(両側検定)で検定しその結論を書け』
という問題の解法がわかりません
どなたか簡潔に教えて頂けないでしょうか… >>529
>>530
ありがとうございます
解決しました 平均値の分布について質問です。
母平均μ 母分散σ^2の母集団からn個のサンプルをランダムに抽出したとき平均値をE分散をVとすると
E(x)=μ これは分かる
V(x)=σ^2/n ???
サンプルの分散が/nになる理由が分かりません。誰か教えてください やっぱり、このスレの人たちって、ガン=カタをマスターしてるの? 災害発生後生存率は72時間で著しく下がるといわれています。
しかし、その根拠はどのようにはじき出されたものでしょうか?
何時間で死ぬかなんてあまりサンプル取れませんよね
ポアソン分布? >>537
水食料無しでどれ位生存できるか医学的な知識からとか? >>537
水食料無しでどれ位生存できるかどうやって決定したんですか?
人を殺して実験するわけにはいきませんよね
統計学使わないんですか? >>539
薬の治験とか昔の軍の実験とかマウスとかの実験とかそのものズバリじゃなくても参考になる実験が色々あるんじゃないのかな >>539
医学と統計学は相反するものではないと思うけど? >>539
もともと、人を殺して実験してきました
原爆の爆心地に歩兵を特攻させて影響をみるような実験も70年前まで行われていました
もともと賛否両論あり実験的要素の強かったロボトミー手術ですら禁止宣言がされたのは1975年です >>537
未確認だけど、普通に実データ(発見した時に生きているか死んでいるか)を使って
生存分析でハザード比を計算しているのでは。 大災害が起きると千人単位で死んで百万人単位で傷害を受けるから、データは十分かと 重回帰での予測区間をグラフで帯状に示すのは無理でしょうか? >>545
内挿なら、いろんな本にのってるけど(信頼区間の幅として)、
外挿はガバッと開いてしまうから
ちょっとかっこわるいかもね。
でも、書くことは可能だよ。 ナイーブベイズの誤り確率はどのように式に埋め込むのでしょうか? 分散分析表のF比の右にあるE(V)が調べても出てこず参考書見ても理解できないのですが、どういった意味があるのですか? 失礼いたします
https://www.slideshare.net/mobile/itoyan110/r-14261638
15ページの[他の因子も同様に計算する]と書かれていますが、どうやって求めたものでしょうか?この情報だけでは不可能なのでしょうか? すみません、、次のページで解決しましたm(_ _)m 相関係数rから求めたt=r√n-2/√1-r^2はt分布をするらしいけど
rの分布の確率密度関数のグラフは相関係数が0のとき、1.5とかになるのに
t分布は0のとき0.4くらいだから形が違うけど、どうしてですか? >>553
rの分布とt分布は違う分布だからじゃね?
rを演算した分布がt分布ってことだろ フェラーの確率論とその応用の現代的な代替物って何? 逆正弦定理の証明まできっちり載ってるのは今でもフェラーだけかと 測度論を用いない確率論の本で応用例豊富なもの
という意味なのか? 数量化二類についてですが、複数の説明変数で、偏相関が大きいもの、小さいもの出てきますが、小さいものはデータから外した方がいいのでしょうか。 自分の出したい結論に都合の悪いデータを外すのが成功する研究のコツ 大切なのは主張であってデータじゃないからな…
主張が「主張を裏付けるデータが取れた」のときのみデータのバイアスを排除する必要がある 小さな差を検出したいのであれば外したらまずいのでは。
例えばホテルの顧客であれば、立地・室料が支配的だろうけど、英語対応可能かなど改善の余地はあるわけで。 モデルは相関関係
データは相関関係
因果関係は現れない 戦前の、測度論が日本に入ってくる前の統計学の本は、
広義積分を使って説明してあるからすごくわかりやすいよ。 現代でもほとんどの統計学の本は広義積分を使ってると思うけど 森羅万象の中からわざわざそのデータに注目して収集した理由の説明にモデルの提示が必要
はじめは相関関係しかないが、工夫してちょっとずつ変数分離して相関関係を因果関係に近づけていくのが科学 >>571
なんでも良い
図書館で借りたりして沢山読むのが良い 基礎的な概念と推定、検定くらいしか書いてなくない?
そもそも何をしたいのかに依存すること このスレ(というか、この板)もいろいろツッコミどころが多い。
統計学についてなどは、この人が国内屈指だと思うので、勉強になるよ。
http://kenokabe-techwriting.blogspot.jp/2016/03/blog-post_21.html 自演に見せかけた粘着キチガイの仕事
さっそくマ板の粘着スレで自演だとか、自分自身の自作自演煽りはじめた みんな面倒くさいから「誰が書いたか」で評価してしまうんだよね 因子分析について教えてください。
x_ik = a_i f_k + u_ik
という因子モデルを考えるときは、通常、識別制約を入れて推定しますが、
これはa_i f_kのindeterminacyの問題を解決するためと理解しています。
もし、極端な例として、a_i f_kに興味が無く、u_ikにだけ興味がある場合でも
識別制約を入れる必要はあるのでしょうか?a_i f_kが識別されていてもいなくても
どちらでもいいような気がするのですが。 知識がなく質問させてください。
例えば、0.2 0.6 0.6 0.9 0.4 0.3の6つの数の平均値と最初の3つの0.2 0.6 0.6の平均値の有意差はないと検定したい場合、どの検定を使用したらよろしいのでしょうか?
ノンパラメトリックの検定でいいのでしょうか?
教えて下さい。 >>595
ありがとうございます。
ベイズ検定で検討していきたいです。
ちなみに、なにか簡易的にExcelで解析とかできませんか?
質問ばかりですみません。 横から失礼します
サンプルが少なすぎる場合の信ぴょう性について。
例えば
先月お客が3人来て3人とも商品を買った→100%の人が購入
今月お客が20人来て16人商品を買った→80%の人が購入
なんで今月は割合が落ちてるんだ!という人達に、どのように説明すれば
わかってくれるでしょうか?
ちなみに母集団もなく、いきなりこの数字を持ってきて言われました。
お願いします >>597
選挙の出口調査で例えて、3人中3人が自民党に投票したと答えたからといって、自民党の得票率は100%ではないですよね?
と説明してみてはいかが >>598
ありがとうございます。
そうしたいのですが、お局様がそれでは納得しないようです(涙)
統計学で説明するかってことになったのですが、どうすればいいかわからず
質問させていただきました。
上記を統計学で意味はほとんどないと説明できるのでしょうか
ほとほと困っています >>597
統計で説明するのではなく、モデルを勝手に作って説明すべきかと
4人が買いに来なかった理由を別に見つけるべき 医者関係の学会だと事前確率を勝手に持ってきてベイズ検定してる
サンプル4人で統計的結論出して学会発表してた >>599
単純な母比率(成功確率)の比較であれば、この計算機で求められますよ。
3/3 …… 成功確率38%〜100%
16/20 …… 成功確率58%〜93%
推定区間が思いっきり重複しているので明確な差があるとはいえないです。
ttps://www.thumbtack.com/labs/abba/#Baseline=3%2C3&Variation+1=16%2C20&abba%3AintervalConfidenceLevel=0.95&abba%3AuseMultipleTestCorrection=true >>600-603
みなさん、ありがとうございます。
私自身も統計の知識はほとんどないもので。
教えていただいたことを調べてみたいと思います。
本当にありがとうございました!またお願いします >>604
母比率の推計は単純な計算なので目安程度に使ってください。
商品を買ってくれなかった人に共通の特徴がないかチェックは必要だと思います。
実は(今月急増した)全員外国人でしたみたいな。その場合は英語を話せる店員を配置するなどの対策を考えないとです。 >>605
ありがとうございます。
確かにそうですよね。なぜその結果が出たのかも推測してみたいと思います <関東・東北豪雨>浸水域で脳卒中急増 茨城・常総
ttp://headlines.yahoo.co.jp/hl?a=20160413-00000044-mai-soci
茨城県常総市の堤防決壊で浸水した地域約40平方キロメートルを調べたところ、決壊した翌日の昨年9月11日からの4週間で、脳卒中で入院した患者が11人いた。
前年の9月はこの地域から3人しか出ておらず、脳卒中患者が約4倍に増えたことになる。
常総市2015年9月 62,690人
常総市2016年3月 64,361人
3/62,690 = 0.00478545%
11/64,361 = 0.017091%
信頼区間的に、統計学の観点からどうよ?
小生はもちろん否なんだけど。 >>607
母比率の検定で単純に検定すると
比率の差=0の帰無仮説は有意水準0.05で棄却されると思うが? ベイズ検定って…
どうせベイズファクターの話なんだろうけど
それは「検定」じゃなくてむしろAICとかにちかい方法論だぞ
(厳密にはAICとも思想が全然違うが)
少なくともベイズ検定という言葉は全く別の概念を指す Bayesian Hypothesis Testingも知らないの?
適当なこと言わないほうがいいよ笑
NPHTと違うっていうならかろうじてわからないでもないけど、
そんな狭い検定の定義なんてなんの訳にたつのか >>611
悪いが俺はベイズ統計学で博士号とってる
少なくともお前よりかは理解していることははっきりわかった >>612
奇遇だな笑
まぁ具体的に言い返せないってことは知らないんだろうけど
入門書は分野によって変わるから一概に言えないな
Peter HoffのA First Course in Bayesian Statistical Methodsはよくおすすめされる ちょっと勉強したら、
Andrew GelmanのBayesian Data Analysisがおすすめ
あとは分野次第
特に日本語の本は著者の専門で偏るからな >少なくともベイズ検定という言葉は全く別の概念を指す
>>611はそもそも日本語が分からないようらしいよ あ、やっぱベイズファクターって検定とは呼ばないのか
なんか違和感あるなと思ってたわ 昔、数セミで専門家がAIC分からんと書いてたのはオドロキだったね 重回帰での説明変数選択で、目的変数との相関がほぼ0のものが残ってくるんだがどういうこっちゃ。
他の変数と共存するときのみ効果が出るってかんがえていいのか?こういうこと初めてでわからん。 >>620
多重共線性のチェックはした? よくわからないけど。 共線性はVIFでどの組み合わせも2以下なのを確認してる。
ちなみにもともと20個用意した変数から3個まで絞られた。たしかに感覚的には意味のありそうな変数だと思うけど、元々の相関が無さ過ぎるのがどうなのかなと。 実数と指数の相関を求めるのにcorrelを使ってもおかしくないでしょうか?
大学でてから20年近くたつので自信がないです。
よろしくお願いします。 別に問題はないけど、本来指数じゃないものをわざわざ指数化してるなら、元の数字のまま順位相関でもいいかも 数学は苦手なので、かみ砕いて教えてくれるとうれしい。
相関係数rの期待値は、
近似的に ¥mu_{r}=¥rho-¥frac{p(1-¥rho^2)}{2N}
とも
Z変換後近似的に ¥mu=tanh^{-1}¥rho
とも習ったんだが、この二つに使い分けとかあ? 上は相関係数の期待値
下は相関係数をフィッシャー変換した分布の期待値
じゃないの?いまwikipedia読んで適当に書きました 文系で理解できなかったので質問させてください。
AIC・BICについて説明しなければならないのですが、
AICにおける最尤推定のやり方がわかりません。
ベルヌーイ試行についての説明はなんとなくわかったのですが、
座標軸上のデータの場合はどのように計算すればいいのでしょうか。
見当違いな質問であればすみません。 日本語でおk
てか質問の意味、自分でわかってないっしょ? >>632
はい。正直、ぜんぜんわかってません・・・
AICの導出過程に最尤推定が出てくると思うのですが、
この最尤推定量は近似線との残差平方和の平均であってますか? 最尤推定量っていったときふつうパラメタ?
英語だとMaximum likelihood estimatorだと思うんだけど 導出に関しては(覚えてないけど)モデルとデータのKullback-Leiblerの期待値を計算すればでるんじゃなかったっけ
だから尤度はでてくるけど最尤推定量はでてこなかったと思う
この本(http://www.kyoritsu-pub.co.jp/bookdetail/9784320121904)が詳しいよ
あとはこれ(http://www.ism.ac.jp/~fujisawa/titech/ps/AIC.pdf)とか 観測データセットを得られる確率をパラメータの関数として表す→尤度関数
尤度関数が表す確率が最も高くなる様にパラメータを決める→最尤推定
だと思う >>629
のp21にAICについて軽く触れてある
KLとAICの関係にも軽く触れてある >>626
自己レスだけど。
自分なりに考えてみた。
相関係数rの期待値
近似的に ¥mu_{r}=¥rho-¥frac{p(1-¥rho^2)}{2N} は、相関係数の分布の期待値。
相関係数をそのまま反映してるけど、確率密度関数が複雑で、検定とかには使いにくい。
Z変換後近似的に ¥mu=tanh^{-1}¥rho も、分布の期待値だけど
相関係数をフィッシャー変換したもの分布の期待値で、
相関係素はそのままは反映されていない。
でも、確率密度関数が正規分布になるから、検定とかいろいろ便利に使える。
どうでしょうか? >>639自己レス
>相関係素
相関係数に訂正ダ部 >>639
勉強をすすめて分かったので訂正。
相関係数rの期待値
近似的に ¥mu_{r}=¥rho-¥frac{p(1-¥rho^2)}{2N} は、相関係数の分布の期待値。
相関係数をそのまま反映してる。
有意性検定に利用される
(¥rho=0と¥rho=|1|のときだけ、確率密度関数が正規分布様だから)。
Z変換後近似的に ¥mu=tanh^{-1}¥rho も、分布の期待値だけど
相関係数をフィッシャー変換したもの分布の期待値。
相関係数はそのままは反映されていない。
区間推定に利用される(確率密度関数が正規分布になるから)。 >>631
>文系で理解できなかったので質問させてください。
「文系だから」は言い訳にならないよ
AICやBICが必要なのであればそれは理解しなけれならない
「文系」は理解できないことの免罪符ではない
AICは最尤推定でパラメータを推定することを前提にしているだけで
導出そのものはKL divergenceの推定量を考えているだけ
BICはベイズ統計学の概念である周辺尤度(モデル選択の基準になる)の
近似を与える >>649
俺には無理。
質問した奴が、スレで一番まともで自己解決したという落ちじゃないの? 学校遠足の月別実施数または計画数を知りたいのだが見つからない
どなたか教えろ下さい ¥
>性犯罪者の増田哲也(50歳・東京都足立区千住寿町)が
>8月4日にJR牟岐線の列車内で、午後4時20分ごろから約50分にわたり、
>徳島県内の女性(21歳・専門学校生)の胸や太ももなどを触った疑いで、
>8月5日未明、県迷惑行為防止条例違反(痴漢行為)容疑で徳島県警阿南署に
>逮捕されました。
>
>性犯罪者 増田哲也の供述
>「夏休み期間に、講演活動を兼ねて旅行していた。好みの女性だったのでムラムラした」
> ¥
>性犯罪者の増田哲也(50歳・東京都足立区千住寿町)が
>8月4日にJR牟岐線の列車内で、午後4時20分ごろから約50分にわたり、
>徳島県内の女性(21歳・専門学校生)の胸や太ももなどを触った疑いで、
>8月5日未明、県迷惑行為防止条例違反(痴漢行為)容疑で徳島県警阿南署に
>逮捕されました。
>
>性犯罪者 増田哲也の供述
>「夏休み期間に、講演活動を兼ねて旅行していた。好みの女性だったのでムラムラした」
> ¥
>性犯罪者の増田哲也(50歳・東京都足立区千住寿町)が
>8月4日にJR牟岐線の列車内で、午後4時20分ごろから約50分にわたり、
>徳島県内の女性(21歳・専門学校生)の胸や太ももなどを触った疑いで、
>8月5日未明、県迷惑行為防止条例違反(痴漢行為)容疑で徳島県警阿南署に
>逮捕されました。
>
>性犯罪者 増田哲也の供述
>「夏休み期間に、講演活動を兼ねて旅行していた。好みの女性だったのでムラムラした」
> ¥
>性犯罪者の増田哲也(50歳・東京都足立区千住寿町)が
>8月4日にJR牟岐線の列車内で、午後4時20分ごろから約50分にわたり、
>徳島県内の女性(21歳・専門学校生)の胸や太ももなどを触った疑いで、
>8月5日未明、県迷惑行為防止条例違反(痴漢行為)容疑で徳島県警阿南署に
>逮捕されました。
>
>性犯罪者 増田哲也の供述
>「夏休み期間に、講演活動を兼ねて旅行していた。好みの女性だったのでムラムラした」
> ¥
>性犯罪者の増田哲也(50歳・東京都足立区千住寿町)が
>8月4日にJR牟岐線の列車内で、午後4時20分ごろから約50分にわたり、
>徳島県内の女性(21歳・専門学校生)の胸や太ももなどを触った疑いで、
>8月5日未明、県迷惑行為防止条例違反(痴漢行為)容疑で徳島県警阿南署に
>逮捕されました。
>
>性犯罪者 増田哲也の供述
>「夏休み期間に、講演活動を兼ねて旅行していた。好みの女性だったのでムラムラした」
> ¥
>性犯罪者の増田哲也(50歳・東京都足立区千住寿町)が
>8月4日にJR牟岐線の列車内で、午後4時20分ごろから約50分にわたり、
>徳島県内の女性(21歳・専門学校生)の胸や太ももなどを触った疑いで、
>8月5日未明、県迷惑行為防止条例違反(痴漢行為)容疑で徳島県警阿南署に
>逮捕されました。
>
>性犯罪者 増田哲也の供述
>「夏休み期間に、講演活動を兼ねて旅行していた。好みの女性だったのでムラムラした」
> ¥
>性犯罪者の増田哲也(50歳・東京都足立区千住寿町)が
>8月4日にJR牟岐線の列車内で、午後4時20分ごろから約50分にわたり、
>徳島県内の女性(21歳・専門学校生)の胸や太ももなどを触った疑いで、
>8月5日未明、県迷惑行為防止条例違反(痴漢行為)容疑で徳島県警阿南署に
>逮捕されました。
>
>性犯罪者 増田哲也の供述
>「夏休み期間に、講演活動を兼ねて旅行していた。好みの女性だったのでムラムラした」
> ¥
>性犯罪者の増田哲也(50歳・東京都足立区千住寿町)が
>8月4日にJR牟岐線の列車内で、午後4時20分ごろから約50分にわたり、
>徳島県内の女性(21歳・専門学校生)の胸や太ももなどを触った疑いで、
>8月5日未明、県迷惑行為防止条例違反(痴漢行為)容疑で徳島県警阿南署に
>逮捕されました。
>
>性犯罪者 増田哲也の供述
>「夏休み期間に、講演活動を兼ねて旅行していた。好みの女性だったのでムラムラした」
> ¥
>性犯罪者の増田哲也(50歳・東京都足立区千住寿町)が
>8月4日にJR牟岐線の列車内で、午後4時20分ごろから約50分にわたり、
>徳島県内の女性(21歳・専門学校生)の胸や太ももなどを触った疑いで、
>8月5日未明、県迷惑行為防止条例違反(痴漢行為)容疑で徳島県警阿南署に
>逮捕されました。
>
>性犯罪者 増田哲也の供述
>「夏休み期間に、講演活動を兼ねて旅行していた。好みの女性だったのでムラムラした」
> ¥
>性犯罪者の増田哲也(50歳・東京都足立区千住寿町)が
>8月4日にJR牟岐線の列車内で、午後4時20分ごろから約50分にわたり、
>徳島県内の女性(21歳・専門学校生)の胸や太ももなどを触った疑いで、
>8月5日未明、県迷惑行為防止条例違反(痴漢行為)容疑で徳島県警阿南署に
>逮捕されました。
>
>性犯罪者 増田哲也の供述
>「夏休み期間に、講演活動を兼ねて旅行していた。好みの女性だったのでムラムラした」
> 相関係数に関して質問です。
各個体は、
A=古い成績(サンプルは多い)の平均値
B=最新の成績(サンプルは少ない)の平均値
を持つとします。
個体は全部で100個あり、下記の方法で2種類の相関係数を求めます。
CC1=Aでソートした場合の上位80個の相関係数
CC2=Bでソートした場合の上位80個の相関係数
ここでCC1よりCC2の方が数値が大きくなった場合、どういったことが考えられますか? A系列とB系列の2つで相関係数を求めるってことかと
例えば、A系列は過去の複数教科のテスト結果の平均値を生徒数分
B系列は同様の平均値で最新のもの
過去の平均値でソートして上位80人分を使って
A系列とB系列で計算した相関係数と
最新の平均値でソートして上位80人分で計算した相関係数で
最新の上位80人分の方が相関係数が大きかった
最新の方が偶々成績が良かったり悪かったりした人が少なかった?
個人ごとの平均値の標準偏差を見た方が分り易いかも ¥
>性犯罪者の増田哲也(50歳・東京都足立区千住寿町)が
>8月4日にJR牟岐線の列車内で、午後4時20分ごろから約50分にわたり、
>徳島県内の女性(21歳・専門学校生)の胸や太ももなどを触った疑いで、
>8月5日未明、県迷惑行為防止条例違反(痴漢行為)容疑で徳島県警阿南署に
>逮捕されました。
>
>性犯罪者 増田哲也の供述
>「夏休み期間に、講演活動を兼ねて旅行していた。好みの女性だったのでムラムラした」
> ¥
>性犯罪者の増田哲也(50歳・東京都足立区千住寿町)が
>8月4日にJR牟岐線の列車内で、午後4時20分ごろから約50分にわたり、
>徳島県内の女性(21歳・専門学校生)の胸や太ももなどを触った疑いで、
>8月5日未明、県迷惑行為防止条例違反(痴漢行為)容疑で徳島県警阿南署に
>逮捕されました。
>
>性犯罪者 増田哲也の供述
>「夏休み期間に、講演活動を兼ねて旅行していた。好みの女性だったのでムラムラした」
> ¥
>性犯罪者の増田哲也(50歳・東京都足立区千住寿町)が
>8月4日にJR牟岐線の列車内で、午後4時20分ごろから約50分にわたり、
>徳島県内の女性(21歳・専門学校生)の胸や太ももなどを触った疑いで、
>8月5日未明、県迷惑行為防止条例違反(痴漢行為)容疑で徳島県警阿南署に
>逮捕されました。
>
>性犯罪者 増田哲也の供述
>「夏休み期間に、講演活動を兼ねて旅行していた。好みの女性だったのでムラムラした」
> ¥
>性犯罪者の増田哲也(50歳・東京都足立区千住寿町)が
>8月4日にJR牟岐線の列車内で、午後4時20分ごろから約50分にわたり、
>徳島県内の女性(21歳・専門学校生)の胸や太ももなどを触った疑いで、
>8月5日未明、県迷惑行為防止条例違反(痴漢行為)容疑で徳島県警阿南署に
>逮捕されました。
>
>性犯罪者 増田哲也の供述
>「夏休み期間に、講演活動を兼ねて旅行していた。好みの女性だったのでムラムラした」
> ¥
>性犯罪者の増田哲也(50歳・東京都足立区千住寿町)が
>8月4日にJR牟岐線の列車内で、午後4時20分ごろから約50分にわたり、
>徳島県内の女性(21歳・専門学校生)の胸や太ももなどを触った疑いで、
>8月5日未明、県迷惑行為防止条例違反(痴漢行為)容疑で徳島県警阿南署に
>逮捕されました。
>
>性犯罪者 増田哲也の供述
>「夏休み期間に、講演活動を兼ねて旅行していた。好みの女性だったのでムラムラした」
> ¥
>性犯罪者の増田哲也(50歳・東京都足立区千住寿町)が
>8月4日にJR牟岐線の列車内で、午後4時20分ごろから約50分にわたり、
>徳島県内の女性(21歳・専門学校生)の胸や太ももなどを触った疑いで、
>8月5日未明、県迷惑行為防止条例違反(痴漢行為)容疑で徳島県警阿南署に
>逮捕されました。
>
>性犯罪者 増田哲也の供述
>「夏休み期間に、講演活動を兼ねて旅行していた。好みの女性だったのでムラムラした」
> ¥
>性犯罪者の増田哲也(50歳・東京都足立区千住寿町)が
>8月4日にJR牟岐線の列車内で、午後4時20分ごろから約50分にわたり、
>徳島県内の女性(21歳・専門学校生)の胸や太ももなどを触った疑いで、
>8月5日未明、県迷惑行為防止条例違反(痴漢行為)容疑で徳島県警阿南署に
>逮捕されました。
>
>性犯罪者 増田哲也の供述
>「夏休み期間に、講演活動を兼ねて旅行していた。好みの女性だったのでムラムラした」
> ¥
>性犯罪者の増田哲也(50歳・東京都足立区千住寿町)が
>8月4日にJR牟岐線の列車内で、午後4時20分ごろから約50分にわたり、
>徳島県内の女性(21歳・専門学校生)の胸や太ももなどを触った疑いで、
>8月5日未明、県迷惑行為防止条例違反(痴漢行為)容疑で徳島県警阿南署に
>逮捕されました。
>
>性犯罪者 増田哲也の供述
>「夏休み期間に、講演活動を兼ねて旅行していた。好みの女性だったのでムラムラした」
> ¥
>性犯罪者の増田哲也(50歳・東京都足立区千住寿町)が
>8月4日にJR牟岐線の列車内で、午後4時20分ごろから約50分にわたり、
>徳島県内の女性(21歳・専門学校生)の胸や太ももなどを触った疑いで、
>8月5日未明、県迷惑行為防止条例違反(痴漢行為)容疑で徳島県警阿南署に
>逮捕されました。
>
>性犯罪者 増田哲也の供述
>「夏休み期間に、講演活動を兼ねて旅行していた。好みの女性だったのでムラムラした」
> ¥
>性犯罪者の増田哲也(50歳・東京都足立区千住寿町)が
>8月4日にJR牟岐線の列車内で、午後4時20分ごろから約50分にわたり、
>徳島県内の女性(21歳・専門学校生)の胸や太ももなどを触った疑いで、
>8月5日未明、県迷惑行為防止条例違反(痴漢行為)容疑で徳島県警阿南署に
>逮捕されました。
>
>性犯罪者 増田哲也の供述
>「夏休み期間に、講演活動を兼ねて旅行していた。好みの女性だったのでムラムラした」
> >>666
説明不足ですみません。そんな感じであってます。
1つ補足すると、A系列は1月-5月の平均値、B系列は6月の平均値、のようにサンプル数に違いがあります。
標準偏差ですが、A系列が6.65、B系列が6.62とほとんど差がありませんでした。
最初の質問(>>644)に戻りますが、100人のうち、上位80人だけ取り出したら相関係数が上がったor下がった場合、
その相関係数に利用価値はないのでしょうか? >>688
そもそも相関係数を求めるアプローチは正しいの?
散布図作ってみた? >>689
標準偏差の計算が間違っていました。
A系列の標準偏差が0.043でB系列が0.196でした。
B系列は少ないサンプルの平均値なので、分散が大きいのは直感的にもそうですね。
分散が大きいB系列のパーセンタイルでフィルターをかけたら相関係数が上昇するというのも納得しました。 超有名な確率論である米国の「モンティ・ホール問題」について教えて下さい。
私ではよく分からないので、アドバイスお願い致します。
競馬での話しです。
8頭立てのレースとします。
1着を当てる単勝馬券を購入するとします。
1番 確率12.5%
2番 確率12.5%
3番 確率12.5%
4番 確率12.5%
5番 確率12.5%
6番 確率12.5%
7番 確率12.5%
8番 確率12.5%
競走馬の能力は同等とし、それぞれ同じ確率で的中すると仮定します。
すると、上記のように各馬が1着になる確率はそれぞれ「12.5%」
づつになります。
それを下記のように「Aゾーン」・「Bゾーン」というふうに2つの
ゾーンに分けて考えたとします。
「Aゾーン」
1番 確率12.5%
2番 確率12.5%
3番 確率12.5%
4番 確率12.5%
「Bゾーン」
5番 確率12.5%
6番 確率12.5%
7番 確率12.5% ←削除
8番 確率12.5% ←削除
予想の段階で「Bゾーン」の7番と8番が1着には来ない(ハズレる)
と分かったとします。
すると、7番と8番が持っていた的中確率「12.5%(合計25%)」
は、同じ「Bゾーン」の5番と6番の「2頭」に上乗せされるのでしょうか?
それとも「Aゾーン」の4頭を含む、1番から6番の「6頭」に
上乗せされるのでしょうか?
もし、「Bゾーン」の5番と6番の「2頭だけ」に上乗せされるのであれば、
「Bゾーン」の2頭を購入したほうが、的中確率は高くなります。
どちらが、正しいのでしょうか?
お手数ですが、ご回答のほどよろしくお願い致します。 >>691
競馬詳しくないけど、これがモンティ・ホール問題だと思う理由は何?
A、Bに分けるのは理由があるの?枠番?
7, 8 が来ない結果を受けて別の馬券を買う戦略を取るなら、自分の買った馬が来ないと分かっても別の馬券を買う戦略を取らない(出走停止による払い戻しを受けない)場合よりは勝つ確率は上がるけど、1-6番の各馬の勝率の比率自体は全て同じまま
枠番みたいにAかBで買ってかつ7, 8番が出走停止になった場合は、Bの配当金が上がることは考えられる すみません、どなたか点推定値と信頼区間に詳しい方はいらっしゃいませんか?
信頼区間の計算ができなくて困っています。
助けてください。 じゃあ書きますね
視聴率の推定値と信頼区間の下限と上限を求めよっていう問題です
視聴率28.1です
視聴率=推定値でしょうか? いや、統計学というか、1票の差で誰かが当選したとか大きな選挙で
歴史上一度でもありますか? >>701
数学的にマトモに考えれば補正できるのにほったらかしなので、そのバグを突いた選挙戦略が使われてるのでは つーかそういう研究する分野は統計学じゃなくてゲーム理論になるから 投票率で選挙結果が変わるって予測できるなら統計学上の問題でしょ
一人の投票はmarginal effectにしたら微々たるものだろうけど、同じような属性の人の投票率の結果を考えるのが統計学じゃないかな 選挙に行く意味がない理由
・政治家には公約を守る義務がない
→ 自信満々に投票しろとか言う連中はエスパーか?
・選挙運動は2週間だけ
→ 大学の2単位の講義でも半年かけるのに
・選挙期間中の2週間はテレビでの露出禁止
→ 選挙民はテレビの影響で投票するバカで、しかも2週間で記憶が削除されるバカ
・多数決は意思決定方法としては欠陥品だと、投票理論で200年前から指摘されている
→ 他の意思決定方法を提案しろと言われたら、スコアリングルールを提案しましょう
・小選挙区制と比例代表制は正当性を主張することの方が難しい
→ 専門家が口をそろえて叩く選挙制度なのに…
・日本の与党はアメリカ 単にいい歳して投票に行かないのが恥ずかしいので行くだけ 対して、誰に投票したいかといった考えもなく「大切な一票」といった言葉によって
なんとなく投票に行かなきゃということで、なんとなく投票する人が大半だと思います。
誰に投票するかはっきりした考えがある人のみが投票する世界と、
現実の世界ではどのような違いがあるのでしょうか?
「大切な一票」といった言葉によって投票に行くことをけしかけて、投票率を
上げることによって得するのはどういう人達なのでしょうか? 統計スレで政治の話をするところから考えたほうがいいぞ厨房 確率変数について質問なんだけど、
「Xのとる任意の値aとYのとる任意の値bについて、
P(X=a, Y=b) = P(X=a) × P(Y=b)
が成り立つとき、確率変数XとYは独立であるという。」
(A) 「XとYが互いに独立ならば、a×Xとb×Yは互いに独立である」
という記述があります。
(A)の証明は以下でいいんですか?
P(a×X=x1, b×Y=y1) = P(X=x1/a, Y=y1/b) = P(X=x1/a)×P(Y=y1/b)
= P(a×X=x1)×P(b×Y=y1) 一様分布ってなんか不思議じゃない?
確率変数xが一様に分布しているんだから、特別な値など存在しない。
それにもかかわらず、平均値が存在する。 都知事選:知事に当選する為ならば、公約とか政策なんてどうでもヨロシ。
大学教育:経営が成立する為ならば、学生とか論文なんてどうでもヨロシ。
糞父芳雄:教授に昇進する為ならば、分野とか研究なんてどうでもヨロシ。
よよよ、よォ〜〜〜しを。近視眼的で打算的だよォ〜〜〜んんん。
ケケケ¥
都知事の選挙:人気だけで候補になり、政策は無視。
馬鹿板の議論:態度だけが問題になり、論理は無視。
ニホンの習慣:学歴だけで採用となり、能力は無視。
ヨシヲの主張:態度だけが問題になり、学問は無視。
商習慣の基本:名前だけで契約となり、品質は無視。
博士号の実態:肩書だけが問題になり、優劣は無視。
¥ 出る確率が一様なだけであって、出る値は実に不公平だから何も不思議ではない 日本人の躾けは『大人の都合』、その目的は威厳に屈服させる為:
ある父親:クマが出没する山林に息子を放置、しかも嘘を吐いて保身。
別の父親:勉強の邪魔をして進路を妨害し、学歴を砕く。出世を強要。
ソレでも「親の行為は子供の為」という傲慢な常識を振り回す世間、しかも
「親を尊敬して大切に扱え」という無根拠な思想を押し付ける儒教文化。
お父さん、お母さんを大切にしましょう!!!ソレが世間体というモノ!
ケケケ¥
政治家も、お教授も、権力を振り回すのが大好きな低能人種:
ある男:ボクは都民の為に湯河原で休んでるんだ。知事が信じられんのかっ!
別の男:オレは哲也の為に指導してやってるんだ。父親が信じられんのかっ!
上から目線で強弁すれば、自分の言い分は何でも通る国があるらしい…
ああ、素晴らしき日本文化よ。キミ達も国会議員を見習い給え。何せ多数決で選
ばれた『皆の代表』なので。だからある男も別の男もエラいんだよォ〜〜〜んw
コココ¥
終わり良ければ全てヨシ。途中経過はどうでもヨシ。
大学:学生の知能なんてどうでもヨシ。カネが儲かる教室を巧みに運営シロ。
狸研:研究の詳細なんてどうでもヨシ。世間が驚く大論文を外国に発表シロ。
芳雄:学問の中身なんてどうでもヨシ。安易に教授になれる分野を専攻シロ。
学問なんて所詮は出世の道具。周囲に秀才っぽく見せ掛けられたらソレでヨシ。
社会的に高い地位、そして豪華で贅沢な暮らし。世間が羨む大学教授のポスト。
ソレさえ手に入れば学問そのものなんて洋梨よォ〜〜〜ん。
よよよ、よ〜〜〜しお。そやしノ〜ベル賞が欲しいよォ〜〜〜んんんwww
シシシ¥ ルーレットがどこで止まるか、確率変数をXとする。
0°≦X≦360°とすると平均は180°
-180°≦X≦180°とすると平均は0°
パラドクス?
角度をはかる始点を変更すると平均となる位置が変わる。
パラドクス? 都知事選:知事に当選する為ならば、公約とか政策なんてどうでもヨロシ。
大学教育:経営が成立する為ならば、学生とか論文なんてどうでもヨロシ。
糞父芳雄:教授に昇進する為ならば、分野とか研究なんてどうでもヨロシ。
よよよ、よォ〜〜〜しを。近視眼的で打算的だよォ〜〜〜んんん。
ケケケ¥
都知事の選挙:人気だけで候補になり、政策は無視。
馬鹿板の議論:態度だけが問題になり、論理は無視。
ニホンの習慣:学歴だけで採用となり、能力は無視。
ヨシヲの主張:態度だけが問題になり、学問は無視。
商習慣の基本:名前だけで契約となり、品質は無視。
博士号の実態:肩書だけが問題になり、優劣は無視。
¥ 何がパラドクスなのwwwwwwwww整合性しかないwwwww 日本人の躾けは『大人の都合』、その目的は威厳に屈服させる為:
ある父親:クマが出没する山林に息子を放置、しかも嘘を吐いて保身。
別の父親:勉強の邪魔をして進路を妨害し、学歴を砕く。出世を強要。
ソレでも「親の行為は子供の為」という傲慢な常識を振り回す世間、しかも
「親を尊敬して大切に扱え」という無根拠な思想を押し付ける儒教文化。
お父さん、お母さんを大切にしましょう!!!ソレが世間体というモノ!
ケケケ¥
政治家も、お教授も、権力を振り回すのが大好きな低能人種:
ある男:ボクは都民の為に湯河原で休んでるんだ。知事が信じられんのかっ!
別の男:オレは哲也の為に指導してやってるんだ。父親が信じられんのかっ!
上から目線で強弁すれば、自分の言い分は何でも通る国があるらしい…
ああ、素晴らしき日本文化よ。キミ達も国会議員を見習い給え。何せ多数決で選
ばれた『皆の代表』なので。だからある男も別の男もエラいんだよォ〜〜〜んw
コココ¥
終わり良ければ全てヨシ。途中経過はどうでもヨシ。
大学:学生の知能なんてどうでもヨシ。カネが儲かる教室を巧みに運営シロ。
狸研:研究の詳細なんてどうでもヨシ。世間が驚く大論文を外国に発表シロ。
芳雄:学問の中身なんてどうでもヨシ。安易に教授になれる分野を専攻シロ。
学問なんて所詮は出世の道具。周囲に秀才っぽく見せ掛けられたらソレでヨシ。
社会的に高い地位、そして豪華で贅沢な暮らし。世間が羨む大学教授のポスト。
ソレさえ手に入れば学問そのものなんて洋梨よォ〜〜〜ん。
よよよ、よ〜〜〜しお。そやしノ〜ベル賞が欲しいよォ〜〜〜んんんwww
シシシ¥ 平均=期待値
ルーレットがどこで止まるかの期待値が角度をはかる始点を変更すると
変わるっておかしくない?
納得いかないんだけど。 ルーレットがどの位置で止まるか?
明らかにどの位置で止まることも同様に確からしい。
だから期待値なんて計算できること自体がパラドクスじゃない? >>726
平均が同じでも分散が異なる
角度を値としてとる確率変数の期待値を計算する事は出来るが分散が大きくなるから偏りが無い 若い奴を相手にして、『人前ではメッキで遣り過ごせ!』と教える芳雄が、
何と「研究者としての基本的態度」を申し述べ、毎晩の様に連呼して、そ
の重要性を訴えてた。所が芳雄は一向に「何をどうスル事なのか」を説明
せず、子供の私は日々頭を悩ませた。普通に考えれば、ソレは:
★★★「研究対象に向かう時にどういう風に頭を使って考えて創造的になるか」★★★
であろう。そして試行錯誤を繰り返しながら失敗を重ね、その度毎に芳雄
に罵倒され、そして「釜ヶ崎へ行け!」と恐喝された。
でも芳雄を良く観察し、そして:
★★★『芳雄と一緒になって母親を無根拠に罵倒したら「芳雄は大喜び」した!』★★★
ので、やっと理解した。芳雄が言う「研究者としての基本的態度」とは:
1.その場の自分の損得を考える。
2.何も考えずに「芳雄に同調」スル。
3.発言の中身を空虚にして、表現にだけ注意して敬語を使う。
という様な事であり、要は『顔色を窺って、その場を繕え』という事だ。
コレを理解した時はホンマに嬉しかった。芳雄のオツムが『サル並である』
という定理を証明した瞬間だった。
¥ >>725
サイコロの6の目のみを100000000000000000000000000000000に貼り替えたら
全て1/6の確率で出るけど、期待値はめっちゃ変わる。
全ての目は1/6の確率で出るのに、だいたい16666666666666666666666666666666が出るっておかしくない?
パラドクス?
5/6=83%の確率で5以下がでるのに、だいたい 16666666666666666666666666666666が出るっておかしくない?
パラドクス? >>725
長さ1の正方形に対角線引いて三角形作ったら、その面積は1/2
一方、三角形の底辺は長さ1だよ?
三角形は明らかに底辺を含んでるから面積>底辺のはずなのに
面積=1/2 < 1=底辺っておかしくない?
パラドクス?
確率と期待値は次元が違うのに混同してない?
>>729
乱数を使っているのか、疑似乱数を使っているのか
http://www001.upp.so-net.ne.jp/isaku/rand.html
1万個を超えるような繰り返し数だと、ループに陥りやすい。
自己相関関数を求めてみると、
https://ja.wikipedia.org/wiki/%E8%87%AA%E5%B7%B1%E7%9B%B8%E9%96%A2
比較的短周期(数10-数100, 計算に使用した数10-100点、合計1万から10億個の乱数列)で有意な繰り返し(危険率5%)が見られる場合がある。
複数のサイコロを一度に振って、偏りが出ないように振る技術も結構高度な技能。
自己相関関数を求めたら、一度に振ったさいころの数で有意な繰り返しが得られた。
サイコロを使っても、一度に複数を振っていると疑似乱数にしかならない。 http://imgur.com/btUFEhZ.jpg
↑の図23について質問です。
X の分布を見ると例えば X が 2.0 以上となる確率は0です。
それにもかかわらず、
(X1 + X2) / 2 と (X1 + X2 + X3) / 3
の分布が 2 .0より大きい範囲や -2.0 より小さい範囲にまで広がっています。
これはなぜなのでしょうか? 確率密度関数を f(x) とする。
任意の実数 a について、 x = a となる確率は 0 である。
よって、 x は実数値を取り得ない。
パラドクスですね。 Introduction to Probability, 2nd Edition
by Dimitri P. Bertsekas et al.
Link: https://amzn.com/188652923X
↑このMITの教科書ってどうですか?
誰か読んだことある人いますか? >>736
x=a±εの値をとる確率はゼロでは無い >>734
Xの値が4とかを取る確率はゼロだけど定義域ではある
計算上のX1+X2の期待値を求めるときは定義域全体について計算するから
確率ゼロの部分を定義域から除いてしまえばいい >>734
あなたの質問は、本質的には
「サイコロ一つを振ったときの目は1から6しかないのに、
サイコロ二つを振ったときの合計の目は2から12まであるのはなぜ?」
と問うているのと同じ。
あの図では、(X1+X2)/2の分布 とはなっているが、ほとんど全く同じ意味で X1+X2の分布 を
考えているといえる。ただし、背景の正規分布と「高さ」がほぼ等しくなるように、2で割っているだけ。 >>739-740
すみません。
言っている意味が分かりません。
ところで、本には、
「図23の2つの標本の平均の分布、3つの標本の平均の分布を描くにさいし
ては標準正規分布との比較のため、座標軸の値を調整してある。」
と書いてあります。
この意味は、 (X1 + X2) / 2 の場合で言えば、
X の標準偏差を σ とするときに、
(X1 + X2) / 2 の標準偏差は σ/√2 になるから、
((X1 + X2) / 2 ) / (σ/√2) のグラフを描いている
ということでしょうか? 高校の教科書に、ある部品の誤差を測定する話が書いてあります。
そして、「測定する部品の数を増し、階級の幅をより細かくしていくと、
度数分布のグラフの線は、直線 x = 0 について対称な山形の曲線
に近づいていく。この曲線が誤差 X の確率分布を与えている。」
と書いてあります。
「この曲線が誤差 X の確率分布を与えている。」と書いてあります。
この曲線というのは連続分布のことですよね?
縦軸の値は、相対度数のままだと駄目なんじゃないでしょうか?
相体度数を階級の幅で割った数値を縦軸に取らないといけないように思います。
これについてはどうでしょうか? 相対度数=確率≠確率密度
ですよね?
なんかこの教科書の書き方だと、確率密度=確率という誤ったイメージを
持たせるように思うのですが。
『プログラミングのための確率統計』にも確率密度≠確率ということを強調
して書いてありました。 例えば、身長を確率変数として、その確率分布を求めたい場合には、
縦軸の値は、「相対度数÷階級の幅」を取りますよね? あ! 情報を後出しする人だ!
みんな! 質問しておいて情報を後出しする典型的マナー違反の人が居るよ! 確率について、「確からしさ」とか「起こりやすさ」という誤ったイメージを持つのはよくない >>741
740で、「背景の正規分布と「高さ」がほぼ等しくなるように、2で割っているだけ」
と書いたが、これが、まさに
「3つの標本の平均の分布を描くにさいしては標準正規分布との比較のため、座標軸の値を調整してある」
の意味するところ。
そこで説明しようとしているのは、回数が増えると、「形状」が正規分布型に近づくことだと思われる。
だから、比較しやすいよう、「調整」したのだろう。
サイコロを一度振ると、各目の出る確率は、1/6の一定(横一直線)だが、
サイコロを二度振ると、出目の合計の分布は、7を頂点とする三角形型
サイコロを三度振ると、出目の合計の分布は、10,11を頂点とするえぐれた山形になる
これが、図23の三つのグラフに対応する。(この分布を具体的な関数として表してみるとよい。)
離散型と連続型で内容は異なるが、Σと∫の違いだけで、考え方は同じ X~U(-1.8,1.8)だとして、
P((X1+X2)/2< -1.8)=0だと思うんだけどなあ 母集団についての情報が明確ならわかるけど
そうで無い場合は推定するから
母集団の情報を知ってるときの結果とは差がでる >>743
確率というのが何なのかは公理を作って規定するしかない
測度論に基づいて確率の公理を作るのが最も一般的
確率論で業績を上げた伊藤清いわく「確率とはルベーグ測度である」
なので、測度論を理解すれば確率も確率密度もわかるようになる >>743
『プログラミングのための確率統計』良書だね。プログラミングのための本ではないけど。
確かに測度論を理解しないと確率論は理解できないけど、測度論は一般人にはハードルが高すぎる。
しかし、この本は測度論を理解できない人たちにも確率論(統計学)のニーズはあるわけで、測度論には手をだせない人に確率論を理解させようとする著者の苦心がうかがえる。 >>755
著者は工学系の人だから著者自身測度論を理解していないのでは? ファインマン物理学第1巻の第6章の「確率」を読んでいて意味不明の箇所に遭遇した。
p.80に、
コインを n 回投げたときに表が k 回でる確率 P(n, k) は
P(n, k) = Combination(n, k) / 2^n
になると書いてあって、これは分かる。次に、
「P(k, n) は、すべての試行のうちで、表が k だけ出ると期待される割合であるから、
100回で表が k だけ出る回数は 100 * P(k, n) であると期待される。」
と書いてある。これが意味不明である。
これはどういうことなのだろうか? >>757
100回中で何回出るかを予測するときに
k回出る確率がPだったら
100P回出ると予測するのと似た考え方じゃね? http://imgur.com/z789D27.jpg
http://imgur.com/TvVjcmB.jpg
↑で、電子部品の寿命時間が指数分布にしたがうことが理論的に説明されています。
議論の最初のほうで、(t_0, t_0+Δt) の間に故障する確率を λ×Δt と表わすことが
できるという話があります。
最終的に得られた確率密度関数 f(t) は、 f(t) = λ×exp(-λ×t) です。
つまり、(t_0, t_0+Δt) の間に故障する確率は λ×Δt ではなく
λ×exp(-λ×t)×Δt です。
これはなんかおかしいように感じるのですが、どうしてでしょうか? 質問です
実験で得られた測定値と、理論式によって得られた計算値があるときに、その誤差の評価はどのようにすればいいでしょうか
測定は各点では一回ずつしか行っていません 私なら、計算値を事前分布に設定して、実測値で事後分布を更新する手段をとる
どちらにせよ、事前分布を設定しないと、1回の測定では誤差は出ません 日本人ってホンマに『人を舐めてる』よね。こういう糞みたいな奴ばっか
りだから国家も腐るし、そして学問もダメになる。だからとにかく馬鹿板
は焼きます。こういう場所でカキコする低能が苦悩する様に。
¥
>331 名前 :132人目の素数さん:2016/07/31(日) 12:42:35.54 ID:eoIQzfwB
> 反論できないってことは読んでないんだなw
> なのに数学談義大好きw馬鹿の考えてることはよくわからんw
> 日本人ってホンマに『人を舐めてる』よね。こういう糞みたいな奴ばっか
りだから国家も腐るし、そして学問もダメになる。だからとにかく馬鹿板
は焼きます。こういう場所でカキコする低能が苦悩する様に。
¥
>331 名前 :132人目の素数さん:2016/07/31(日) 12:42:35.54 ID:eoIQzfwB
> 反論できないってことは読んでないんだなw
> なのに数学談義大好きw馬鹿の考えてることはよくわからんw
> ¥
>1 :名無しさん :2006/04/30(日) 01:41:01 ID:KPnB.CH2
> 迷惑かしらん
>
>5392 :kmath1107★ :2016/07/31(日) 11:53:29 ID:???
> 人への念の盗み見による介入を阻め。
>
>5393 :kmath1107★ :2016/07/31(日) 11:58:25 ID:???
> 人への念の盗み見による介入を阻め。
>
>5394 :¥ ◆2VB8wsVUoo :2016/07/31(日) 12:06:23 ID:???
> ¥
>
>5395 :kmath1107★ :2016/07/31(日) 13:24:11 ID:???
> 人への念の盗み見による介入を阻め。
>
>5396 :¥ ◆2VB8wsVUoo :2016/07/31(日) 17:23:53 ID:???
> ¥
>
>5397 :kmath1107★ :2016/08/01(月) 15:59:13 ID:???
> 人への念の盗み見による介入を阻め。
>
>5398 :¥ ◆2VB8wsVUoo :2016/08/01(月) 16:06:01 ID:???
> ¥
> 日本人ってホンマに『人を舐めてる』よね。こういう糞みたいな奴ばっか
りだから国家も腐るし、そして学問もダメになる。だからとにかく馬鹿板
は焼きます。こういう場所でカキコする低能が苦悩する様に。
¥
>331 名前 :132人目の素数さん:2016/07/31(日) 12:42:35.54 ID:eoIQzfwB
> 反論できないってことは読んでないんだなw
> なのに数学談義大好きw馬鹿の考えてることはよくわからんw
> ¥
>1 :名無しさん :2006/04/30(日) 01:41:01 ID:KPnB.CH2
> 迷惑かしらん
>
>5392 :kmath1107★ :2016/07/31(日) 11:53:29 ID:???
> 人への念の盗み見による介入を阻め。
>
>5393 :kmath1107★ :2016/07/31(日) 11:58:25 ID:???
> 人への念の盗み見による介入を阻め。
>
>5394 :¥ ◆2VB8wsVUoo :2016/07/31(日) 12:06:23 ID:???
> ¥
>
>5395 :kmath1107★ :2016/07/31(日) 13:24:11 ID:???
> 人への念の盗み見による介入を阻め。
>
>5396 :¥ ◆2VB8wsVUoo :2016/07/31(日) 17:23:53 ID:???
> ¥
>
>5397 :kmath1107★ :2016/08/01(月) 15:59:13 ID:???
> 人への念の盗み見による介入を阻め。
>
>5398 :¥ ◆2VB8wsVUoo :2016/08/01(月) 16:06:01 ID:???
> ¥
> 日本人ってホンマに『人を舐めてる』よね。こういう糞みたいな奴ばっか
りだから国家も腐るし、そして学問もダメになる。だからとにかく馬鹿板
は焼きます。こういう場所でカキコする低能が苦悩する様に。
¥
>331 名前 :132人目の素数さん:2016/07/31(日) 12:42:35.54 ID:eoIQzfwB
> 反論できないってことは読んでないんだなw
> なのに数学談義大好きw馬鹿の考えてることはよくわからんw
> 質問です
1/100の確率のくじ引きを10000回試行したとき、
結果として1/80より有利な確率になる(当たりを125回以上引く)確率って
どうやって求めたらいいのでしょうか? 1 - sum combination(10000, k)*(1/100)^k*(99/100)^(10000-k), k = 0 to 124 = 0.008479181048273 ¥
>1 :名無しさん :2006/04/30(日) 01:41:01 ID:KPnB.CH2
> 迷惑かしらん
>
>5470 :¥ ◆2VB8wsVUoo :2016/08/06(土) 17:43:47 ID:???
> ¥
>
>5471 :kmath1107★ :2016/08/07(日) 06:25:49 ID:???
> 人への念の盗み見による介入を阻め。
>
>5472 :¥ ◆2VB8wsVUoo :2016/08/07(日) 08:32:51 ID:???
> ¥
>
>5473 :kmath1107★ :2016/08/07(日) 17:43:49 ID:???
> 人への念の盗み見による介入を阻め。
>
>5474 :¥ ◆2VB8wsVUoo :2016/08/07(日) 17:54:48 ID:???
> ¥
>
>5475 :名無しさん :2016/08/08(月) 04:30:59 ID:C9rjCaNs
> 人への念の盗み見による介入を阻むことができれば、多くの人に明るい未来が来る?
>
>5476 :kmath1107★ :2016/08/08(月) 10:05:45 ID:???
> 人への念の盗み見による介入を阻め。
>
> Re:>>5475 人への念の盗み見による介入が無くなれば世の不和が無くなるだろう.
> >>792
ありがとうございます。
実は、計算式はわかっていたのですが、
それをエクセルに放り込むとcombination関数が
「値がでかすぎて計算できない」エラーを吐くのです。
なので上手な近似法とかるのかなとおもって・・・
でも、レスの内容はエクセルの書き方ですよね?
エクセルで計算できたんですか? >>792
自己解決しました!
A列にROW関数で1〜125を用意しておいて
{=SUM(COMBIN(10000,A1:A124)*(1/100)^A1:A124*(99/100)^(10000-A1:A124))}
この配列数式でいけました!アドバイス感謝です! ¥
>1 :名無しさん :2006/04/30(日) 01:41:01 ID:KPnB.CH2
> 迷惑かしらん
>
>5470 :¥ ◆2VB8wsVUoo :2016/08/06(土) 17:43:47 ID:???
> ¥
>
>5471 :kmath1107★ :2016/08/07(日) 06:25:49 ID:???
> 人への念の盗み見による介入を阻め。
>
>5472 :¥ ◆2VB8wsVUoo :2016/08/07(日) 08:32:51 ID:???
> ¥
>
>5473 :kmath1107★ :2016/08/07(日) 17:43:49 ID:???
> 人への念の盗み見による介入を阻め。
>
>5474 :¥ ◆2VB8wsVUoo :2016/08/07(日) 17:54:48 ID:???
> ¥
>
>5475 :名無しさん :2016/08/08(月) 04:30:59 ID:C9rjCaNs
> 人への念の盗み見による介入を阻むことができれば、多くの人に明るい未来が来る?
>
>5476 :kmath1107★ :2016/08/08(月) 10:05:45 ID:???
> 人への念の盗み見による介入を阻め。
>
> Re:>>5475 人への念の盗み見による介入が無くなれば世の不和が無くなるだろう.
> 確率変数の問題で3つのサイコロの目X<=Y<=Zがあるときに中央値であるYの確率分布関数を求めるのは難しいのでしょうか
X, Zの確率分布を求めるのはいろんなところに載っているのですが もし、よければ教えていただきたいのですが。
または、検索の手がかりでもご教示ねがいたいのですが。
化学分析をして、ある元素Mn, Fe, AlがそれぞれXX%として
それぞれの検体について分析器ででてくるのですが、
その異なった検体についての同じ(単一の)元素、たとえばMn
の%データについて平均を出すことの意味はあるでしょうか?
また、それには単純な平均で良いのでしょうか?
たとえば
ある元素が、検体1について10%;検体2について20%;とすると、
(10+20)/2で平均が求まるのでしょうか?(検体数はもっとたくさんあります)
また、この平均値(含有%)が正規分布するということを検定するのは
意味のあることでしょうか?その後、2つのグループから得られた2つの
検体群が示すある元素の%値群についての平均値についてt検定を行うのは意味
のあることなのでしょうか?
もし、よろしければ、ヒントでもご教示ねがえれば幸いです。
しろうと質問で申し訳ありません。 Rで楽しむ統計 (Wonderful R 1)
奥村 晴彦
固定リンク: https://www.amazon.co.jp/dp/4320112415
数学ガールの秘密ノート/やさしい統計 (数学ガールの秘密ノートシリーズ)
結城 浩
固定リンク: https://www.amazon.co.jp/dp/4797387122 ¥
>287 名前:132人目の素数さん :2016/09/13(火) 10:52:30.44 ID:rMlOB3oq
> 痴漢でもなんでも、業績を上げていれば世間はほっておかない。
> 哲也がヤケッパチになったのは、自分がただの有象無象の一人に過ぎないことを思い知ったから。
> 痴漢行為はヤケッパチになった結果としての所業だろう。
> 奥村晴彦ってアルゴリズム事典の頃から読んでいたんだけど、最近ツイッターみたら
いろんなことに難癖つけてすぐドヤ顔するやっすい理系大学生みたいなツイート
ばかりでかなり印象悪くなった ¥
>287 名前:132人目の素数さん :2016/09/13(火) 10:52:30.44 ID:rMlOB3oq
> 痴漢でもなんでも、業績を上げていれば世間はほっておかない。
> 哲也がヤケッパチになったのは、自分がただの有象無象の一人に過ぎないことを思い知ったから。
> 痴漢行為はヤケッパチになった結果としての所業だろう。
> >>814
化はよく知らんけど、t検定するときって混ぜものがある確率を棄却してるんじゃないか? 荒れてるけど統計の質問ってここでいい?
毎日売れる商品に懸賞の応募フォームを付けて、どれだけ応募があったかA商品とB商品での有意差を求めたいです
商品Aが30日で3000売れて、応募は300件あった
商品Bが15日で500売れて、応募は80件あった
目的
応募率の高い、低いで有意差を求めます
疑問ポイント
毎日売れ続けるけど、n数は3000と500に固定してカプランマイヤーの生存曲線で求めるのが最適でしょうか?
それとも売上、応募ともに増え続けるのに適した統計解析方法ってなにかありますか?
販売日数がAとBでは違うがなにか気をつけるべきポイント
お願いします >>842
普通のt検定でよくね?一日平均にしてさ…
それじゃだめなの? >>853
ありがとうございます
結局842のあとエクセルでカプランマイヤーやろうとしたら、エクセル2007から統計から生存曲線なくなってる
昔は生存曲線あった気がするんだけど >>854
ハザードアナリシス?ないと思うんだけど?
エクセルって、重回帰だけでないの…と書いていてそういえば何やらたくさん出てきてた気がするなぁ…と思い出してきた >>855
エクセル統計っていうアドオン買わないと無いみたいだ
昔使ってた学校のPCには初めから入っていたから、無いのに気づかなかったみたい
数万するのかよ…
>>856
やってみる >>857
ん?カプランマイヤーってことは、医療系?
sasじゃなくても認められるの? >>858
いや医療じゃなくて>>842みたいに
製品の評判をカプランマイヤーを利用して解析できないかやってみようとしたんだ
応募した人を、非生存
応募しなかった人を、生存
と当てはめれば、解析できるんじゃないかと >>859
グラフが下向きになるから、ハザードでやったほうが受けるよ >>860-861
ありがとうございます
エクセルだけじゃできなんだね
rを今から1日で使いこなすのも無理そうだし >>862
そんだけオブザベーションがあるなら度数分布をグラフにしてもなんとかなると思うけどね ¥
>55 :132人目の素数さん 2016/09/18(日) 22:27:13.98 ID:ol2qzlaN
>東京の税金たからないで関西に帰れよ部落民
>
>59 :132人目の素数さん 2016/09/18(日) 22:54:42.02 ID:ol2qzlaN
>お前の親でもない赤の他人の東京都からナマポふんだくって一人前ズラしてんじゃねえよ関西部落民
>とっとと痴漢しに関西に帰れよ
>鬼のようにぶっさいくな関東女茨城女よりも四国や関西で痴漢した方が楽しいんだろ?ん?
>62 :132人目の素数さん 2016/09/18(日) 23:04:21.99 ID:ol2qzlaN
>関西に帰るのがいやならフランスの旧植民地の大学にでも行きゃあいいだろうがよ
>フランス崇め奉ってる植民地根性なら旧植民地がお似合いだろうがよ
>フランス文化受容強要の美しい現実も見られるだろうしなw
>
>64 :132人目の素数さん 2016/09/18(日) 23:10:41.77 ID:ol2qzlaN
>親のいいなりの関西のお受験坊ちゃんなんて関東女に相手されるどころかキンタマ握りつぶされそうだしな
>フランス人女には口げんかで負けるし
>フランス植民地選良の黒人女にでも慰めてもらえば?
>
>68 :132人目の素数さん 2016/09/18(日) 23:16:27.29 ID:ol2qzlaN
>フランス語でフランスの掲示板で関西のお受験パパの暴虐っぷりとお受験坊やのへなちょこっぷり宣伝して回ればいいのに
>日本人には常識レベルの関西のテストだけ誤魔化すのに特化したお受験親子の実力皆無っぷりなんて自分で実証して回ったって冷笑すらされんだろうに?
>旧関係者のガン無視っぷりにますます逆恨みがつのるだけじゃねぇのwwww
>
>70 :132人目の素数さん 2016/09/18(日) 23:20:13.28 ID:ol2qzlaN
>実力ありゃあ旧関係者も可哀想に感じてどっかにアカデミックな引き立てもあらアするかも知らねえが
>宇沢親子をしょっぱくしたコネと実績じゃあ冷笑すらされずガン無視空気だわな日本に限らず
>
>72 :132人目の素数さん 2016/09/18(日) 23:22:55.17 ID:ol2qzlaN
>親が教授じゃなかったらアカポスに最初っから引っかからなかった程度の癖に上等だな関西のお受験お坊ちゃん
> ¥
>55 :132人目の素数さん 2016/09/18(日) 22:27:13.98 ID:ol2qzlaN
>東京の税金たからないで関西に帰れよ部落民
>
>59 :132人目の素数さん 2016/09/18(日) 22:54:42.02 ID:ol2qzlaN
>お前の親でもない赤の他人の東京都からナマポふんだくって一人前ズラしてんじゃねえよ関西部落民
>とっとと痴漢しに関西に帰れよ
>鬼のようにぶっさいくな関東女茨城女よりも四国や関西で痴漢した方が楽しいんだろ?ん?
>62 :132人目の素数さん 2016/09/18(日) 23:04:21.99 ID:ol2qzlaN
>関西に帰るのがいやならフランスの旧植民地の大学にでも行きゃあいいだろうがよ
>フランス崇め奉ってる植民地根性なら旧植民地がお似合いだろうがよ
>フランス文化受容強要の美しい現実も見られるだろうしなw
>
>64 :132人目の素数さん 2016/09/18(日) 23:10:41.77 ID:ol2qzlaN
>親のいいなりの関西のお受験坊ちゃんなんて関東女に相手されるどころかキンタマ握りつぶされそうだしな
>フランス人女には口げんかで負けるし
>フランス植民地選良の黒人女にでも慰めてもらえば?
>
>68 :132人目の素数さん 2016/09/18(日) 23:16:27.29 ID:ol2qzlaN
>フランス語でフランスの掲示板で関西のお受験パパの暴虐っぷりとお受験坊やのへなちょこっぷり宣伝して回ればいいのに
>日本人には常識レベルの関西のテストだけ誤魔化すのに特化したお受験親子の実力皆無っぷりなんて自分で実証して回ったって冷笑すらされんだろうに?
>旧関係者のガン無視っぷりにますます逆恨みがつのるだけじゃねぇのwwww
>
>70 :132人目の素数さん 2016/09/18(日) 23:20:13.28 ID:ol2qzlaN
>実力ありゃあ旧関係者も可哀想に感じてどっかにアカデミックな引き立てもあらアするかも知らねえが
>宇沢親子をしょっぱくしたコネと実績じゃあ冷笑すらされずガン無視空気だわな日本に限らず
>
>72 :132人目の素数さん 2016/09/18(日) 23:22:55.17 ID:ol2qzlaN
>親が教授じゃなかったらアカポスに最初っから引っかからなかった程度の癖に上等だな関西のお受験お坊ちゃん
> >>877
アカデミア版で何の目的で荒らすんだろうなぁ?
コネだのなんだのは今に始まったこと所ないし、学会だって足の引っ張り合いになるときの方が多いのにな >>879
自分が有能だといえるやつは相当な○チガイだろ…
まして、この分野は特に 対極を否定したところで元が肯定されるわけじゃない。詭弁 大口病院の件はどのくらい異常な事なのか統計的には母比率の検定でP値を出せば良いかな 馬鹿板遊びはもうヤメレ。頭の悪い奴が跋扈したらアカンやろ。東京都庁
みたいにナルぞ。
¥ 馬鹿板遊びはもうヤメレ。頭の悪い奴が跋扈したらアカンやろ。東京都庁
みたいにナルぞ。
¥ >>883
普通のところなら病棟ごとのインシテンドとアクシデントの発生率は取ってるし、検定が必要ないとは言わないけど目で見てわかるレベルだからねぇ… ネット掲示板で学術を行うのは、とても良い習慣です。なので続けましょう。
¥ >>887
もっと早く気づけたんじゃないかな
異常検知 >>889
わかっていたと思うよ。今は訴訟されると病院ごと潰れるからね… 馬鹿板遊びはもうヤメレ。頭の悪い奴が跋扈したらアカンやろ。東京都庁
みたいにナルぞ。
¥ >>890
もし判ってたなら危機管理の問題
統計的に明らかでも意思決定に反映されないと役に立たないな
結果的により悪い状況になって発覚したんだから判断ミスだったと言える >>893
医療ミスの場合は内々で処理するのが通例だからね。手術ミスでいちいち首切ってたらそもそも腹開けるやつがいなくなるしね。通常対応として、そっちに入れようとしたんじゃない?
基本、誰かが垂れ込んだか、患者の親族に専門家がいたかしないとこの手のやつは表に出ないよ。 >>894
腹腔鏡手術とかで失敗したのも明らかになったし
程度問題だろう
どの程度まで許容範囲かを予め決めておかないと判断ミスするんだろうな そもそも、病室のドアに鍵がついてない時点で危機管理には興味ないでしょう >>896
病院は病気を治すところだからなぁ…鍵かけて医者が入れなくて死んでしまったのは自己責任、が通るなら鍵かけると思うよ 明日、発売ですね。
行列プログラマー ―Pythonプログラムで学ぶ線形代数
Philip N. Klein
固定リンク: https://www.amazon.co.jp/dp/4873117771 >>897
病院での直接の死因圧倒的No1が外部から持ち込まれたウイルスによる肺炎なんだけどね
本当に病気を治すことに興味があれば、医者と看護師だけはスルーできる鍵をつけて、見舞客にもカードキーとか渡して立ち入り制限します >>923
ちゃんとした所は建物そのものも別れてるよね。レベルが見えるように分からているというか…
ま、外来に行くとほんとに病気もらうよね。特に小児科… 次の条件を満たすとき独立である
P(A/B)=P(B/A)
または
P(A∩B)=P(A)P(B)
問
上から下、下から上をそれぞれみちびけることを表わせ
ちな法政 >>929
両方嫌という層が流れるのを読みきれなかったんだろ。
ベターを選ぶじゃなくて、こいつは絶対嫌だからこっち…というファクターを入れなかったんだと思うよ
日本はヒラリー押しだったからおかしな感じだけど…ヒラリーがかっても日本に良いことなんてないはずなんだけどね サンプルが本当に無作為抽出だったのか
統計学の権威を政治に利用しようとした可能性
ヒラリーと答えそうな母集団から調査し、統計学がそういってるのだからと言ってどちらにするか迷っている勢を取り込む戦術 言われている通り、田舎の土人が大きな要因なら、調査時の土人のサンプルは割とお利口で、土人の実際の投票者の性質と予想以上にズレてたとかじゃ。
土人度が高いほど調査にも引っかかりにくそうだし。 選挙制度にもよるんじゃね?
多数派だから勝つとは限らない
平均的には少数派でも選挙制度的には勝つ事もあるだろう >>931
サンプルは無作為抽出
ただし、真の値を回答出来ない状況というバイアスがかかっていたんでしょ
トランプ支持者は差別主義者だ、みたいな風潮あるなら嘘の回答しても仕方ないよ >>944
だよなー
隠れトランプ支持がいることは分かってたんだから 絶対に
・個人情報(誰が誰を支持したか)が把握不可能
・投票前に結果が公表されたりして政治利用されない
事が保証された世界なら正しい統計がとれていたか >>929
トランプの方を予想してた人もたくさんいたのに、あなたが2016年米大統領選挙の予想が外れたと思い込んでるのはなぜ? ¥
>544 名前:132人目の素数さん :2016/11/10(木) 14:51:03.66 ID:Q64a0U8Q
> 違う貧民の総意
> 貧民は手玉に取られたのだ
>
>545 名前:132人目の素数さん :2016/11/10(木) 18:31:02.97 ID:XWS/rnm/
> メディアの政治操作を許さない民主主義の保全システムが
> 目的通りに完全に機能したのがすごい
>
>546 名前:¥ ◆2VB8wsVUoo :2016/11/10(木) 18:37:05.74 ID:6c0BrRUL
> メディアとかお上を鵜呑みにするどっかの馬鹿国民とは大違いですわ。
>
> ¥
>
>547 名前:¥ ◆2VB8wsVUoo :2016/11/10(木) 19:46:32.78 ID:6c0BrRUL
> 貧民の総意を汲んだらアカンのや、なるほどナ。そらァ自民党が喜ぶわサ。
>
> ケケケ¥
>
>548 名前:¥ ◆2VB8wsVUoo :2016/11/10(木) 19:52:21.65 ID:6c0BrRUL
> しかも貧民を手玉に取ってもアカンのかいな。ほしたら共産党とか、また
> かつての民主党とかはどないしたらエエのや。エライこっちゃwww
>
> コココ¥
>
>549 名前:貧民 ◆2VB8wsVUoo :2016/11/10(木) 20:00:41.60 ID:6c0BrRUL
> 貧民
> >>978
自身の権威主義的傾向ゆえに。
有名どころメディアが軒並み、ヒラリー・クリントン優勢という論調だったので。
それはともかく、調査票の回答方式には改善が必要だと、自分は15年ほど前からゼミの教授に言ってた。
すなわち、全ての回答は二段階にすべきだと。
「こう答えるべきだと思っている」回答と
「実は、こう思っている」回答とに。
よく知られた調査上のエラーだと知っているが、真剣に検討されたことがどれだけあったのか。 ¥
>544 名前:132人目の素数さん :2016/11/10(木) 14:51:03.66 ID:Q64a0U8Q
> 違う貧民の総意
> 貧民は手玉に取られたのだ
>
>545 名前:132人目の素数さん :2016/11/10(木) 18:31:02.97 ID:XWS/rnm/
> メディアの政治操作を許さない民主主義の保全システムが
> 目的通りに完全に機能したのがすごい
>
>546 名前:¥ ◆2VB8wsVUoo :2016/11/10(木) 18:37:05.74 ID:6c0BrRUL
> メディアとかお上を鵜呑みにするどっかの馬鹿国民とは大違いですわ。
>
> ¥
>
>547 名前:¥ ◆2VB8wsVUoo :2016/11/10(木) 19:46:32.78 ID:6c0BrRUL
> 貧民の総意を汲んだらアカンのや、なるほどナ。そらァ自民党が喜ぶわサ。
>
> ケケケ¥
>
>548 名前:¥ ◆2VB8wsVUoo :2016/11/10(木) 19:52:21.65 ID:6c0BrRUL
> しかも貧民を手玉に取ってもアカンのかいな。ほしたら共産党とか、また
> かつての民主党とかはどないしたらエエのや。エライこっちゃwww
>
> コココ¥
>
>549 名前:貧民 ◆2VB8wsVUoo :2016/11/10(木) 20:00:41.60 ID:6c0BrRUL
> 貧民
> レッドネックなんて未知の文明でデータに乗らなかっただけでしょう
アマゾンの奥地の部族で何が流行ってるかなんて興味ないのと同じで ¥
>544 名前:132人目の素数さん :2016/11/10(木) 14:51:03.66 ID:Q64a0U8Q
> 違う貧民の総意
> 貧民は手玉に取られたのだ
>
>545 名前:132人目の素数さん :2016/11/10(木) 18:31:02.97 ID:XWS/rnm/
> メディアの政治操作を許さない民主主義の保全システムが
> 目的通りに完全に機能したのがすごい
>
>546 名前:¥ ◆2VB8wsVUoo :2016/11/10(木) 18:37:05.74 ID:6c0BrRUL
> メディアとかお上を鵜呑みにするどっかの馬鹿国民とは大違いですわ。
>
> ¥
>
>547 名前:¥ ◆2VB8wsVUoo :2016/11/10(木) 19:46:32.78 ID:6c0BrRUL
> 貧民の総意を汲んだらアカンのや、なるほどナ。そらァ自民党が喜ぶわサ。
>
> ケケケ¥
>
>548 名前:¥ ◆2VB8wsVUoo :2016/11/10(木) 19:52:21.65 ID:6c0BrRUL
> しかも貧民を手玉に取ってもアカンのかいな。ほしたら共産党とか、また
> かつての民主党とかはどないしたらエエのや。エライこっちゃwww
>
> コココ¥
>
>549 名前:貧民 ◆2VB8wsVUoo :2016/11/10(木) 20:00:41.60 ID:6c0BrRUL
> 貧民
> >>980
回答が違えば、裏表ある人と思われる。
アンケートでわざわざ内面を見せるリスクを背負う必要があるのかな?
お金と宗教と政治に関しては、みんな本当のことは答えないよ ¥
>544 名前:132人目の素数さん :2016/11/10(木) 14:51:03.66 ID:Q64a0U8Q
> 違う貧民の総意
> 貧民は手玉に取られたのだ
>
>545 名前:132人目の素数さん :2016/11/10(木) 18:31:02.97 ID:XWS/rnm/
> メディアの政治操作を許さない民主主義の保全システムが
> 目的通りに完全に機能したのがすごい
>
>546 名前:¥ ◆2VB8wsVUoo :2016/11/10(木) 18:37:05.74 ID:6c0BrRUL
> メディアとかお上を鵜呑みにするどっかの馬鹿国民とは大違いですわ。
>
> ¥
>
>547 名前:¥ ◆2VB8wsVUoo :2016/11/10(木) 19:46:32.78 ID:6c0BrRUL
> 貧民の総意を汲んだらアカンのや、なるほどナ。そらァ自民党が喜ぶわサ。
>
> ケケケ¥
>
>548 名前:¥ ◆2VB8wsVUoo :2016/11/10(木) 19:52:21.65 ID:6c0BrRUL
> しかも貧民を手玉に取ってもアカンのかいな。ほしたら共産党とか、また
> かつての民主党とかはどないしたらエエのや。エライこっちゃwww
>
> コココ¥
>
>549 名前:貧民 ◆2VB8wsVUoo :2016/11/10(木) 20:00:41.60 ID:6c0BrRUL
> 貧民
> このスレッドは1000を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。
life time: 793日 5時間 37分 30秒 2ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。
───────────────────
《プレミアム会員の主な特典》
★ 2ちゃんねる専用ブラウザからの広告除去
★ 2ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
▼ プレミアム会員登録はこちら ▼
http://premium.2ch.net/
▼ 浪人ログインはこちら ▼
https://login.2ch.net/login.php レス数が1000を超えています。これ以上書き込みはできません。