ベイズの統計学を学び始めたんだけど
■ このスレッドは過去ログ倉庫に格納されています
信用に値するのか疑問です。
人工知能とかではなく日々の動機付けに利用する予定です >>618
統計学は数学と無関係というのが帰無仮説かな。 薬剤yを1人ずつ投与して効果判定したら、3人めで効果が確認できた。
薬剤gを9人同時に投与したら3人に効果があった。
どちらの有効性が高いか?
別バージョン(こっちがオリジナルw)
ゆるゆる女子大生に1人ずつメールで誘ったら3人めが開脚。、
がばがば女子大生9人に一斉にメールを送ったら3人が開脚。
どっちが開脚が容易か?
開脚率の期待値を計算してみた。
ゆるゆる女子大生の開脚率期待値:r人目で初めて開脚
r=3
Ex.yuru <- function(r){
integrate(function(x)x*(1-x)^(r-1)*x,0,1)$value/integrate(function(x)(1-x)^(r-1)*x,0,1)$value
}
Ex.yuru(r)
2/(r+2)
がばがば女子大生の開脚率期待値:N人中z人開脚
N=9
z=3
Ex.gaba <- function(N,z){
integrate(function(x) x*choose(N,z)*x^z*(1-x)^(N-z),0,1)$value/integrate(function(x)choose(N,z)*x^z*(1-x)^(N-z),0,1)$value
}
Ex.gaba(9,3)
(z+1)/(N+2) オークションでの出品者の評価が
出品者A 良い9人 悪い1人
出品者B 良い4人 悪い0人
であったとするとどちらが評価の高い出品者と言えるか? よく確率で、英語だと、
such thatって出てきますけど、
どういう意味ですか?
〜みたいな、で解釈してもいい? >>620
ex.gaba ex.yuru にはやられました。 >>618
> 統計学は他の板へ。
> 数学とは何も関係ないから。
禿同
統計学板を作って隔離して欲しいよね。
理論統計とか気持ち悪くて吐きそう 予備校の持ってる偏差値ピッグデータの方が噴飯モノの欧米のデータサイエンティスト笑わせだろ >>632
GOOGLEで
統計学で検索すると約 40,000,000 件
統計学 数学で検索すると約14,700,000 件
統計学 物理学で検索すると約 6,310,000 件
数学と物理学で統計学との関係の強さに差はない、を帰無仮説にする。
χ二乗検定でX-squared = 4543700でp.value < 2.2e-16
で帰無仮説は棄却された。 予備校の模試での合否判定ってロジスティク回帰でやってのかな 一様事前分布の代わりに使われるJefferyの分布beta(0.5,0.5)って
何の有用性があるのか今一つわからない。
2/π*arcsin(√x)になるのはわかるんだが。 >>640
Jefferyのは一対一のパラメータ変換後も関係が維持されて不偏になって余計なこと考えずに済む。
Φ=t(θ)のとき、
p(θ)〜|J(θ)|^1\2→p(Φ)〜|J(Φ)|^1\2
β(0.5,0.5)はpdfがベルヌーイ分布の時だな、ほかの時は知らん
wikiでよければこの辺は書いてある
https://en.m.wikipedia.org/wiki/Jeffreys_prior 江戸末期の田舎の下級武士に経済ユダヤが支援してテロを起こさせ江戸幕府を転覆させたのが明治維新。
江戸末期から日本は経済ユダヤとの繋がりがありお互いの利益の均衡を目指してきたのが今日までの政治
の中心課題だと言えます。複式簿記 資本主義 株式制度 現在の経済の根幹を作ったのは彼等であり、
全ての産業を掌握する彼等(総資産数京円以上)の意向を無視出来ません。旧ソ連 中国共産党 北朝鮮
ISISを作ったのは彼等であり、日本の技術流出 東芝の半導体事業からの撤退、シャープの倒産全て彼らの
シナリオ通りに動いてます。また、ここ数百年における世界の全ての紛争、戦争は彼等によって引き起こさ
れました。
彼らの目指している世界は自分達を支配階級とした人類の管理であり歯向かう人間の排除です。
私達が右や左と罵り合う姿は彼らにとって好都合であり、対立は彼らの支配体制の強化になります。そういっ
たことを全ての日本人が理解しないと同じことを繰り返し、十数年後 あの時安部が日本を滅茶苦茶にした。
今度の保守の誰々さんこそ日本を救うと喚いてるかもしれません。消費税廃止 移民反対と当たり前のことを
各政治家に要求し続けると同時に政治家は全員ユダヤの手先だと疑い続けないと日本の独立は成し得ません。
世界中の人間が知るべきこと
・世界の全てのメディアはユダ金が牛耳っている。
・トランプ プーチン 習近平 安部 麻生 テリーザ・メイ メルケル 文在寅 金正恩はユダ金の手下であり仲間である。
テレビに出てる有名な政治家は国内外問わず全員ユダヤの手先だと考える事。右や左などによる対立は茶番である。
・全てのテロと紛争と戦争は、ユダ金達と軍産複合体によって引き起こされている。 >>642
ありがとうございました。
Fisherの情報量から勉強してみます。 >>646
( 1/6*n*(n+1)*(2*n+1) + 1/2*n*(n+1) )/2 >>618
何も関係ないw
でも根拠は出さない
おまえの主観なんてだれも興味ねぇよ
何も強い関係ないなんて、全称命題的な否定するやつはまずバカ >>646
求める個数の一般解は
婆(k+1)/2
=這這1
ロリーローリンの公式から
n(n+1)(n+2)/3!
n=100より求める個数は
100・101・102/6
=10100・17
=171700 ■このゲームができるのは1回だけです
Aのツボは99個の青い球と1個の赤い球が詰まっている
Bのツボは99個の赤い球と1個の青い球が詰まっている
このとき、自分の目の前のツボから1個球を
取り出してみたら赤い球であった
目の前のツボはAのツボだろうか、Bのツボだろうか 問題
99人の囚人がいます。彼らの頭に1〜100までのナンバーカードが貼りつけられた帽子をランダムにかぶせます。
他人の帽子は見ることができても、自分の帽子は見ることができません。
帽子の数は全部で100なので、一つ使われずに余ります。
そのナンバーは囚人達にはわからないようにしておきます。
この状況で、囚人たちに一斉に自分のナンバーを宣言させて、全員が正解だったら釈放するという賭けをします。
囚人たちには帽子をかぶせられる前に相談タイムが設けられています。
どういう戦略を取れば、助かる確率を最も高くできるでしょうか? >>651
98人の数字に出てこなかった2つをお互いに申告したら使われてない数字が分かるから自分の数字が分かるンじゃないの? >>652
帽子を被されてからは囚人間の意思疎通はできない前提の問題。 >>650
Aを選ぶ確率がJeffery分布に従うとすると
# b=1-a
# P(r|a)=1/100
# P(r|b)=99/100
# P(a|r)=P(r|a)P(a)/[P(r|a)P(a)+P(r|b)P(b)]=0.01p/(0.01p+0.99(1-p))
library(rjags)
data=list(shape1=0.5,shape2=0.5)
modelstring='model{
par=0.01*p/(0.01*p+0.99*(1-p))
p ~ dbeta(shape1,shape2)
}めあ
'
writeLines(modelstring,'TEMPmodel.txt')
model=jags.model('TEMPmodel.txt',data=data)
update(model)
samples = coda.samples( jagsModel , variable=c("par",'p'), n.iter=100000 )
coda::HPDinterval(samples[,'par'])
hist(as.matrix(samples)[,'par'],freq=FALSE,main='',col='gray',xlab='Pr(A|red)',
breaks=50, axes=FALSE,ylab=''); axis(1)
求める確率P(箱A|赤玉)は
平均
> mean(as.matrix(samples)[,'par'])
[1] 0.03687427
信頼区間
> coda::HPDinterval(samples[,'par'])
[[1]]
lower upper
var1 0.0000001471041 0.1601718
attr(,"Probability")
[1] 0.95 # タイプミス修正
library(rjags)
data=list(shape1=0.5,shape2=0.5)
modelstring='model{
par=0.01*p/(0.01*p+0.99*(1-p))
p ~ dbeta(shape1,shape2)
}
'
writeLines(modelstring,'TEMPmodel.txt')
model=jags.model('TEMPmodel.txt',data=data)
update(model)
samples = coda.samples( jagsModel , variable=c("par",'p'), n.iter=100000 )
coda::HPDinterval(samples[,'par'])
par=as.matrix(samples)[,'par']
hist(par,freq=FALSE,main='',col='gray',xlab='Pr(A|red)',
breaks=50, axes=FALSE,ylab=''); axis(1)
BEST::plotPost(par,showMode=TRUE)
mean(par)
quantile(par,c(0.025,0.50,0.975)) 確率分布を考えないなら
赤玉でたときにAの箱であった確率は
> 0.01*0.5/(0.01*0.5+0.99*0.5)
[1] 0.01
一様分布にしたらこうなった。
> mean(par)
[1] 0.0369026
> coda::HPDinterval(samples[,'par'])
[[1]]
lower upper
var1 0.0000001761594 0.1594358
attr(,"Probability")
[1] 0.95 >>650
一様分布でのシミュレーションを100万回繰り返してみた。
pickup <- function(){ # A:Box 1, Red:Ball 1
A=c(1,rep(0,99))
B=c(0,rep(1,99))
AB=list(A,B)
Box=sample(1:2,1)
Ball=sample(AB[[Box]],1)
c(Box=Box,Ball=Ball)
}
pickup.sim <- function(k=1e3){
re=replicate(k,pickup())
PAR=sum(re['Box',]==1 & re['Ball',]==1)/sum(re['Ball',]==1)
return(PAR)
}
re=replicate(1e3,pickup.sim())
mean(re)
HDInterval::hdi(re)
median(re)
Mode(re)[1]
平均値
> mean(re)
[1] 0.01009577
95%信頼区間
> HDInterval::hdi(re)
lower upper
0.001901141 0.018329939
attr(,"credMass")
[1] 0.95
中央値
> median(re)
[1] 0.01002004
最頻値
> Mode(re)[1]
x
0.01020133 >>652
囚人がランダムに答えると、2の99乗分の1の釈放確率。
ネットで検索すると解答がみつかる。
釈放確率が1/2にできるという。
解説読んでも理解できなかったが、シミュレーションしたらその通りだった。
解答のurlと
シミュレーションのスクリプトはこれ。
http://rio2016.2ch.net/test/read.cgi/math/1501755792/443 ある大学の学生数は500以上1000人以下であることはわかっている。
無作為に2人を抽出して調べたところ
二人とも女子学生である確率は1/2であった。
この大学の学生数と女子学生数を求めよ。 問題文に問題があると思うが、意図を汲んで解くと
学生数=696
女子学生数=492 確率がちょうど1/2になる整数のペアは
女子 男子
3 1
15 6
85 35
493 204
問題文の表現に問題あるかな?
xC2 ÷ yC2=1/2の解を求める問題。 >>661
次に1/2になるのは
女子 2871 男子1189 総数4060 日本人の血液型はA,O,B,ABの比率が概略4:3:2:1であるという。
全部の血液型を集めるのは平均で何人集めればよいか?
シミュレーションで12.37、切り上げて13人になった。
解析解はよくわからん。 2x(x-1)(x-2)(x-3)=y(y-1)(y-2)(y-3)の整点は? >>666
式値=0は除くと
x=7, y=8
2*7*6*5*4=8*7*6*5 A:2x(x-1)=y(y-1)
この曲線Aは、4個の自明な整点
(x,y) ∈ {0,1}×{0,1}
を持つ
これが
無作為に2人を抽出して可能となる組み合わせ
{男男 男女 女男 女女}
に対応するという事かね?(´・ω・`) >>668
>659は
xC2 ÷ yC2=1/2
500<y<100
の自然数解を求めるだけの話。 学生数x 女子学生数y
無作為に2人を抽出して可能となる組み合わせ
{男男 男女 女男 女女}
{女女}50%…a
{男男 男女 女男}50%…b
500≦x≦1000
x=a+b
250≦a=x−b
bを分割する
{男男}…b1
{男女}…b2
{女男}…b3
事象aが観測された元でのそれぞれの確率は
P(b1|a)=P(b1) * P(a|b1)
P(b2|a)=P(b2) * P(a|b2)
P(b3|a)=P(b3) * P(a|b3)
学生数xに占める女子学生数yの割合は
y/x=7/10が尤もらしい
ゆえに、
P(b1|a)=P(b1) * P(a|b1)=3/10
P(b2|a)=P(b2) * P(a|b2)=1/10
P(b3|a)=P(b3) * P(a|b3)=1/10 あるタクシー会社のタクシーには1から通し番号がふられている。
タクシー会社の規模から保有タクシー台数は100台以下とわかっている(弱情報事前分布)。
この会社のタクシーを5台みかけた。最大の番号が60であった。
この会社の保有するタクシー台数の期待値と95%信用区間を求めよ。 Sum[n C[59,4]/C[n,5],{n,60,100}]/Sum[C[59,4]/C[n,5],{n,60,100}]
=2590100/36231≒71.4885
Sum[C[59,4]/C[n,5],{n,60,92}]/Sum[C[59,4]/C[n,5],{n,60,100}]
=0.947035
Sum[C[59,4]/C[n,5],{n,60,93}]/Sum[C[59,4]/C[n,5],{n,60,100}]
=0.95496
60〜93 Rで書くと
n=60:100
pmf=choose(60-1,5-1)/choose(n,5) #Pr(max=60|n)
pdf=pmf/sum (pmf)
sum( n*pdf) #E(n)
plot(n,cumsum(pdf))
abline(h=0.95,lty=3)
plot(n,cumsum(pdf),xlim=c(75,100),ylim=c(0.75,1),type='h')
abline(h=c(0.80,0.90,0.95),lty=3)
累積質量関数をグラフにすると
http://imagizer.imageshack.com/img924/9020/nxNiAP.jpg 時系列データでデータが下降傾向にあるってことを確認する統計手法ってあるの?
二項分布でp=1/2として検定するとか?
例えば5回連続以上で下降になれば微妙なさげでも下降傾向があると判定できる? 5回連続で下降になると(1/2)^5<5%になるからって意味。 同窓会に各人、景品を持ち込む。
全体を集めてクジで持ち帰る景品が決まる。
自分の景品を持ち帰ることになる人数の期待値はいくらか? >>680
2人なら0*1/2+2*2で期待値は1人だよ。 2人なら0*1/2+1/2*2で期待値は1人だよ。 >>678
kは0 からnまでとして
k*nCk*(1/n)^k*(1-1/n)^(n-k)
がnによらず1になることが示せれば終わり。 >>680
それは、ある一人が自分の景品を持ち帰る確率な。 そもそも一人あたり何個の景品を持って来るの?
一人一個持ってきて、分割せず一個を渡すなら、期待値は一人じゃないの? インフルエンザの迅速キットは特異度は高いが感度は検査時期によって左右される。
ある診断キットが開発されたとする。
このキットは特異度は99%と良好であったが、
感度については確かな情報がない。
事前確率分布として一様分布を仮定する。
50人をこの診断キットで診断したところ40人が陽性であった。
この診断キットの感度とその95%CI、及び母集団の有病率とその95%CIは? 1回のじゃんけんで決まる勝者の数が最大になるのは何人でじゃんけんをしたときか?
計算していたら4人になったのは意外。 >>689
あいこのときは勝者が出るまでやり直すなら
n人のジャンケンなら期待値は n/2人 >>689
2〜10人で全員で一度だけじゃんけんをしたときの勝者の数の期待値は
6 / 9
27 / 27
84 / 81
225 / 243
558 / 729
1323 / 2187
3048 / 6561
6885 / 19683
15330 / 59049
[1] 0.6666667 1.0000000 1.0370370 0.9259259 0.7654321 0.6049383 0.4645633 0.3497942
[9] 0.2596149
4人のときが84/81で最大値。 >>691
あいこはやり直しでの
ジャンケンのシミュレーション、1は3に勝ち、3は2に勝ち、2は1に勝つ
xは1,2,3 の並び
1回のジャンケンでの勝者の数を返す
Win <- function(x){# 1 beats 3, 3 beats 2, 2 beats 1
if(length(unique(x))!=2 ) return(0) # no winner
u=sort(unique(x))
if(all(u==c(1,2))) return(sum(x==2))
if(all(u==c(2,3))) return(sum(x==3))
if(all(u==c(1,3))) return(sum(x==1))
}
Jnk.sim <- function(n){
x=sample(1:3,n,replace = TRUE)
while(Win(x)==0){ # repeats when no winner
x=sample(1:3,n,replace = TRUE)
}
Win(x)
}
mean(replicate(1e3,Jnk.sim(10)))
10人でのシミュレーションで期待値は約5
> mean(replicate(1e3,Jnk.sim(10)))
[1] 4.99 ,,__,,
/ `、
/ ヽ
/ ● ● |
/l ''''' し '''''' |
/ l __. |
l /ヽ_ ` --' _ノ
\  ̄ ヽ∩
⌒l l三 |
| ヽ.__| エーザイのアルツハイマー新薬のベイジアン解析の資料読んで
俺に分かりやすく説明してください >>696
ネットワークベイジアンメタアナリシス? 高校で一般人も習う条件付き確率になぜ変な名前をつけて喜んでんの? >>698
なんでも確率変数にできるから。
p値の信頼区間(ベイズでは信用区間と呼ぶ)もだせるよ。 嘘には三つの種類がある
ただの嘘と
真っ赤な嘘と
統計だ
ってアカポス取れない数学科が統計に流れて薬学だの保険屋になって詐欺をするんだな 統計は嘘をつくための道具だよ
いかに上手く丸め込むか
尤もらしいことを言えた者が勝ち
最尤推定なんて
「もっとももっともらしい」
ってまさにそれだし >>698
MCMCと組み合わせるといい感じだから >>701
小児甲状腺がんが増えていないとかに援用されてるね。 1964年、茨城県南の国道バイパスで突如自家用車が
消失するという事件が起こった
毎日新聞でも取り上げられたこの不可解な失踪事件は
今もなお未解決である 検定はだめだめ言われるけど
なんで未だにどの教科書にも基礎事項としてでてくるんだ? >>710
メンデルの法則の実験データは法則に合致し過ぎて捏造の疑いを指摘したのがフィシャーだったかな。 統計による「検定」
サイコロを2回振ったら順に1,2であった。
その確率は(1/6)*(1/6)=1/36=0.027 < 0.05だから
このサイコロはイビツである。
100人に一人が当たるくじを1本太郎君が引いたら当たった。
この確率は0.01 < 0.05だからこのくじはイカサマである。 >>712
正にこれ
なんで5%しか起こらないことが起こったからといって
仮定を否定する根拠になるわけがない
しかも
改めた結論を元に別のことをまたまた検定してとか
検定に検定を重ねまくることが良くある
1枚でも眉唾な曇りガラスを
何枚も重ねて得られる結論って意味ないだろ >>712
まさにコレか?
検定に問題あるといえこれは検定を理解してない
ダメな統計の典型でしょコレ
検定力全く考慮してないし
というか科学を理解してないような >検定に検定を重ねまくることが良くある
これはやってる本人が問題性に気付かないでやったり悪用するなら問題だけど
問題性に気づいてて探索的にやるのは別に問題ない
検討したい仮説がみつかれば
それを確かめるための実験をくむなり新しいデータをとって追試することが大事なわけで
検定でやる必要はないけど
再現性こそ科学をささえるものなのではないかと思うけど 検定の問題ってのは結局
使う側にも結果を見る側にも誤解をあたえやすいってのが問題なのではないかと コインを5回投げたら全部、表であった。
0.5^5 < 0.03125なのでこのコインはイカサマ。
コインを5回投げたら表裏表裏表であった。
0.5^5 < 0.03125なので このコインもイカサマ。 (脱字修正)
コインを5回投げたら全部、表であった。
0.5^5 = 0.03125 < 0.05 なのでこのコインはイカサマ。
コインを5回投げたら表裏表裏表であった。
0.5^5 = 0.03125 < 0.05 なので このコインもイカサマ。 ■ このスレッドは過去ログ倉庫に格納されています