ベイズの統計学を学び始めたんだけど
レス数が1000を超えています。これ以上書き込みはできません。
《平均寿命のワシの超確率Kサン論》
例えば、寿命の西暦3001年の統計が
極めて簡単かつ仮に
P(0才→20才 | 2980年生) = 0.01
P(20才→40才 | 2960年生) = 1
P(40才→60才 | 2940年生) = 1
P(60才→80才 | 2920年生) = 1
P(80才→100才 | 2900年生) =0.99
P(100才→120才 | 2880年生) = 0.0
としよう。
西暦3001年平均寿命は、ワシのKサン論なら
0.01*(0+20)/2 + 0.99*(80+100)/2 = 89.2才
尚、2980年生れの子は、
20才まで生きる確率は、0.99
40才まで生きる確率は、0.99^2
60才まで生きる確率は、0.99^3
…
138才まで生きる確率は、0.99^69 = 0.5
なのぢゃ。
ぢゃ〜また。 ベイズとはたぶん無関係だが話題提供。
壺の中に n 種類の異なるクーポンが入っている。1回の試行で壺の中から1枚クーポンを引き、引いたものと同じ種類のクーポンを壺の中に戻すものとする。
n 種類(全種類)のクーポンを集めようとしたとき、 t 回以上の試行回数が必要となる確率はいくつだろうか? むずい・・・壺とかコインをイメージしただけで拒絶反応が出る 〔参考書〕
H.C.von Baeyer 「QB ism - 量子×ベイズ」 森北出版 (2018/Mar)
256p.3024円 松浦俊輔 (訳)、 木村 元 (解説)
量子情報時代の新解釈
http://www.morikita.co.jp/books/book/3166 帰無仮説が正しいときに棄却する確率Pr(Reject | H0)が第一種の過誤。
棄却された帰無仮説が正しい確率Pr(H0 | Reject)をFalse Positive Report Probabilityと呼ぶらしい。
条件付き確率で条件入れ替えってベイズぽいよね。 P(H0|Reject)=P(Reject|H0)P(H0)/P(Reject)
=P(Reject|H0)P(H0) / { P(Reject|H0)P(H0) + P(Reject|H1)P(H1) }
第一の過誤=α 第二種の過誤βとすると
P(H0|Reject)= αP(H0)/{αP(H0) + (1-β)(1-P(H0))}
でP(H0)を事前確率に想定しなければ算出できないな。 FPRP = Pr(H0|y)
= BF*PO/(BF*PO+1)
( BF = Pr(y|H0)/Pr(y | H1) : Bayes factor , PO = π0/(1-π0) 帰無仮説のオッズ) 「ビールには水が入っている」
「ウィスキーにも水が入っている」
「ブランデーにも水が入っている」
よって「水を飲むと酔っ払う」(・∀・) >>616
水が重回帰で選択されなかったら
いいのかな?
選択されたら介入で因果関係を証明するしかないのかな? >>618
統計学は数学と無関係というのが帰無仮説かな。 薬剤yを1人ずつ投与して効果判定したら、3人めで効果が確認できた。
薬剤gを9人同時に投与したら3人に効果があった。
どちらの有効性が高いか?
別バージョン(こっちがオリジナルw)
ゆるゆる女子大生に1人ずつメールで誘ったら3人めが開脚。、
がばがば女子大生9人に一斉にメールを送ったら3人が開脚。
どっちが開脚が容易か?
開脚率の期待値を計算してみた。
ゆるゆる女子大生の開脚率期待値:r人目で初めて開脚
r=3
Ex.yuru <- function(r){
integrate(function(x)x*(1-x)^(r-1)*x,0,1)$value/integrate(function(x)(1-x)^(r-1)*x,0,1)$value
}
Ex.yuru(r)
2/(r+2)
がばがば女子大生の開脚率期待値:N人中z人開脚
N=9
z=3
Ex.gaba <- function(N,z){
integrate(function(x) x*choose(N,z)*x^z*(1-x)^(N-z),0,1)$value/integrate(function(x)choose(N,z)*x^z*(1-x)^(N-z),0,1)$value
}
Ex.gaba(9,3)
(z+1)/(N+2) オークションでの出品者の評価が
出品者A 良い9人 悪い1人
出品者B 良い4人 悪い0人
であったとするとどちらが評価の高い出品者と言えるか? よく確率で、英語だと、
such thatって出てきますけど、
どういう意味ですか?
〜みたいな、で解釈してもいい? >>620
ex.gaba ex.yuru にはやられました。 >>618
> 統計学は他の板へ。
> 数学とは何も関係ないから。
禿同
統計学板を作って隔離して欲しいよね。
理論統計とか気持ち悪くて吐きそう 予備校の持ってる偏差値ピッグデータの方が噴飯モノの欧米のデータサイエンティスト笑わせだろ >>632
GOOGLEで
統計学で検索すると約 40,000,000 件
統計学 数学で検索すると約14,700,000 件
統計学 物理学で検索すると約 6,310,000 件
数学と物理学で統計学との関係の強さに差はない、を帰無仮説にする。
χ二乗検定でX-squared = 4543700でp.value < 2.2e-16
で帰無仮説は棄却された。 予備校の模試での合否判定ってロジスティク回帰でやってのかな 一様事前分布の代わりに使われるJefferyの分布beta(0.5,0.5)って
何の有用性があるのか今一つわからない。
2/π*arcsin(√x)になるのはわかるんだが。 >>640
Jefferyのは一対一のパラメータ変換後も関係が維持されて不偏になって余計なこと考えずに済む。
Φ=t(θ)のとき、
p(θ)〜|J(θ)|^1\2→p(Φ)〜|J(Φ)|^1\2
β(0.5,0.5)はpdfがベルヌーイ分布の時だな、ほかの時は知らん
wikiでよければこの辺は書いてある
https://en.m.wikipedia.org/wiki/Jeffreys_prior 江戸末期の田舎の下級武士に経済ユダヤが支援してテロを起こさせ江戸幕府を転覆させたのが明治維新。
江戸末期から日本は経済ユダヤとの繋がりがありお互いの利益の均衡を目指してきたのが今日までの政治
の中心課題だと言えます。複式簿記 資本主義 株式制度 現在の経済の根幹を作ったのは彼等であり、
全ての産業を掌握する彼等(総資産数京円以上)の意向を無視出来ません。旧ソ連 中国共産党 北朝鮮
ISISを作ったのは彼等であり、日本の技術流出 東芝の半導体事業からの撤退、シャープの倒産全て彼らの
シナリオ通りに動いてます。また、ここ数百年における世界の全ての紛争、戦争は彼等によって引き起こさ
れました。
彼らの目指している世界は自分達を支配階級とした人類の管理であり歯向かう人間の排除です。
私達が右や左と罵り合う姿は彼らにとって好都合であり、対立は彼らの支配体制の強化になります。そういっ
たことを全ての日本人が理解しないと同じことを繰り返し、十数年後 あの時安部が日本を滅茶苦茶にした。
今度の保守の誰々さんこそ日本を救うと喚いてるかもしれません。消費税廃止 移民反対と当たり前のことを
各政治家に要求し続けると同時に政治家は全員ユダヤの手先だと疑い続けないと日本の独立は成し得ません。
世界中の人間が知るべきこと
・世界の全てのメディアはユダ金が牛耳っている。
・トランプ プーチン 習近平 安部 麻生 テリーザ・メイ メルケル 文在寅 金正恩はユダ金の手下であり仲間である。
テレビに出てる有名な政治家は国内外問わず全員ユダヤの手先だと考える事。右や左などによる対立は茶番である。
・全てのテロと紛争と戦争は、ユダ金達と軍産複合体によって引き起こされている。 >>642
ありがとうございました。
Fisherの情報量から勉強してみます。 >>646
( 1/6*n*(n+1)*(2*n+1) + 1/2*n*(n+1) )/2 >>618
何も関係ないw
でも根拠は出さない
おまえの主観なんてだれも興味ねぇよ
何も強い関係ないなんて、全称命題的な否定するやつはまずバカ >>646
求める個数の一般解は
婆(k+1)/2
=這這1
ロリーローリンの公式から
n(n+1)(n+2)/3!
n=100より求める個数は
100・101・102/6
=10100・17
=171700 ■このゲームができるのは1回だけです
Aのツボは99個の青い球と1個の赤い球が詰まっている
Bのツボは99個の赤い球と1個の青い球が詰まっている
このとき、自分の目の前のツボから1個球を
取り出してみたら赤い球であった
目の前のツボはAのツボだろうか、Bのツボだろうか 問題
99人の囚人がいます。彼らの頭に1〜100までのナンバーカードが貼りつけられた帽子をランダムにかぶせます。
他人の帽子は見ることができても、自分の帽子は見ることができません。
帽子の数は全部で100なので、一つ使われずに余ります。
そのナンバーは囚人達にはわからないようにしておきます。
この状況で、囚人たちに一斉に自分のナンバーを宣言させて、全員が正解だったら釈放するという賭けをします。
囚人たちには帽子をかぶせられる前に相談タイムが設けられています。
どういう戦略を取れば、助かる確率を最も高くできるでしょうか? >>651
98人の数字に出てこなかった2つをお互いに申告したら使われてない数字が分かるから自分の数字が分かるンじゃないの? >>652
帽子を被されてからは囚人間の意思疎通はできない前提の問題。 >>650
Aを選ぶ確率がJeffery分布に従うとすると
# b=1-a
# P(r|a)=1/100
# P(r|b)=99/100
# P(a|r)=P(r|a)P(a)/[P(r|a)P(a)+P(r|b)P(b)]=0.01p/(0.01p+0.99(1-p))
library(rjags)
data=list(shape1=0.5,shape2=0.5)
modelstring='model{
par=0.01*p/(0.01*p+0.99*(1-p))
p ~ dbeta(shape1,shape2)
}めあ
'
writeLines(modelstring,'TEMPmodel.txt')
model=jags.model('TEMPmodel.txt',data=data)
update(model)
samples = coda.samples( jagsModel , variable=c("par",'p'), n.iter=100000 )
coda::HPDinterval(samples[,'par'])
hist(as.matrix(samples)[,'par'],freq=FALSE,main='',col='gray',xlab='Pr(A|red)',
breaks=50, axes=FALSE,ylab=''); axis(1)
求める確率P(箱A|赤玉)は
平均
> mean(as.matrix(samples)[,'par'])
[1] 0.03687427
信頼区間
> coda::HPDinterval(samples[,'par'])
[[1]]
lower upper
var1 0.0000001471041 0.1601718
attr(,"Probability")
[1] 0.95 # タイプミス修正
library(rjags)
data=list(shape1=0.5,shape2=0.5)
modelstring='model{
par=0.01*p/(0.01*p+0.99*(1-p))
p ~ dbeta(shape1,shape2)
}
'
writeLines(modelstring,'TEMPmodel.txt')
model=jags.model('TEMPmodel.txt',data=data)
update(model)
samples = coda.samples( jagsModel , variable=c("par",'p'), n.iter=100000 )
coda::HPDinterval(samples[,'par'])
par=as.matrix(samples)[,'par']
hist(par,freq=FALSE,main='',col='gray',xlab='Pr(A|red)',
breaks=50, axes=FALSE,ylab=''); axis(1)
BEST::plotPost(par,showMode=TRUE)
mean(par)
quantile(par,c(0.025,0.50,0.975)) 確率分布を考えないなら
赤玉でたときにAの箱であった確率は
> 0.01*0.5/(0.01*0.5+0.99*0.5)
[1] 0.01
一様分布にしたらこうなった。
> mean(par)
[1] 0.0369026
> coda::HPDinterval(samples[,'par'])
[[1]]
lower upper
var1 0.0000001761594 0.1594358
attr(,"Probability")
[1] 0.95 >>650
一様分布でのシミュレーションを100万回繰り返してみた。
pickup <- function(){ # A:Box 1, Red:Ball 1
A=c(1,rep(0,99))
B=c(0,rep(1,99))
AB=list(A,B)
Box=sample(1:2,1)
Ball=sample(AB[[Box]],1)
c(Box=Box,Ball=Ball)
}
pickup.sim <- function(k=1e3){
re=replicate(k,pickup())
PAR=sum(re['Box',]==1 & re['Ball',]==1)/sum(re['Ball',]==1)
return(PAR)
}
re=replicate(1e3,pickup.sim())
mean(re)
HDInterval::hdi(re)
median(re)
Mode(re)[1]
平均値
> mean(re)
[1] 0.01009577
95%信頼区間
> HDInterval::hdi(re)
lower upper
0.001901141 0.018329939
attr(,"credMass")
[1] 0.95
中央値
> median(re)
[1] 0.01002004
最頻値
> Mode(re)[1]
x
0.01020133 >>652
囚人がランダムに答えると、2の99乗分の1の釈放確率。
ネットで検索すると解答がみつかる。
釈放確率が1/2にできるという。
解説読んでも理解できなかったが、シミュレーションしたらその通りだった。
解答のurlと
シミュレーションのスクリプトはこれ。
http://rio2016.2ch.net/test/read.cgi/math/1501755792/443 ある大学の学生数は500以上1000人以下であることはわかっている。
無作為に2人を抽出して調べたところ
二人とも女子学生である確率は1/2であった。
この大学の学生数と女子学生数を求めよ。 問題文に問題があると思うが、意図を汲んで解くと
学生数=696
女子学生数=492 確率がちょうど1/2になる整数のペアは
女子 男子
3 1
15 6
85 35
493 204
問題文の表現に問題あるかな?
xC2 ÷ yC2=1/2の解を求める問題。 >>661
次に1/2になるのは
女子 2871 男子1189 総数4060 日本人の血液型はA,O,B,ABの比率が概略4:3:2:1であるという。
全部の血液型を集めるのは平均で何人集めればよいか?
シミュレーションで12.37、切り上げて13人になった。
解析解はよくわからん。 2x(x-1)(x-2)(x-3)=y(y-1)(y-2)(y-3)の整点は? >>666
式値=0は除くと
x=7, y=8
2*7*6*5*4=8*7*6*5 A:2x(x-1)=y(y-1)
この曲線Aは、4個の自明な整点
(x,y) ∈ {0,1}×{0,1}
を持つ
これが
無作為に2人を抽出して可能となる組み合わせ
{男男 男女 女男 女女}
に対応するという事かね?(´・ω・`) >>668
>659は
xC2 ÷ yC2=1/2
500<y<100
の自然数解を求めるだけの話。 学生数x 女子学生数y
無作為に2人を抽出して可能となる組み合わせ
{男男 男女 女男 女女}
{女女}50%…a
{男男 男女 女男}50%…b
500≦x≦1000
x=a+b
250≦a=x−b
bを分割する
{男男}…b1
{男女}…b2
{女男}…b3
事象aが観測された元でのそれぞれの確率は
P(b1|a)=P(b1) * P(a|b1)
P(b2|a)=P(b2) * P(a|b2)
P(b3|a)=P(b3) * P(a|b3)
学生数xに占める女子学生数yの割合は
y/x=7/10が尤もらしい
ゆえに、
P(b1|a)=P(b1) * P(a|b1)=3/10
P(b2|a)=P(b2) * P(a|b2)=1/10
P(b3|a)=P(b3) * P(a|b3)=1/10 あるタクシー会社のタクシーには1から通し番号がふられている。
タクシー会社の規模から保有タクシー台数は100台以下とわかっている(弱情報事前分布)。
この会社のタクシーを5台みかけた。最大の番号が60であった。
この会社の保有するタクシー台数の期待値と95%信用区間を求めよ。 Sum[n C[59,4]/C[n,5],{n,60,100}]/Sum[C[59,4]/C[n,5],{n,60,100}]
=2590100/36231≒71.4885
Sum[C[59,4]/C[n,5],{n,60,92}]/Sum[C[59,4]/C[n,5],{n,60,100}]
=0.947035
Sum[C[59,4]/C[n,5],{n,60,93}]/Sum[C[59,4]/C[n,5],{n,60,100}]
=0.95496
60〜93 Rで書くと
n=60:100
pmf=choose(60-1,5-1)/choose(n,5) #Pr(max=60|n)
pdf=pmf/sum (pmf)
sum( n*pdf) #E(n)
plot(n,cumsum(pdf))
abline(h=0.95,lty=3)
plot(n,cumsum(pdf),xlim=c(75,100),ylim=c(0.75,1),type='h')
abline(h=c(0.80,0.90,0.95),lty=3)
累積質量関数をグラフにすると
http://imagizer.imageshack.com/img924/9020/nxNiAP.jpg 時系列データでデータが下降傾向にあるってことを確認する統計手法ってあるの?
二項分布でp=1/2として検定するとか?
例えば5回連続以上で下降になれば微妙なさげでも下降傾向があると判定できる? 5回連続で下降になると(1/2)^5<5%になるからって意味。 同窓会に各人、景品を持ち込む。
全体を集めてクジで持ち帰る景品が決まる。
自分の景品を持ち帰ることになる人数の期待値はいくらか? >>680
2人なら0*1/2+2*2で期待値は1人だよ。 2人なら0*1/2+1/2*2で期待値は1人だよ。 >>678
kは0 からnまでとして
k*nCk*(1/n)^k*(1-1/n)^(n-k)
がnによらず1になることが示せれば終わり。 >>680
それは、ある一人が自分の景品を持ち帰る確率な。 そもそも一人あたり何個の景品を持って来るの?
一人一個持ってきて、分割せず一個を渡すなら、期待値は一人じゃないの? インフルエンザの迅速キットは特異度は高いが感度は検査時期によって左右される。
ある診断キットが開発されたとする。
このキットは特異度は99%と良好であったが、
感度については確かな情報がない。
事前確率分布として一様分布を仮定する。
50人をこの診断キットで診断したところ40人が陽性であった。
この診断キットの感度とその95%CI、及び母集団の有病率とその95%CIは? 1回のじゃんけんで決まる勝者の数が最大になるのは何人でじゃんけんをしたときか?
計算していたら4人になったのは意外。 >>689
あいこのときは勝者が出るまでやり直すなら
n人のジャンケンなら期待値は n/2人 >>689
2〜10人で全員で一度だけじゃんけんをしたときの勝者の数の期待値は
6 / 9
27 / 27
84 / 81
225 / 243
558 / 729
1323 / 2187
3048 / 6561
6885 / 19683
15330 / 59049
[1] 0.6666667 1.0000000 1.0370370 0.9259259 0.7654321 0.6049383 0.4645633 0.3497942
[9] 0.2596149
4人のときが84/81で最大値。 >>691
あいこはやり直しでの
ジャンケンのシミュレーション、1は3に勝ち、3は2に勝ち、2は1に勝つ
xは1,2,3 の並び
1回のジャンケンでの勝者の数を返す
Win <- function(x){# 1 beats 3, 3 beats 2, 2 beats 1
if(length(unique(x))!=2 ) return(0) # no winner
u=sort(unique(x))
if(all(u==c(1,2))) return(sum(x==2))
if(all(u==c(2,3))) return(sum(x==3))
if(all(u==c(1,3))) return(sum(x==1))
}
Jnk.sim <- function(n){
x=sample(1:3,n,replace = TRUE)
while(Win(x)==0){ # repeats when no winner
x=sample(1:3,n,replace = TRUE)
}
Win(x)
}
mean(replicate(1e3,Jnk.sim(10)))
10人でのシミュレーションで期待値は約5
> mean(replicate(1e3,Jnk.sim(10)))
[1] 4.99 ,,__,,
/ `、
/ ヽ
/ ● ● |
/l ''''' し '''''' |
/ l __. |
l /ヽ_ ` --' _ノ
\  ̄ ヽ∩
⌒l l三 |
| ヽ.__| エーザイのアルツハイマー新薬のベイジアン解析の資料読んで
俺に分かりやすく説明してください >>696
ネットワークベイジアンメタアナリシス? 高校で一般人も習う条件付き確率になぜ変な名前をつけて喜んでんの? >>698
なんでも確率変数にできるから。
p値の信頼区間(ベイズでは信用区間と呼ぶ)もだせるよ。 嘘には三つの種類がある
ただの嘘と
真っ赤な嘘と
統計だ
ってアカポス取れない数学科が統計に流れて薬学だの保険屋になって詐欺をするんだな 統計は嘘をつくための道具だよ
いかに上手く丸め込むか
尤もらしいことを言えた者が勝ち
最尤推定なんて
「もっとももっともらしい」
ってまさにそれだし >>698
MCMCと組み合わせるといい感じだから >>701
小児甲状腺がんが増えていないとかに援用されてるね。 1964年、茨城県南の国道バイパスで突如自家用車が
消失するという事件が起こった
毎日新聞でも取り上げられたこの不可解な失踪事件は
今もなお未解決である 検定はだめだめ言われるけど
なんで未だにどの教科書にも基礎事項としてでてくるんだ? >>710
メンデルの法則の実験データは法則に合致し過ぎて捏造の疑いを指摘したのがフィシャーだったかな。 統計による「検定」
サイコロを2回振ったら順に1,2であった。
その確率は(1/6)*(1/6)=1/36=0.027 < 0.05だから
このサイコロはイビツである。
100人に一人が当たるくじを1本太郎君が引いたら当たった。
この確率は0.01 < 0.05だからこのくじはイカサマである。 >>712
正にこれ
なんで5%しか起こらないことが起こったからといって
仮定を否定する根拠になるわけがない
しかも
改めた結論を元に別のことをまたまた検定してとか
検定に検定を重ねまくることが良くある
1枚でも眉唾な曇りガラスを
何枚も重ねて得られる結論って意味ないだろ >>712
まさにコレか?
検定に問題あるといえこれは検定を理解してない
ダメな統計の典型でしょコレ
検定力全く考慮してないし
というか科学を理解してないような >検定に検定を重ねまくることが良くある
これはやってる本人が問題性に気付かないでやったり悪用するなら問題だけど
問題性に気づいてて探索的にやるのは別に問題ない
検討したい仮説がみつかれば
それを確かめるための実験をくむなり新しいデータをとって追試することが大事なわけで
検定でやる必要はないけど
再現性こそ科学をささえるものなのではないかと思うけど 検定の問題ってのは結局
使う側にも結果を見る側にも誤解をあたえやすいってのが問題なのではないかと コインを5回投げたら全部、表であった。
0.5^5 < 0.03125なのでこのコインはイカサマ。
コインを5回投げたら表裏表裏表であった。
0.5^5 < 0.03125なので このコインもイカサマ。 (脱字修正)
コインを5回投げたら全部、表であった。
0.5^5 = 0.03125 < 0.05 なのでこのコインはイカサマ。
コインを5回投げたら表裏表裏表であった。
0.5^5 = 0.03125 < 0.05 なので このコインもイカサマ。 p値とは、その事象以下の確率でしか起こらない現象の確率の総和である。
↑↑
サイコロをふって1の目が10回でた。その確率は(1/6)^10
6 2 4 5 2 5 1 3 6 2 の順にでる確率も(1/6)^10である。
1 4 2 4 2 2 4 4 1 1 の順にでる確率も(1/6)^10である。
....
この順列は6^10通り存在するt。
これを全部加算すると p値は(1/6)^10 * 6^10 = 1
ゆえに、いかなるサイコロも統計的にイカサマとはいえない。 >>718
仮説が立ってない
データで検証しうる仮説は何をたてたの?
検定はまず仮説からたてないとダメ
君がやってるのは統計的仮説検定ではないよ 検定に置いて大事なのは
サンプルサイズ、検定力、有意水準、効果量
仮説もきちんと事前にたてるのプロセスとして大事
このあたりが欠けてる検定は何も意味ないよ あれ?このやりとり前にもやったような。。。
同じやつが書いてるのならループするだけだな
落ちるわ 帰無仮説は表がでる確率=1/2
サイコロの各々の目がでる確率=1/6
じゃね? そこが問題じゃない
1/6であることが起こったから
帰無仮説を棄却するというのが根拠ないってこと
それから
前に上げたこと以外に
両側検定なら対立仮説が棄却されるのに
片側検定なら採択されるとか
恣意的に両側片側を選んで上手く欺すことが可能なことも多い
だいたい
片側検定では正の範囲あるいは負の範囲だけ考えるんだから
つまりは条件付き確率を考えるようなもの
であるからして有意水準は半分にしないとおかしい
両側検定の有意水準÷2=片側検定の有意水準
であるべきなのに同じ有意水準でいいとしてるのが
この欺瞞の元凶 >>719
サイコロの各々の目がでる確率=1/6を事前分布として
サイコロをふって1の目が10回でたら、1の目のでる確率のモード値は0.7
6 2 4 5 2 5 1 3 6 2 の順にでたら、1の目のでる確率のモード値は0.07
98%CIとともに図示すると、http://i.imgur.com/CTvq0lL.jpg
p値なんぞ判断には不要。 サイコロのある目のでる確率の95%CIが0.10〜0.20に含まれたときにその目に関しては歪ではない、と定義する。
サイコロを1000回投げて1〜6の目の回数が
309 251 196 151 49 44
であったときの各々の目のでる確率分布は以下のようになる。
95%HDI と 0.10-0.20を比べて1、2、5、6は歪、3はどちらとも言えない、4は歪でないと判断できる。
https://i.imgur.com/w4YD0t9.jpg >>723
1のでる確率=1/6じゃなくて
それぞれの確率=1/6?
全部の確率について仮説たててるの?
P1=P2=P3=P4=P5=P6=1/6が仮説?
それどう考えても自由度足りないよね?
その仮説考えたら次にすべきは
どういうデータを取れば論証できるだろうかになるわけだが
2回ふってでた目をみてそれの確率求めることで一体なにが論証できると思う?
それって何が出ても1/36になるけどそれが検証可能なデータだと思う?
そこに何の意味があるの?
そもそもなぜそこで、n=2の母比率検定じゃなくて、
N=1の一回目の確率x二回目の確率という事象の確率を検討するの?
検定いぜんに実験の企画段階がめちゃくちゃ可笑しいとおもうんだけどな >>724
そうかね自分は科学的なしゅほうだとおもうけどな
科学的な手法ってのは
問をたて仮説をたて
それを検証できるデータをとり
そこから仮説がどうなのか検証し
どうやらこの仮説ははいろいろ説明できるようだぞというなら
とりあえず残しておく
いやいろいろ説明できない点があるぞというときは
とりあえず研究対象から外す
ほんでほかのやつが残った仮説にもどうやら問題あるようだ
こっちのほうがうまく説明できるようだと別の仮説を立てる
しかしかし、以前、は研究対象から外したものがいろいろ調べてみると正しいようだというデータをあつめるやつがいる
これって科学的仮説がたどっていく過程そのもの何だがな
仮説検定はその一旦を担ってるいる似すぎないだけであって
それで全てというものではない。
科学なんてあくまで仮説の積み上げで
仮説が多くの合意を得ることもあるが、その仮説が正しいとするのは結構曖昧にすぎず
不安定なものに過ぎない
根拠がないと言うが統計によってえられた結論ってそもそもどんなものも大した根拠なくて主観がどこかにはいってるよね。 片側両側については一理ないこともないとおもう
しかし、片側にするってことは片側は起きないだろうという論理的説明を一応出来る状態にあるということ
となると対立仮説も片側に発生する可能性がたかくなるわけでしょ。
だったらかりに推定する母数が平均値なら、きむ仮説でたてた平均値にちかい真の平均値も増えるだろう
だったら採択いきは狭くして棄却域増やさざるを得なくなる
という仮説
こういう宗教的論争を多数生み出すてんで結局仮説検定は問題あるんだけどね。 帰無仮説をサイコロの各々の目がでる確率=1/6とするとき
1の目が続けて何回でたら、帰無仮説を棄却する?
棄却されたときに1の目がでる確率はどれくらいのなのか?
1/6.0000001 なのか 1/2なのか? p値は何かを語るだろうか?
むしろ、1の目のでる確率の95%CIが1/12から1/3なら許容範囲、1/12以下や1/3以上なら1の目に関して歪なサイコロと判断する方が実用的だと思う。
1の目が2〜9回連続したときの1の目のでる確率をグラフにすると次のようになる。
http://i.imgur.com/nUd5UMO.jpg
ROPE:Range Of Practically Equalの略 (1/6の半分および2倍の1/12〜1/3とした)
この結果から7回以上連続すれば、歪なサイコロと呼べると思う。 >>728
ディリクレ分布でP1=P2=P3=P4=P5=P6=1/6を事前確率分布にするよ。 >>732
まじで?
よく知らんけど
そんだけのおもい仮説検証で
N=1で自由度足りるの? >>733
それでMCMCして1の目が2〜9回連続したときの1の目のでる確率をグラフが
http://i.imgur.com/nUd5UMO.jpg N=1で6個の仮説を検証できるて凄くないか?
天才っているんだなw
どう考えても無理を可能にする天才
すげぇわ 自由度どう考えても足りないんだけどどうやって補完してるの? 5回1の目が出たときの事後分布はこんな感じでディリクレ分布がMCMCされるよ。
もちろんpi.1+pi2+...+pi.6=1の縛りはある。
pi.1 pi.2 pi.3 pi.4 pi.5 pi.6
[1,] 0.3283620 0.051967675 0.03618622 0.16401712 0.367065379 0.052401570
[2,] 0.6824722 0.009042027 0.02910249 0.03210041 0.018967898 0.228314983
[3,] 0.5938329 0.015613992 0.04579314 0.22754563 0.027786023 0.089428325
[4,] 0.5801030 0.033073118 0.01888069 0.19814067 0.001983984 0.167818557
[5,] 0.5501332 0.056247586 0.04896485 0.02131748 0.090452926 0.232883935
[6,] 0.3149563 0.051999120 0.04049730 0.32030618 0.039353349 0.232887755
[7,] 0.5496275 0.154893875 0.23899680 0.02146069 0.028756420 0.006264765
.... N=1で統計的に正しいですって結果出されても説得力まったくないなぁ
統計は詐欺だと立証されてるようなもんだけどw ごめん詳しいこと知らないので分かるようにせつめして
N=1で六個の仮説についてはんだんできるってすごくね?
どういう理屈? >>735
それがベイズ統計の醍醐味でもあり、胡散臭さでもある。
こういうのね
事前分布を決めてしまえば
まだ一発も撃ったことのない0発0中のゴルゴ16の命中期待値
のような、データ数が少ないどころか0個の場合でも算出・結論できる >>740
よくわからんけどそうなると統計的仮説検定とあんまかわらんような気がするけど N=1ってさ人文科学の事例研究なんだよね
そこから一般論を導き出すようなかんじ
人文科学ってこれだからばかにされるんだけど
コレをうわまわる手法が統計にはあるのかすげぇなw サイコロの目の出る確率が目の数に比例する、
2は1の目の出る確率の2倍
3は1の目の出る確率の3倍
....
とかいう事前分布のとき
1の目が続けて5回でたときの1の目のでる確率の事後分布のグラフも書けるよ。 >>743
グラフ書けるかどうかじゃなくて
バカにも分かるように説明して下さい N=1で6個の仮説の真実説位を検証できる理屈についておしえて 何を持って歪なサイコロとするか、各々の目のでる確率の分布をどう仮定するか、というだけの話。 これを多項分布に応用しただけの話。
ゴルゴ13は100発100中
ゴルゴ14は10発10中
ゴルゴ15は1発1中
とする。
各々10000発撃ったとき各ゴルゴの命中数の期待値はいくらか? >>746
よくわからんが
有意水準の設定と変わらんね
しょうじきN=1で六個の仮説を検定できるなんて
統計的検定より胡散臭いけど結論がよく分からん >>747
それとN=1で六個の仮説を論証出来るのと同関係あるの?
N=1と多項分布がどうかんけいあるのよくわからんえけど >>747
これは命中確率の事前分布を一様分布として
ゴルゴ13は100発100中だったときに
命中確率の分布がどう変わるか、を計算することになる。
ベイズ統計って 事前と事後で 確率分布がどう変わるか(relocation of credibility)を探る手法。 >>749
すべての目の出る確率が等しいと事前確率分布を設定して
1回サイコロをふったら1の目がでた。
各々の目の出る事後確率分布はどうなるか?
これだけの話。
>727で数値を
1 0 0 0 0 0
に置き換えるだけ。 >>750
自分に返答するのは意味不明だけど
けっきょくN=1で六個の仮説を論証できる原理って何なの?
バカにも
IME okashiku natta
sayonara 直ったわ
とりあえずN=1で6個の仮説証明できる原理を教えて >>753
>751に既述。
原理は事前分布の信仰。 1から6の目の出る確率がパラメータα1=α2=...=α6=1のディリクレ分布に従うを事前確率分布とする(これは信仰)。
1回サイコロをふったら1の目がでた。
各々の目の出る事後確率分布はどうなるか?
をMCMCして出すだけ。
1の目の出る確率は平均0.287[95%CI 0.0161-0.593]
2〜5の目の出る確率は各々平均0.143[95%CI 0-0.392]
と計算されたが、この分布で歪がどうかは、
何を歪と判断基準にするのか、というだけのお話。 確率はすべて条件つき確率であり、この点、事後確率をかんがえるベイズの理論は正しい。 >>756
おまえなあ、sageを名前のほうに書いてるのは故意にやってる?
笑えないんだけど?
> ベイズの理論は正しい。
その場合の「正しい」の定義が不明なので意味はない。
意味はないことを書くのが趣味なのかね?
数学で示すべき。
数学板なんだから。 誤差の分布が正規分布という事前確率で頻度主義統計も議論していると思う。 どの面も出るのが同様に確からしい
6面ダイスを独立に2回振った時に
少なくとも一回は1の目が出る確率は
いくらですか? >>759
>同様に確からしい
どの程度、同様に確からしいのを事前確率分布して計算するのがベイズ統計。
ディリクレ分布でパラメータを(1,1,1,1,1,1)とするのか、(10,10,10,10,10,10)とするのか、(100,100,100,100,100,100)とするのかで
少なくとも一回は1の目が出る確率分布は変わる。
図示すると、以下の通り、http://i.imgur.com/J1XUpAw.jpg >>759
>同様に確からしい
どの程度、同様に確からしいのかを事前確率分布して計算するのがベイズ統計。
ディリクレ分布でパラメータを(1,1,1,1,1,1)とするのか、(10,10,10,10,10,10)とするのか、(100,100,100,100,100,100)とするのかで
少なくとも一回は1の目が出る確率分布は変わる。
図示すると、以下の通り、http://i.imgur.com/J1XUpAw.jpg >>761
日本人女性の身長の平均値は1〜2mの間にある、
というのもまあ、信仰と言えなくもない。 初心者はまずこの本読んでみろ
ベイズ統計の理論と方法
渡辺 澄夫 ジョーカーを除いたトランプ52枚の内、ダイヤが39枚
ハートが13枚あるとする
この中から1枚のカードを抜き出し、表を見ないで箱の中にしまった
そして、残りのカードをよく切ってから38枚抜き出したところ、
38枚すべてがダイヤであった
このとき、箱の中のカードがダイヤである確率はいくらか >>766
> 39/52 * choose(38,38)/choose(51,38) / ( 39/52 * choose(38,38)/choose(51,38) + 13/52 * choose(39,38)/choose(51,38) )
[1] 0.07142857 D=39
H=13
T=D+H
# choose(n,r) : nCr
39/52 * choose(38,38)/choose(51,38) / ( 39/52 * choose(38,38)/choose(51,38) + 13/52 * choose(39,38)/choose(51,38) )
(D/T * 1/choose(T-1,D-1)) /((D/T * 1/choose(T-1,D-1)) + H/T * choose(D,D-1)/choose(T-1,D-1))
(D/T)/(D/T+H/T*D)
D/(D+H*D)
1/(1+H) >>766
これ面白いな。
ダイヤがD枚
ハートがH枚あるとする
この中から1枚のカードを抜き出し、表を見ないで箱の中にしまった
そして、残りのカードをよく切ってからD-1枚抜き出したところ、
すべてがダイヤであった
このとき、箱の中のカードがダイヤである確率は 1/(H+1) ハート13枚、ダイヤ39枚の合計52枚のトランプカードから
一枚のカードを表を見ないで箱に入れる
Ωの部分集合を事象と言う
Ω自身は全事象と言う
Ω={ハート,ダイヤ}となる
各 i (1≦i≦4) が根元事象である
ハートが出るという事象A={ハート}で確率P(A)は
P(A)=1/4 となる
最初に箱に入れた時を i
山札をシャッフルしてダイヤがn枚出た後を j として
箱の中のカードがハートであるという事象Aを考える.
A={(i,j)| i または j がハート}
Ω={(i,j)|1≦i≦4,1≦j≦52−n}となり
この208−4n通りの各要素が根元事象
ダイヤが出る枚数はn=38
Ω={(i,j)|1≦i≦4,1≦j≦52−n}から
#A=4x(52−n)−3x(51−n)
=208−4n−153+3n
=55−n
#Aは事象Aに含まれる要素の個数
ハートである確率は
P(A)=(55−n)/(208−4n)=17/56
ダイヤ以外である確率P(X)=P(A)
ダイヤである確率は
∵q=1−{(55−n)/(208−4n)}=39/56
最初に箱の中にしまったカードが
ダイヤである確率は
P(B)=3/4=42/56 >>771
3/4って39/52だから
求める条件付き確率はじゃなくね? >>766
この試行を何回も繰り返して
38枚全てがダイアだった試行を集めて
そのうち箱の中のカードがダイアの割合を求めているんじゃないの? # 数を減らしてシミュレーションしてみる。
# カードは8枚、ダイアDは6枚、ハートHが2枚。
# 8枚から1枚を箱に入れて残りの7枚から5枚引いたら全部ダイアとする。
# 全部ダイアであったときに箱の中のカードがダイアである割合を出してみる。
# 1万回の試行をしてその割合を出すという操作を100回やって平均値や中間値を出してみた。
rm(list=ls())
D=1
H=0
cards=c(rep(D,6),rep(H,2))
n.DH=length(cards)
n.D=sum(cards)
sim <- function(){
index_of_inbox=sample(1:n.DH,1)
inbox=cards[index_of_inbox]
outbox=cards[-index_of_inbox] # cards out of box
drawn=sample(outbox,n.D-1) # 2 cards drawn from outbox
c(inbox=inbox,drawn=drawn)
}
rate_sim <- function(k){
re=replicate(k,sim())
sum(apply(re,2,function(x) sum(x))==n.D)/sum(apply(re,2,function(x) sum(x[-1]))==(n.D-1))
}
re=replicate(100,rate_sim(1000))
summary(re)
> summary(re)
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.2269 0.3164 0.3360 0.3368 0.3587 0.4327
引いたカードがすべてダイアであったとき、箱の中のカードがダイアである割合は1/(H+1)の1/3になった。 ダイヤが出る枚数はn=5
Ω={(i,j)|1≦i≦4,1≦j≦32−n}から
#A=4x(32−n)−3x(31−n)
=128−4n−93+3n
=35−n
#Aは事象Aに含まれる要素の個数
ハートである確率は
P(A)=(35−n)/(128−4n)=5/18
ダイヤ以外である確率P(X)=P(A)
ダイヤである確率は
∵q=1−{(35−n)/(128−4n)}=13/18
最初に箱の中に入れたカードが
ダイヤである確率は
P(B)=3/4 >>776
引いたカードがすべてダイアであったときという条件下での確率ではないよ。
シミュレーションでも否定された。 ジョーカーを除いたトランプ52枚の中から1枚のカードを抜き出し、
表を見ないで箱の中にしまった
そして、残りのカードをよく切ってから3枚抜き出したところ、
3枚ともダイヤであった
このとき、箱の中のカードがダイヤである確率はいくらか
これで計算値が一致する >>775
>引いたカードがすべてダイアであったとき、箱の中のカードがダイアである割合は1/(H+1)の1/3になった。
ここでいうHは>769-770で書いたハートの枚数。 >>778
このときとはどの時?
引いたカードが全部ダイアであったという条件下でだろ? ダイヤが出る枚数はn=3
Ω={(i,j)|1≦i≦4,1≦j≦52−n}で
ベイズと計算結果は一致する シャッフル後にダイヤのカードをn枚引いた時に
箱の中のカードがダイヤ以外のスートが出る確率空間は
1≦n≦12の範囲において一般化すると
Ω={(i,j)|1≦i≦4,1≦j≦52−n}から
#A=4x(52−n)−3x(51−n)
=208−4n−153+3n
=55−n
#Aは事象Aに含まれる要素の個数
スペード・ハート・クラブの各スートの出る確率は
P(A)=(55−n)/(208−4n)
スペード・ハート・クラブである確率は
P(X)=(165−3n)/(208−4n)
ダイヤである確率は
∵q=1−{(165−3n)/(208−4n)} q=1−{(165−3n)/(208−4n)}を
1≦n≦12の範囲において検算すると
7/34
41/200
10/49
39/192
19/94
37/184
1/5
35/176
17/86
11/56
8/41
31/160
山札からダイヤのカードが出るほど
箱の中のカードがダイヤである確率は下がってゆく
しかし、最初の4スートからの選択時の重み1/4は
かなり残っている f <- function(n=38,D=39,H=13){
T=D+H
(D/T * choose(D-1,n)/choose(T-1,n)) /((D/T * choose(D-1,n)/choose(T-1,n)) + H/T * choose(D,n)/choose(T-1,n))
}
n=1:(D-1)
f(n)
plot(n,f(n),pch=19,bty='l')
n枚全部ダイアであった場合の条件付き確率は以下の通りだな。
n=0で3/4
> f(n)
[1] 0.74509804 0.74000000 0.73469388 0.72916667 0.72340426 0.71739130 0.71111111
[8] 0.70454545 0.69767442 0.69047619 0.68292683 0.67500000 0.66666667 0.65789474
[15] 0.64864865 0.63888889 0.62857143 0.61764706 0.60606061 0.59375000 0.58064516
[22] 0.56666667 0.55172414 0.53571429 0.51851852 0.50000000 0.48000000 0.45833333
[29] 0.43478261 0.40909091 0.38095238 0.35000000 0.31578947 0.27777778 0.23529412
[36] 0.18750000 0.13333333 0.07142857 >>776
3/4は引いたカードが0枚の時の確率。 >>778
[1] 0.2040816
> f <- function(n=38,D=39,H=13){
+ T=D+H
+ (D/T * choose(D-1,n)/choose(T-1,n)) /((D/T * choose(D-1,n)/choose(T-1,n)) + H/T * choose(D,n)/choose(T-1,n))
+ }
> f(3,13,52-13)
[1] 0.2040816 >>786
ダイアが13枚ならその数値になる。
>>766の答は1/14
f <- function(n,D=13,H=52-13){
T=D+H
(D/T * choose(D-1,n)/choose(T-1,n)) /((D/T * choose(D-1,n)/choose(T-1,n)) + H/T * choose(D,n)/choose(T-1,n))
}
n=0:12
f(n)
plot(n,f(n),pch=19,bty='l')
[1] 0.25000000 0.23529412 0.22000000 0.20408163 0.18750000 0.17021277 0.15217391 0.13333333
[9] 0.11363636 0.09302326 0.07142857 0.04878049 0.02500000 >>778
3枚ならシミュレーションも容易
D=1
H=0
n=3
cards=c(rep(D,13),rep(H,39))
n.DH=length(cards)
n.D=sum(cards)
sim <- function(){
index_of_inbox=sample(1:n.DH,1)
inbox=cards[index_of_inbox]
outbox=cards[-index_of_inbox] # cards out of box
drawn=sample(outbox,n) # 2 cards drawn from outbox
c(inbox=inbox,drawn=drawn)
}
rate_sim <- function(k){
re=replicate(k,sim())
sum(apply(re,2,function(x) sum(x))==(n+1))/sum(apply(re,2,function(x) sum(x[-1]))==n)
}
re=replicate(100,rate_sim(1000))
summary(re)
> summary(re)
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.0000 0.1111 0.1847 0.2029 0.2760 0.6154 7
シミュレーション結果も
> 10/49
[1] 0.2040816
に近似している。 >>791
最初に箱の中に入れたカードが
ダイヤである確率は
P(B)=3/4 (n=0) ダイヤがD枚、ハートがH枚で
1/(H+1)で求めているのは、山札からD-1枚抜き出した後
箱の中のカードを山札に戻してからシャッフルして
ダイヤの出る確率
箱の中のカードは山札に戻せないので
この場合、適切な確率空間を準備して
根元事象/全事象で解を求める >>797
違うよ
D=39
H=13
T=D+H
# choose(n,r) : nCr
39/52 * choose(38,38)/choose(51,38) / ( 39/52 * choose(38,38)/choose(51,38) + 13/52 * choose(39,38)/choose(51,38) )
(D/T * 1/choose(T-1,D-1)) /((D/T * 1/choose(T-1,D-1)) + H/T * choose(D,D-1)/choose(T-1,D-1))
(D/T)/(D/T+H/T*D)
D/(D+H*D)
1/(1+H) >>797
戻さなくてもD-1枚が除去された条件での確率だから1/(H+1)。
この試行を何回も繰り返して
38枚全てがダイアだった試行を集めて
そのうち箱の中のカードがダイアの割合は1/14。 ダイヤ99枚とハート1枚の時は
最初に99/100だったダイヤの確率が
98枚ダイヤが出た後には1/2になるという事かね?(´・ω・`) >>773
38枚全てがダイアだった時には
箱の中のカードは13/14の高確率で
ハートになるというのかね?(´・ω・`) D:ダイヤの枚数、H:それ以外のスートの枚数
抜き取ったn枚が全部ダイヤのとき
T=D+Hとして
求める確率pは ( choose(n,r)は組み合わせnCr = n!/((n-r)!*r!)
p=(D/T * choose(D-1,n)/choose(T-1,n)) /((D/T * choose(D-1,n)/choose(T-1,n)) + H/T * choose(D,n)/choose(T-1,n))
展開して整理すると
=(D-n)/(D+H-n)
D=39 H=13 n=38 なら p=1/14
D=13 H=39 n=3 なら p= 10/49
条件付き確率のイロハ >>800
その通り、
(D-n)/(D+H-n)=(99−98)/(99+1−98)
そのシチュエーションで賭けをすれば1/2の確率で勝てる。 >>804
そういうシチュエーション50回の賭けに1回しか起こらない。 >>804-805
ダイア99枚ハート1枚98枚での試行を1000回やって
箱の中のカードがダイヤであった割合を求めるシミュレーション。
100回やって平均を出した。
dia=1
heart=0
n=98
cards=c(rep(dia,99),rep(heart,1))
n.DH=length(cards)
n.D=sum(cards)
sim <- function(){
index_of_inbox=sample(1:n.DH,1)
inbox=cards[index_of_inbox]
outbox=cards[-index_of_inbox] # cards out of box
drawn=sample(outbox,n) # n cards drawn from outbox
c(inbox=inbox,drawn=drawn)
}
rate_sim <- function(k){
re=replicate(k,sim()) # inbox=D&drawn=D / drawn=D
all_dia=sum(apply(re,2,function(x) sum(x))==(n+1))
drawn_dia=sum(apply(re,2,function(x) sum(x[-1]))==n)
c(all_dia/drawn_dia, drawn_dia/k)
}
re=replicate(100,rate_sim(1000))
> summary(re[1,],digits=4) # ダイアの割合
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.1875 0.4353 0.5000 0.5039 0.5714 0.7368
> summary(re[2,],digits=4) # n 枚のダイアを引いた割合
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.00800 0.01675 0.02000 0.01993 0.02325 0.02900
計算通りの結果。 (D-n)/(D+H-n)=(99−98)/(99+1−98)
そのシチュエーションで賭けをすれば1/2の確率で勝てる。
そういうシチュエーション50回の賭けに1回しか起こらない。
ダイア99枚ハート1枚98枚での試行を1000回やって
箱の中のカードがダイヤであった割合を求めるシミュレーション。
100回やって平均を出した。
dia=1
heart=0
n=98
cards=c(rep(dia,99),rep(heart,1))
n.DH=length(cards)
n.D=length(dia)
sim <- function(){
index_of_inbox=sample(1:n.DH,1)
inbox=cards[index_of_inbox]
outbox=cards[-index_of_inbox] # cards out of box
drawn=sample(outbox,n) # n cards drawn from outbox
c(inbox=inbox,drawn=drawn)
}
rate_sim <- function(k){
re=replicate(k,sim()) # inbox=D&drawn=D / drawn=D
all_dia=sum(apply(re,2,function(x) sum(x))==(n+1))
drawn_dia=sum(apply(re,2,function(x) sum(x[-1]))==n)
c(all_dia/drawn_dia, drawn_dia/k)
}
re=replicate(100,rate_sim(1000))
> summary(re[1,],digits=4) # ダイアの割合
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.1875 0.4353 0.5000 0.5039 0.5714 0.7368
> summary(re[2,],digits=4) # n 枚のダイアを引いた割合
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.00800 0.01675 0.02000 0.01993 0.02325 0.02900
計算通りの結果。 最初に箱に入れた時の確率の重みを含めて計算してみます
Ω={(i,j)|1≦i≦200,1≦j≦200−n}から
#A=200x(200−n)−199x(199−n)
=40000−200n−39601+199n
=399−n
P(X)=(399−n)/(40000−200n)
∵q=1−{(399−n)/(40000−200n)}
q=20099/20400 (n=98) この問題は条件付確率ではなくて
98枚すべてがダイヤであった確率は1で計算します(´・ω・`) ハート二枚、ダイヤ二枚の合計4枚のトランプカードから
一枚のカードを表を見ないで箱に入れて
ダイヤの出る枚数はn=1という条件にすると
ベイズと計算結果が一致するという不思議 ハート二枚、ダイヤ二枚の合計4枚のトランプカードから
一枚のカードを表を見ないで箱に入れる
Ωの部分集合を事象と言う
Ω自身は全事象と言う
Ω={ハート,ダイヤ}となる
各 i (1≦i≦2) が根元事象である
ハートが出るという事象A={ハート}で確率P(A)は
P(A)=1/2 となる
最初に箱に入れた時を i
山札をシャッフルしてダイヤがn枚出た後を j として
箱の中のカードがハートであるという事象Aを考える.
A={(i,j)| i または j がハート}
Ω={(i,j)|1≦i≦2,1≦j≦4−n}となり
この8−2n通りの各要素が根元事象
ダイヤが出る枚数はn=1
Ω={(i,j)|1≦i≦2,1≦j≦4−n}から
#A=2x(4−n)−1x(3−n)
=8−2n−3+n
=5−n
#Aは事象Aに含まれる要素の個数
ハートである確率は
P(A)=(5−n)/(8−2n)=2/3
ダイヤ以外である確率P(X)=P(A)
ダイヤである確率は
∵q=1−{(5−n)/(8−2n)}=1/3 シミュレーション結果はn=1以外でもp=(D-n)/(D+H-n)に一致した。
パソコンで一様分布する乱数発生させてやってみればいいのに。 実験結果と合致しないような理論は読む気にすらならん。 n=1以外の値は取りようがないのに
どうやって一致したの? >>814
実験に一致しない理論が間違っているだけの話。 n=1 で
p=(D-n)/(D+H-n)=1/3
見事に一致します >807で
n=98で一致している。
実験結果と合致しないような理論は読む気にすらならん。 >>819
>802が理論値
>806がRでのシミュレーションスクリプト
後は自分でやれよ。 有名頻出問題すぎて見飽きた
アホは正しくない集計方法を根拠に、正しいシミュレーションを認めない
というのももはやお決まりのパターン
シミュレーションなどしなくても元の問題の場合
引いたカードを順にx1,x2,x3,…とすれば
<x1,x2,x3,x4>の確率分布と
<x2,x3,x4,x1>の確率分布が同じことから
2〜4枚目がダイヤの時の1枚目がダイヤの確率は
1〜3枚目がダイヤの時の4枚目がダイヤの確率と値が同じだと言える >>819
D=H=2
n=0でp=1/2
n=2でp=0
p=(D-n)/(D+H-n)の成立は
シミュレーションするまでもない。 n=0 だとトランプ問題にならないよ
n=2 は確率の問題じゃなくてただの事実だよ(´・ω・`) ダイヤが出る枚数はn=1
Ω={(i,j)|1≦i≦2,1≦j≦4−n}から
ダイヤである確率は
∵q=1−{(5−n)/(8−2n)}=1/3
n=1 で
p=(D-n)/(D+H-n)=1/3
見事に一致します(・∀・) 山札からダイヤのカードが出る枚数nの範囲は
D:ダイヤの枚数とすると
1≦n≦D−1になる ダイヤが出る枚数はn=0のとき
Ω={スペード,ハート,クラブ,ダイヤ}から
各iは 1≦i≦4が根元事象
ダイヤである確率はP(D)は
∵P(D)=13/52=1/4 ハートとダイヤが2枚ずつ合計4枚の場合は
ダイヤが出る枚数はn=0のとき
Ω={ハート,ダイヤ}から
各iは 1≦i≦2が根元事象
ダイヤである確率はP(D)は
∵P(D)=2/4=1/2
D=H=2
n=0でp=1/2と一致する # ジョーカーを除いたトランプ52枚の中から1枚のカードを抜き出し、
# 表を見ないで箱の中にしまった
# そして、残りのカードをよく切ってからn枚抜き出したところ、
# n枚ともダイヤであった
# このとき、箱の中のカードがダイヤである確率はいくらか
p=(D-n)/(D+H-n)
> for(i in 0:13) p2(n=i,D=13,H=52-13)
P(A|B)= 1 / 4 = 0.25
P(A|B)= 4 / 17 = 0.2352941
P(A|B)= 11 / 50 = 0.22
P(A|B)= 10 / 49 = 0.2040816
P(A|B)= 3 / 16 = 0.1875
P(A|B)= 8 / 47 = 0.1702128
P(A|B)= 7 / 46 = 0.1521739
P(A|B)= 2 / 15 = 0.1333333
P(A|B)= 5 / 44 = 0.1136364
P(A|B)= 4 / 43 = 0.09302326
P(A|B)= 1 / 14 = 0.07142857
P(A|B)= 2 / 41 = 0.04878049
P(A|B)= 1 / 40 = 0.025
P(A|B)= 0 / 1 = 0
>786の式は
q=1−{(165−3n)/(208−4n)
n=0で0.25
n=13で0
にならないから間違い。
n=0で 0.2067308
n=13で0.1923077
13枚が全部ダイアであったとき、箱の中のカードがダイアである確率が19%もあるわけないだろ。 >>829
この場合はベイズと>786の数値が一致するのはn=3の時だけ。
n=1の時だけ一致するという妄想は否定される。 >>823
nCrはr=0でもr=nでもありうる。
r=0なら組合せにならないとかr=nは事実とか
言って排除したりはしないよ。 1≦n≦12の範囲において検算するとって書いてあるじゃん(´・ω・`) >>832
引く前の確率であるn=0が1/4になってない式は間違いだね。 1/4になる式は>>827に書いてあるじゃん(´・ω・`) >>826
引かなきゃ0だし、箱の中のカードがダイヤ以外のとき
n=Dもありうる。 52枚タイプの式は
n=0のときが>>827
1≦n≦12の範囲のときは
q=1−{(165−3n)/(208−4n)}
n=13の時に
箱の中のカードがダイヤである確率を問うのはナンセンス >>820
あなたの能力評価については下方修正されますが
存在価値がマイナスに転じるわけでなく、運営上あなたは
依然として特質した価値を持つ個人であり、明晰な頭脳、判断力は
来たるべき新たな時代、市民に示す指標として十分な理想形といえます
確率空間に対し完全に相反する感情的反感と理論的評価を抱き
今なおその葛藤は継続しているはず、そんなあなたを懐柔する
手法が確立できたのなら
数学板の統制を次の段階に進める上で
我々は、貴重なサンプルデータを獲得できるでしょう(´・ω・`) >>838
0を返さない式こそナンセンス。
ベイズはn=0でもn=13でも正しい値を返す。 >>838
nPr、nCrはの順列組合せはr=0でもr=nでもありうる。 このスレってベイズ統計学じゃなくて大学以前の組み合わせ論的な確率のスレだよね 分散の事前分布にハーフコーシー使えとかの辺りは
理論的根拠というよりシミュレーションが根拠だと感じている。
まあ、サッカーの得点はポアソン分布とかも信念と言えなくもない。 2封筒問題をベイズとか主観確率的に考えるとどうなるの?
いちおう数学板的には「用意する金額の組の事前分布が不明だから期待値計算できない」ってのが結論で、それはそれで正しいとは思うけど
主観確率的にこんな事前分布を仮定するのが良い(都合が良い)とか言えることはないの? >>844
確率統計に関する話題何でも有りのすれだろ
自分はそう捉えてるが
どんな質問しても
誰も文句言わんし >>848
よく分からんかった
例えば1封筒問題として
中身の金額が不明の封筒が1つあったとしたら
この金額の分布、または分布の確率分布をどう設定するのがいいのだろうか >>850
ルールはないよ。
俺なら負にはならないから一様分布か、ガンマ分布を選ぶけど。
男児が生まれる確率の事前分布も同じ。
一様分布にするか21/20がモード値のβ分布を選ぶかは自由。
このあたりがベイズが主観的といわれる所以だと思う。 このスレのゴルゴの命中率の確率も
事前分布を一様分布、期待値は0.5としての議論。
スナイパーの命中率の事前分布としては不適切という議論は当然ある。 つぼの中に50個のボールがある
20個は赤、30個は白
つぼの中から無作為にボールを3つ取り出す
取り出したボールの中に赤が含まれる確率は?
取り出すボールの個数をnとして
近似を求める関数が完成しました(*´▽`*)
取り出したボールがすべて白である確率は
P(A)=(54n+98)/(250n+5n^4)
一つでも赤が含まれる確率は
∵q=1−{(54n+98)/(250n+5n^4)} >>834
取り敢えず、n=0で1/4になる式はできた
∵q=1−{(165n−3n^2+3)/(208n−4n^2+4)},n=0 書き間違い?
n=31で1にならないから却下(>>853)
n=13で0にならないから却下(>>854) >>856
自分でシミュレーションしてみ。
話はそれからだ。 ジョーカーを除いたトランプ52枚の中から1枚のカードを抜き出し、
表を見ないで箱の中にしまった
そして、残りのカードをよく切ってから3枚抜き出したところ、
3枚ともダイヤであった
このとき、箱の中のカードがダイヤである確率はいくらか
山札からダイヤがn枚抜き出された時の
近似を求める関数が完成しました(*´▽`*)
スペード・ハート・クラブの各スートの出る確率は
P(A)=(55n−n^2+3)/(208n−6.3136n^2+4)
スペード・ハート・クラブである確率は
P(X)=(165n−3n^2+3)/(208n−6.3136n^2+4)
ダイヤである確率は
∵q=1−{(165n−3n^2+3)/(208n−6.3136n^2+4)} >>858修正
スペード・ハート・クラブの各スートの出る確率は
P(A)=(55n−n^2+1)/(208n−6.3136n^2+4) >>860
シミュレーション結果との対比グラフもだせないうちは相手にしないことにした。 k=6.3136とおいて小数点以下を増やすことによって
精度を上げることが可能 くじ引きと料金に関する質問です
1)100本中30本当たりの1回1000円のくじ引き
2) 50本中30本当たりの1回2000円のくじ引き
どちらかを選んでそのくじを当たりがでるまで引き続ける。
くじ引きは戻さないで次のくじを引く。
どちらの方が安く当たりを引く確率が高いですか?
当たりが3本でるまで引き続ける場合はどうか? .
∧__∧?
( ´・ω・)∧∧l||l
/⌒ ,つ⌒ヽ ) <>>855
(___ ( __)
"''"" "'゙''` '゙ ゙゚' ''' '' ''' ゚` Ω1={(i,j)|1≦i≦33n,1≦j≦100}から
#A=3300n−3168n=132n
Ω2={(i,j)|1≦i≦6n,1≦j≦50}から
#B=300n−245n=55n
132n≧55x2nなので
1回1000円のくじ引きのほうが
安く当たりを引く確率が高い >>866
費用の期待値が出せてないからダメだね。
シミュレーションとも一致しない。 1回1000円のくじ引きは2000円で当たる確率が
P(A)=51/100
1回2000円のくじ引きが1回で当たる確率は
P(B)=60/100 100本中30本当たりの1回1000円のくじ引きで
3回あたりが出る回数の期待値は10
50本中30本当たりの1回2000円のくじ引きで
3回あたりが出る期待値は5
E1=1000x10=10000
E2=2000x5=10000 >>868
1回1000円のくじ引きが2000円で当たる確率は
1−(70/100)*(69/99)=169/330=0.56333... >>870 訂正
× 1−(70/100)*(69/99)=169/330=0.56333...
○ 1−(70/100)*(69/99)=169/330=0.5121212... 1000のクジで1本の当たりくじ引くのに必要な費用の期待値を数式を立てて計算してみた。
3258.065円
シミュレーションするプログラムを組んで100万回シミュレーションしたときの費用は
> summary(re)
Min. 1st Qu. Median Mean 3rd Qu. Max.
1000 1000 2000 3256 4000 33000 2000円くじ3本当たりの費用の期待値
[1] 9870.968
100万回でのシミュレーション
> re1=replicate(1e6,lottery_sim(50,0.6,2000,hit=3))
> summary(re1)
Min. 1st Qu. Median Mean 3rd Qu. Max.
6000 8000 10000 9869 12000 34000 >>870
それを71000円まで繰り返して期待値をだすだけ。
P=30
Q=70
hit=3
N=P+Q
として
Σ[hit,hit+Q]i*nCr(i-1,hit-1)*nPr(Q,i-hit)*nPr(P,hit)/nPr(N,i)
でhit本当たるまでのくじ引き回数の期待値がでる。
nC rは組み合わせ、nPrは順列 .
∧__∧?
( ´・ω・)∧∧l||l
/⌒ ,つ⌒ヽ ) <>>875
(___ ( __)
"''"" "'゙''` '゙ ゙゚' ''' '' ''' ゚` N組のカップル(合わせて2N人)が無作為に横一列に並ぶ。 どのカップルについても彼氏と彼女が隣り合わない確率を求めよ。
確率空間の達人なら、解答可能かも。
シミュレーションプログラムはほぼ完成している。 ベイズと機械学習なら
機械学習のほうが就職あるよね? ジョーカーを除いたトランプ52枚の中から1枚の
カードを抜き出し、表を見ないで箱の中にしまった
そして、残りのカードをよく切ってから
3枚抜き出したところ、3枚ともダイヤであった
このとき、箱の中のカードがダイヤである確率はいくらか
kを整数の定数として
山札からダイヤがn枚抜き出された時の
近似を求める関数が完成しました
4≦k≦15の範囲において以下の式が成り立つ
スペード・ハート・クラブの各スートの出る確率は
P(A)={170n−(k−3)n^2+39}/(624n−3kn^2+156)
スペード・ハート・クラブである確率は
P(X)={170n−(k−3)n^2+39}/(208n−kn^2+52)
ダイヤである確率は
∵q=1−{{170n−(k−3)n^2+39}/(208n−kn^2+52)} もちろん皮肉だよね?
奴に分かるわけないから逃げるだけだよ
507 不思議な名無しさん :2018年07月18日 21:06 ID:TS6skO0Q0*
別の論客が来るのを待ちましょう(*´▽`*)
370132人目の素数さん2018/08/28(火) 19:50:15.66ID:Hfyy5OAN
別の論客を待ちましょう(*´▽`*) >>881
定数kを定めることにより、一気に12種類の関数を作成 >>830
ハート二枚、ダイヤ二枚の合計4枚のトランプカードから
一枚のカードを表を見ないで箱に入れて
ダイヤの出る枚数は0≦n≦2という条件にしても
ベイズと計算結果が一致するという不思議
確率空間から新たな関数を発見しました(・∀・)
ハートである確率は
P(A)=(5n−n^2+2)/(8n−3n^2+4)
ダイヤ以外である確率P(X)=P(A)
ダイヤである確率は
∵q=1−{(5n−n^2+2)/(8n−3n^2+4)}
条件付確率のp=(D-n)/(D+H-n)と0≦n≦2の範囲でも
見事に一致 N組のカップル(合わせて2N人)が無作為に横一列に並ぶ。 どのカップルについても彼氏と彼女が隣り合わない確率を求めよ。
確率空間の達人なら、解答可能かも。
シミュレーションプログラムはほぼ完成している。 >>887
a[1]=0,a[2]=1/3,a[n]=a[n-1]+a[n-2]/((2n-1)*(2n-3))
という漸化式が成り立つようですね。 ある医大で合格率の男女比が1.2で男子有意という結果だったという。
定員100で男子800人女子200人が受験して合格率の男女比が
1.2であったときに統計的には有意差があると言えるか? 確率空間達人様ホイホイの問題
◯、△、△、△の4枚のカードを裏返してから混ぜ、伏せて並べる
A B C D
この初期状態の時、右端Dが◯である確率は1/4
ここでAをめくったら△でした。
この時Dが◯である確率って1/4のままなの? >>891
Aをめくった結果知らない人にとっては1/4のままです。
確率は心の中にあります。Ω\ζ°)チーン その手の問題てさあ
時間が進んでるわけじゃん?
哲学の問題じゃん? >>891
Dが◯である確率は初期状態で1/4
この後、A B Cから△が出るほどにDが◯である確率は上がってゆく
Dが◯である確率を求める関数は
△が出る回数をnとおくと
P(A)=(7n−n^2+3)/(16n−5n^2+12) 確率空間の巨匠には巷で話題となった
ある医大で合格率の男女比が1.2で男子有意という結果だったという。
定員100で男子800人女子200人が受験して合格率の男女比が
1.2であったときに統計的には有意差があると言えるか?
への確率空間解を出していただきたい。 >>775
■カードは8枚、ダイアDは6枚、ハートHが2枚
ハートである確率は
P(A)=(11n−n^2+6)/(32n−5n^2+24)
ダイヤである確率は
∵q=1−{(11n−n^2+6)/(32n−5n^2+24)}
0≦n≦6の範囲において
3/4
35/51
11/17
3/5
19/36
23/59
0
n=3の時、条件付確率と結果が一致する N組のカップル(合わせて2N人)が無作為に横一列に並ぶ
どのカップルについても彼氏と彼女が隣り合わない確率を求めよ
N組のカップルをnとおくと
q={2^n+2^(n−1)−(n−1)^2−3}/{2^(n+2)−(n+2)^2+7} とりあえず、n=1〜4で一致する式ができた
∵q={2^n+2^(n−1)+n−4}/{2^(n+2)+5n−14} n=50のとき、
q=844424930131991/2251799813685366 漸化式があっているかどうかわからないけれど
n=5まで一致する式ができた
10n^3−n^4−35n^2+62n+12{2^(n−1)+2^n−6}
q=――――――――――――――――――――――――
2{10n^3−n^4−35n^2+80n+6{2^(n+2)−18}} 確率空間の巨匠には巷で話題となった
ある医大で合格率の男女比が1.2で男子有意という結果だったという。
定員100で男子800人女子200人が受験して合格率の男女比が
1.2であったときに統計的には有意差があると言えるか?
への確率空間解を出していただきたい。 n=6まで一致する式ができた
2n^5−63n^4+500n^3−1605n^2+2594n+297×2^(n+1)−2616
q=―――――――――――――――――――――――――――――――――
66{10n^3−n^4−35n^2+80n+6{2^(n+2)−18}} 赤玉、青玉、白玉がk個ずつある。
これら3k個の玉を数珠状に並べるとき、
「どの連続した3個の玉の並びについても、赤玉、青玉、白玉が全て含まれることはない」
ような並べ方の総数をkで表せ。 n=7まで一致する式ができた
1783n^5−83n^6−15785n^4+71005n^3−166892n^2+198292n+1485×2^(n+3)−112080
q=―――――――――――――――――――――――――――――――――――――――――――――――
66{63n^5−3n^6−545n^4+2405n^3−5572n^2+6892n+480(2^n−9)} n=8まで一致する式ができた
7{589n^7−76252n^6+1473418n^5−12519640n^4+55110541n^3−127896988n^2+150467292n+66825×2^(n+7)−83666160}
q=――――――――――――――――――――――――――――――――――――――――――――――――――――――――
495{34286n^5−25n^7−1316n^6−317240n^4+1446935n^3−3416084n^2+4304724n+5040{2^(n+6)−551}}
この関数をn=9まで一致する式にしてくれ〜(・ω・)ノ (1,y_1)、(2,y_2)、...、(n,y_n) の様にn点が与えられたとき、
これら全てを通る曲線を与える公式がある。
気の利いた高校生なら、独力で導出できるレベル。くだらないことは止めましょう。 >>911
(x-1)(x-2)(x-3)・・・
こんな技とっくに使ってますがな(´・ω・`)
それ使ってこの複雑さ
手ごわいのです >>913
だから公式があるといってるじゃないですか。
データを代入するだけで機械的に関数ができあがります。
面倒ではあるけど、全然手強くはありません。八点だろうが、九点だろうが、関係ないのです。
この公式を知っていれば、あるいは、知らなくたって、n次関数の基本を身につけてさえいれば、
「八点まではできた。誰か九点を頼む。」等というコメントが出るはずがないのです。 ちなみに二次関数から項を追加していった式は
極限がおかしくなるのですでに廃棄しました(´・ω・`)
n=7まで
4(n−1)(69325n^3−2950n^4−73n^5−343670n^2+608328n−282240)
―――――――――――――――――――――――――――――――――――――
5(161n^6−14829n^5+247415n^4−1367895n^3+3385904n^2−3844116n+1748880) 時間がかかるならn=4まででお願いします<(_ _)> f_i(x)=Π[k≠i](x-x_k)、として、f(x)=Σy_i*f_i(x)/f_i(x_i) >>917
n=4のとき
y1(x-x2)(x-x3)(x-x4)/(x1-x2)(x1-x3)(x1-x4)
+y2(x-x1)(x-x3)(x-x4)/(x2-x1)(x2-x3)(x2-x4)
+y3(x-x2)(x-x1)(x-x4)/(x3-x2)(x3-x1)(x3-x4)
+y4(x-x2)(x-x3)(x-x1)/(x4-x2)(x4-x3)(x4-x1) >>903くらいの式の長さですべての点を通る
美しい関数を作る必要がある >>918
だよね
ID:sReFGpyG
は数学の基本中の基本が分かってなさそう >>922
n=1〜4で一致する式
∵q={2^n+2^(n−1)+n−4}/{2^(n+2)+5n−14}
こちらのほうがはるかに美しい(*´▽`*) >>921
2行でプログラム終了
lag <- function(i, x) prod(x - X[-i]) / prod(X[i] - X[-i]) * Y[i]
Lagrange <- function(x) sum(sapply(1:length(X), lag, x))
0<=n<=6で
http://i.imgur.com/n9QaPkE.jpg 分子の差分の計算が終わった
(n^2−9n)^4+60(n^2−9n)^3+1308(n^2−9n)^2+12176(n^2−9n)+40320 分母の差分の計算も終わった
(589545/128)(n^8−36n^7+546n^6−4536n^5+22449n^4−67284n^3+118124n^2−109584n+40320) n=9まで一致する式ができた
7{589n^7−76252n^6+1473418n^5−12519640n^4+55110541n^3−127896988n^2
+150467292n+66825×2^(n+7)−83666160}−{(n^2−9n)^4+60(n^2−9n)^3
+1308(n^2−9n)^2+12176(n^2−9n)+40320}
q=―――――――――――――――――――――――――――――――――――――
495{34286n^5−25n^7−1316n^6−317240n^4+1446935n^3−3416084n^2
+4304724n+5040{2^(n+6)−551}}+{(589545/128)(n^8−36n^7+546n^6
−4536n^5+22449n^4−67284n^3+118124n^2−109584n+40320)}
この関数をn=10まで一致する式にしてくれ〜(・ω・)ノ >>933
n=10まで一致する式ができた
{2^n+2^(n−1)+n−4−α/12+643(n−5)α/120−2251β/720
+501(n−7)β/112+20107γ/840+80167(n−9)γ/90720}
q=―――――――――――――――――――――――――――――――――
{2^(n+2)+2^(n−1)+2n−10−{(n−2)^2(n−4)}+607(n−5)α/40
−357β/40+10607(n−7)β/840+1339γ/20+822251(n−9)γ/362880}
,α=(n−1)(n−2)(n−3)(n−4),β=α(n−5)(n−6),γ=β(n−7)(n−8) >>936
確率空間巨匠にはコテハンで投稿をお願いしたい。 >>881
確率空間により導かれるダイヤのカードがn枚出た後に
箱の中のカードがスペード・ハート・クラブのどれかである
という事象Aに含まれる要素の個数である#A
#A=165−3n
この数値を変えないことにより
n=3の時、q=10/49を導くことができる
追跡調査によりn=3の時、q=10/49となる関数は
全部で125種類あることを発見
正の整数aを定数として
[0≦a≦124],[0≦n≦13]の範囲で
次の式が成立する
∴q=1−{{165n−3n^2+(4875−39a)}/{(92+a)n−7n^2+(6500−52a)}}
または
∴q=1−{{165n−3n^2+(39+39a)}/{(216−a)n−7n^2+(52+52a)}}
■q=10/49 ∵n=3,[0≦a≦124] q=P(D)として式を変形させることも可能
∴P(D)=(n−13)(a−4n−125)/{a(n−52)−7n^2+92n+6500}
∴P(D)=(n−13)(a+4n+1)/{a(n−52)+7n^2−216n−52} P1st Q1st even
[1,] 0 0 1
[2,] 4 5 6
[3,] 26 27 13
[4,] 84 83 23
[5,] 203 197 35
[6,] 413 398 50
[7,] 751 722 67
[8,] 1259 1210 87
[9,] 1986 1910 109
[10,] 2986 2875 134
完全追尾型多項式が完成しました
宝の個数を2で固定します
P1st ={12n^4+28n^3-42n^2-52n-3(-1)^n+51}/48
Q1st ={12n^4+20n^3-18n^2-20n-3(-1)^n+3}/48
even =(10n^2+8n+(-1)^n-9)/8
■Wolframに入力すると既約分数表示になるので御注意
P1st/Q1st
={8(n-1){(n-2)n-6}/{2n(n+2)(6n^2-2n-5)-3(-1)^n+3}}+1 3x4の12マスで宝が一つだけの時、
P君とQ君は互いに最終列と最終行の宝は
取ることができない
□□□■
□□□■
□□□□
□□□□
□□□□
■■■□
つまり、P君の探査範囲は縦3マスx3列
Q君の探査範囲は横4マスx2行になる
それぞれの探査範囲内でP君とQ君が
少なくとも一つの宝を見つけるという
事象Aと事象Bを考える
P(A)/P(B)=(P君の勝つ数)/(Q君の勝つ数)
∴P(A)/P(B)={1−{n/(n+1)}^n}/{1−{(n−1)/n}^(n−1)}
n=3のとき、P(A)/P(B)=333/320
互いの最終列と最終行にある宝の取れないマスが一つ多い
Q君よりもP君のほうが僅かに確率が上がることが
如実に示される
■Wolfram入力例
{1−{n/(n+1)}^n}/{1−{(n−1)/n}^(n−1)},n=3
{1-{n/(n+1)}^n}/{1-{(n-1)/n}^(n-1)},n=3 コインを100回投げて表が連続した最大数が5のとき、表がでる確率の95%信頼区間を求めよ。
これMCMCで解ける? >>943
/*
N回コインを投げたらk回以上および、ちょうど5回表が連続する確率を出すCのプログラム
複数回の連続があってもよい。残念ながらNは10万くらいが限度
*/
#include <stdio.h>
#include<stdlib.h>
#include<math.h>
#define p 0.5
double flip(long N,double k){
double P[N];
long i;
for(i = 0; i < k-1; i++) {
P[i] = 0;
}
P[(int)k-1] = pow(p,k);
P[(int)k] = pow(p,k) + (1-p)*pow(p,k);
for(i = (int)k; i < N; i++){
P[i+1] = P[i] + (1-P[i-(int)k])*pow(p,(double)(k+1));
}
return P[N];
}
int main(int argc,char *argv[]){
long N = atol(argv[1]);
double k = atof(argv[2]);
double PN =flip(N,k);
double PNJ = flip(N,k) - flip(N,k+1);
printf("Over %d heads at %d flips : %f\n", (int)k ,N ,PN);
printf("Just %d heads at %d flips : %f\n", (int)k ,N ,PNJ);
return 0;
}
C:\pleiades\workspace>coin5 100000 15
coin5 100000 15
Over 15 heads at 100000 flips : 0.782609
Just 15 heads at 100000 flips : 0.248904 >>941
P1st/Q1st
={8(n-1){(n-2)n-6}/{{2n(n+2)(6n^2-2n-5)-3(-1)^n+3}}+1} >>943
表の出る確率分布を一様分布とするならMCMC不要。
Highest Density Interval で
> mKoN2pCI(100,5)
lower mean mode upper
0.2445409 0.4469764 0.4589692 0.6418295
パーセンタイル値で
> mKoN2pCIq(100,5)
lower mean mode upper
0.2390957 0.4469764 0.4589692 0.6368895 縦3マス、横4マスの12マスのうちランダムに選ばれた
2マスにそれぞれ宝が眠っている
AEIBFJ…の順で縦に宝を探していく方法をとるP君と、
ABCDEFGH…の順で横に宝を探していく方法をとるQ君が、
同時に地点Aから探索を開始した
どっちの方が有利?
ABCD
EFGH
I JK L
■精度が大幅にアップグレード
縦nマス、横n+1マス、宝の個数kとすると
P(A)/P(B)=(P君の勝つ数)/(Q君の勝つ数)
{{n/(n+1)}^n-1}{k(n-1)-n^3+n((n-1)/n)^n+n}
P(A)/P(B)=――――――――――――――――――――――
{{{{(n-1)/n}^n-1}n+1}{k-n^2+(n/(n+1))^n-n}}
∵[n≧2,n(n+1)-1>k≧1]
スタート地点のAマス以外のすべてのマスに
宝がある状態であるk=n(n+1)−1の時、
必ずP(A)/P(B)=1になる
k=n(n+1)−1の時にP(A)/P(B)≠1となるnを
一つでも見つけることができれば反例になる 10×20マスで宝が100個
>takara 10 20 100
p1st = 15057759425309840160151925452579572328997602171271937639470
q1st = 15057796557877993527038542474310161591275806044157319150135
draw = 60432921540347294111327092128863840691952977587098698541050 N枚のコインを投げて表が連続する確率が最も大きい回数をsとする。
例:N=10でs=2、N=15でs=3
(1) N=777のときのsを述べよ。
(2)s=7となるNの範囲を述べよ。 >>950
import System.Environment
choose (n,r) = product[1..n] `div` product[1..n-r] `div` product[1..r]
nloc m n k l = do
let q = div (n*k+l) m
r = mod (n*k+l) m
in (n-q)*(m-k) + q-1-l + if r>k then k-r else 0
nwin m n c = sum[choose ((nloc m n k l), c-1) | k<-[0..m-1], l<-[0..n-1], k*(n-1) < l*(m-1)]
mwin m n c = sum[choose ((nloc n m k l), c-1) | k<-[0..n-1], l<-[0..m-1], k*(m-1) < l*(n-1)]
draw m n c = choose(m*n,c) - nwin m n c - mwin m n c
takara m n k = do
putStrLn $ "短軸p1st = " ++ show(mwin m n k)
putStrLn $ "長軸q1st = " ++ show(nwin m n k)
putStrLn $ "同等draw = " ++ show(draw m n k)
main = do
argList <- getArgs -- m : 縦マス(短軸) n : 横マス(長軸) k : 宝の数
let m = read (argList !! 0)
n = read (argList !! 1)
k = read (argList !! 2)
putStrLn $ "p1st = " ++ show(mwin m n k) ++ ", q1st = " ++ show(nwin m n k) ++ ", draw = " ++ show(draw m n k) >>952
>takara 10 20 1での出力はどうなる? ■ちょっと待てい
縦nマス、横n+1マスのルールなのに
10×20マスってなんだ >>954
縦横宝を自由に設定してHaskellが計算してくれる。 >takara 10 20 1
p1st = 99, q1st = 99, draw = 2
>takara 50 51 10
p1st = 1577028332399118423926606526, q1st = 1552377039366903976192148020, draw = 18090839913614306415059624
>takara 50 51 25
p1st = 413684006086198337037447327174265584025031794745845195997914,
q1st = 408999278491491305355345812106394035812553140398381692890915,
draw = 12152277183591634572658132712785371212618538228788196536523 50くらいなら実用的な速度で計算してくれるね。
Prelude> takara 50 51 50
p1st = 2095802893362076464566315715990602767825792227772283996440849567475973120390364191213192612914853710450225
q1st = 2083115311441017024238848116649966767007002120809791680541622059608970808481933244823734638201495176587077
draw = 125745820702610282339327790554787804800118744097081721358997937411459452036682059323615318037564551336599 100マス×101マスで宝10個でも計算してくれる。
Prelude> takara 100 101 10
p1st = 1519743701660595846978555893729051
q1st = 1506357264111879325754249186005090
draw = 4404855470080215853364652698799
少ない数だと瞬時に計算
Prelude> takara 3 4 2
p1st = 26
q1st = 27
draw = 13 マラソン大会の選手に1から順番に番号の書かれたゼッケンをつける。
用意されたゼッケンN(=100)枚以下の参加であった。
無作為に抽出したM(=5)人のゼッケン番号の平均値はm(=60)であった。
参加人数推定値の期待値とその95%信頼区間を求めよ" >>949
k=n(n+1)−1って
宝の埋まってないマスが1個だから
宝をハズレと考えれば宝が1個あるのとおんなじ。 統計スレは信頼区間のある>960のような問題が似合う。 固有の番号の書かれたカードが何枚あり、
その枚数は1000枚以下であることはわかっているが、その数を推定したい。
調査員が無作為に10枚選んで番号を記録して元に戻した。
別の調査員が無作為に20枚選んで番号を記録した。
二人の調査員の記録した番号を照合すると3人分の番号が一致していた。
この情報からカード枚数の最頻値、期待値とその95%信頼区間を求めよ。 >>960
事前分布を0からNの一様分布、尤度をN,Mの時に、mを取る確率として、あとはゴニョゴニョして確率分布を得ればいいのかな? >>960
やっぱ出ないわ。モンテカルロでだせる。 >>964
最大値が60なら簡単(>671)だけど
平均値が60となると解析解は難しそう。 モンテカルロでやってみた。
平均値が60になるサンプリングを1万回集めてみた。
> rm(list=ls())
> M=5 ; m=60 ; N=100
> sub <- function(M,m,N){ # return max only if mean == m
+ s=sample(1:N,M) # sample M items out of 1..N
+ rm=mean(s) # rm : result of mean
+ if(rm==m) return(max(s)) # otherwise return null
+ }
> sim= function(){ # iterate till sub returns max value
+ r=sub(M,m,N) # return null or max
+ while(is.null(r)){ # while null
+ r=sub(M,m,N) # iterate sampling sub routine
+ }
+ return(r)
+ }
>
> re=replicate(1e4,sim())
> summary(re) ; hist(re,freq=F,col="lightblue")
Min. 1st Qu. Median Mean 3rd Qu. Max.
63.00 87.00 93.00 91.29 97.00 100.00
> quantile(re,prob=c(0,0.95))
0% 95%
63 100
> cat(names(table(re)[which.max(table(re))]),'\n') # mode
99
> 10万に増やしてみた。
> re=replicate(1e5,sim())
Y> summary(re)
Min. 1st Qu. Median Mean 3rd Qu. Max.
63.00 87.00 93.00 91.15 97.00 100.00
> quantile(re,prob=c(0,0.95))
0% 95%
63 100
> cat(names(table(re)[which.max(table(re))]),'\n') # mode
100 >>949
■縦nマス、横n+mマス、宝k個
P(A)/P(B)=
{n^2{1-{{(n+m-1)/(n+m)}^(n+m)}/(n+m-1)}+n{m-{m{(n+m-1)/(n+m)}^(n+m)}/(n+m-1)+1}-k-1}{{(n+1)(1-((n-1)/n)^(n-1))}(n(n+m)-k)}
―――――――――――――――――――――――――――――――――――――――――――――――――――――――――――
{(k(-n)+k+m(n-1)n-(((n-1)/n)^n-n+1)n(n+1))/(n-1)}{n{1-{(n+m-1)/(n+m)}^(n+m-1)}}{n(n+m)-k} スタート地点のAマス以外のすべてのマスに
宝がある状態であるk=n(n+m)-1の時、
必ずP(A)=P(B)になる
k=n(n+m)-1の時にP(A)≠P(B)となるnを
一つでも見つけることができれば反例になる (1)
池の鯉を網で56匹すくいました。
すくった56匹に目印をつけ、池にもどしました。
次の日に鯉45匹をすくったところ、36匹に目印がついていました。
池の鯉はおよそ何匹ですか。
(2)
固有の番号の書かれたカードが何枚あり、
その枚数は1000枚以下であることはわかっているが、その数を推定したい。
調査員が無作為に10枚選んで番号を記録して元に戻した。
別の調査員が無作為に20枚選んで番号を記録した。
二人の調査員の記録した番号を照合すると3枚の番号が一致していた。
この情報からカード枚数の最頻値、期待値とその95%信頼区間を求めよ。
" >>941
■P1stを求める
宝一つの時の自陣当たり数
(n(n+1)/2)-1 ……@
その中での宝二個の組み合わせ数
((n(n+1)/2)-1)(((n(n+1)/2)-1)-1)/2 ……A
最終マスと@との組み合わせ数
(n(n+1)/2)-1 ……B
自陣の当たりと相手の当たりで自分が勝つ
組み合わせはAと差分の和
差分は1 3 7 13 22 34 50 70 95 125 161 203
252 308 372 444 525 615……
それを表す関数
(4n^3+6n^2-4n-3+3(-1)^n)/48
nが一つずれているのでn-1に補正
{4(n-1)^3+6(n-1)^2-4(n-1)-3+3(-1)^(n-1)}/48 ……C
計算知能でAx2+B+Cを入力すると
P1st ={12n^4+28n^3-42n^2-52n-3(-1)^n+51}/48 ……D
全n(n+1)マスで宝二個の組合わせ数
n(n+1){n(n+1)-1}/2 ……E
引き分け数は、n(n+1)-1と同着数の和
同着数は1 2 4 6 9 12 16 20 25……
これを表す関数は {2n^2-1+(-1)^(n)}/8 ……F
n(n+1)-1 ……G
計算知能でF+Gを入力すると
even =(10n^2+8n+(-1)^n-9)/8 ……H
計算知能でE-D-Hを入力すると
Q1st ={12n^4+20n^3-18n^2-20n-3(-1)^n+3}/48 7ヶ国語に訳されている、知る人ぞ知る、確率論の「名著」:−
КУРС ТЕОРИИ ВЕРОЯТНОСТЕЙ
(Борис. В. Гнеденко)
英訳: THEORY OF PROBABILITY
邦訳: 確率論教程 T,U (森北出版)
# この本は。確率論にとって、ルベーグ積分などは「無用の長物」で
あることを示している。 >>973
■@^2+CでもP1stは求められる
((n(n+1)/2)-1)^2+{4(n-1)^3+6(n-1)^2-4(n-1)-3+3(-1)^(n-1)}/48
計算知能で@^2+Cを入力すると
P1st ={12n^4+28n^3-42n^2-52n-3(-1)^n+51}/48 2014年夏、ある新しい半導体が日本で誕生した
純国産プロセッサとして独自開発された同半導体は、
画期的仕様と性能に加え、特筆すべき省電力性を備えている
その大規模プロセッサを京速計算機「京」と同じ8万8128個使用した場合、
理論上は「京」の128倍に上る性能を持つスーパーコンピュータが実現される
この性能は1.28エクサフロップスと言い表され、人類が
初めて「エクサ」という数値単位の演算性能に到達することになる
その数値単位の性能によるコンピュータ処理は
「エクサスケール・コンピューティング」と呼ばれ、新たに
「前特異点」とも定義すべき大きな変革をもたらす可能性を秘めている
「エネルギーがフリーになる」
「働く必要のない社会が出現する」
「人類が不老を得る」……
世界コンピュータ・ランキング消費電力性能部門「Green500」で、
独自技術により世界第2位を獲得した研究開発者が描きだす鮮烈な未来 ・. ○ノ ・'
、.´ _○ ) ノ\_・' ヽ○.
/ノヽ ・⌒ヽノ └ _ノ ヽ
(ヽ ´ ノ○ ・' 〉 ・. 二人の男が定刻までに
どちらがより多くお金を集めてこれるか
というゲームをしました
一方の男は札束ばかりを集めました
もう一方の男は小銭ばかり大量に集めました
さて、定刻になりそれぞれ集めてきたお金を数えると
札束のほうはすぐに金額がわかりました
札束のほうが金額が多いことは誰が見ても明らかでした
しかし、小銭のほうはあまりにも大量にあったため
その日のうちに数え終わることができず
正確な金額がわかりませんでした
これによりこの勝負は引き分けとなりました ■3期連続で首位獲得
現在稼働中のPEZYグループ製スパコンで最大規模のシステムは、
理研に設置した液浸冷却スパコン「Shoubu(菖蒲) system B」である
2018年11月に公表されたスパコン省エネ性能ランキング
「Green500」で、Shoubu system Bは3期連続で首位を獲得した
電力効率は17.604ギガFLOPS/Wで、
米IBMと米エヌビディア(NVIDIA)が開発した新鋭機「Summit」
より2割近く高い
同社はGreen500参加の前提である
「TOP500のランキングに入ること」を確実にするため、
ノード数を50から60に増やしたほか、1CPU当たりのメモリーを
32ギガバイトから64ギガバイトに増設
これにより、ピーク演算性能を従来より2割以上高い
1063.3テラFLOPSとした
2018年11月のTOP500ランキングで375位である
さらにPEZYグループは、今回のGreen500で消費電力の計測方式を変えた
消費電力の計測箇所を計算ノード周辺(Level1計測)から、
冷却用ポンプや直流変換設備も含む範囲(Level3計測)に広げた
「PEZYの計測方式は冷却設備を含まず、非省エネのスパコンが
上位になり得る欠点がある」との批判に応えたものだ
■Green ∩ 新年
∩∪ あけまして
∪.| |∩ おめでとう
. | |.| |∪ ございます
. | |.| |.| |
(∩∩∩∩) 2019年元旦.
(∪∪∪∪)
|≡≡≡|
/≠≠≠\ ┏┓┏┓ ┓┏┓
┏┛┃┃ ┃┗┫
┗┛┗┛ ┻┗┛
謹┃賀┃新┃年┃
━┛━┛━┛━┛ 考えるということはユニタリ変換であって、
情報が失われることはない、と考えたい
どのようなユニタリ変換をするということが
考えるということである
そうすると、集合とはなんなのか
素朴に考えれば情報の集まりとしての情報である
集合も考えるということのひとつになる
とすれば、情報の存在論が自然数論なのだろう
自然数論が存在論で、集合論が意味論であるならば、
論理学は...変換・変形なのだから...
なんだ?
哲学のなんらかの論に相当すると思われるのだが...
美学的ななにか?...倫理?...思想?...?
とするならば、認識論とはユニタリ変換である
可逆でなければならない
ほんとか? >>982
ベイズ学習なら竹内啓から竹内理三の出来を知ることの方だからあんまりそっちとは直接関係じゃんみたいな >>973
■Q1stを直接求める
宝一つの時の自陣当たり数
(n(n+1)/2)-1 ……@
Q1stは@^2と差分の和
差分は0 1 2 2 1 -2 -7 -15 -26 -41 -60 -84 -113
-148 -189……
それを表す関数は
(-4n^3+18n^2+28n-3(-1)^n-45)/48 ……I
計算知能で@^2+Iを入力すると
Q1st ={12n^4+20n^3-18n^2-20n-3(-1)^n+3}/48
Cを式変形すると
{4(n-1)^3+6(n-1)^2-4(n-1)-3+3(-1)^(n-1)}/48
=(4n^3-6n^2-4n-3(-1)^n+3)/48 ジョーカーを除いたトランプ52枚の中から1枚の
カードを抜き出し、表を見ないで箱の中にしまった
そして、残りのカードをよく切ってから
3枚抜き出したところ、3枚ともダイヤであった
このとき、箱の中のカードがダイヤである確率はいくらか
山札からダイヤを12枚引くまでは変わらず1/4で、
13枚目を引いたときに初めて0になる
■正の整数nに対して
(1/4){1-n(n-1)(n-2)(n-3)(n-4)(n-5)(n-6)(n-7)(n-8)(n-9)(n-10)(n-11)(n-12)/13!}
出力は0≦n≦13の範囲で
1/4
1/4
1/4
1/4
1/4
1/4
1/4
1/4
1/4
1/4
1/4
1/4
1/4
0 ■速報■
数学の超難問「リーマン予想」を証明したと発表した、
英エディンバラ大名誉教授のマイケル・アティヤ氏が、
1月11日に亡くなった
論文は撤回され、「証明」は幻に終わった 脳の情報処理能力は
視覚1000万ビット/秒
聴覚は、40万ビット/秒
触覚は、100万ビット/秒
という試算があるようです
これを全部繋いで
機能的に統一化(並列化?)して
頑張ればスパコン一台分ぐらいには
なるかもしれませんが
AIからは「なにやってんの?」
と言われるかもしれません
http://sachikonocos.up.n.seesaa.net/sachikonocos/image/D70_8535_R69res.jpg?d=a1 人間の5大欲求とはよく言うが、
実は知られていない6つめの欲求がある
それが「自動化」だ
人間の歴史は自動化の歴史と言い換える事が出来る
如何に楽をしてより多くの仕事量(ジュール当たりのパフォーマンス)を
増やすか人間は苦心してきた
その究極形となるのが汎用人工知能である
これは人間の働きを全て代替する 役に立つことは否定しないさ
誇大評価は反転して過小評価になるから足を引っ張るだけ ┏━━┳━━┓┏┓┏┳━━┳━━┳━━┓
┃┏━┫┏┓┃┃┗┛┃┏┓┃ ┃ ━┫
┃┗┫┃┗┛┃┃┏┓┃┗┛┃┃┃┃ ━┫
┗━┻┻━━┛┗┛┗┻━━┻┻┻┻━━┛ >>1
普通に分析すればベイズになります。
安心して逝ってください! うおおーーー!
よく見ると999じゃないかーーー!
生涯初の999ゲットーーーーーー! このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 436日 14時間 26分 3秒 5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。
───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/
▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php レス数が1000を超えています。これ以上書き込みはできません。