ベイズの統計学を学び始めたんだけど
■ このスレッドは過去ログ倉庫に格納されています
信用に値するのか疑問です。
人工知能とかではなく日々の動機付けに利用する予定です >>572
二つの封筒問題はプレイヤがAとBの封筒をランダムに選ぶことに
意味があるからそれはだめだ >>573
AとBに入っている金の組み合わせをプレイヤーが選べるわけではないだろ? A=2B か A=1/2Bなので
A=2Bの確率がpならA=1/2Bの確率は1-pでいいと思うのだが。 2つの封筒問題に於いて、
事象(B=2z | A=z)と事象(B=z/2 | A=z)は、
排反事象ぢゃから、
pとおくと1-pは、正解ぢゃ。
さて、例えば、z = 10000円では、
P(A=5000∧B=10000) = q とおくと、
P(A=10000∧B=5000) = q であり、
P(A=10000∧B=20000) = r とおくと、
P(A=20000∧B=10000) = r である。
P(B=20000 | A=10000) = p とおくと勿論
P(B=5000 | A=10000) = 1-p である。
∵排反事象ぢゃ
ベイズ的な計算により、p = r/(q+r) 《2つの封筒問題の胴元のアルゴ推定》
起 AとBの2つの封筒問題に於いて、
Aを開封で、A=1(万円)だとしよう。
Bの期待値E(B)=1(万円)なのぢゃ。
承 E(A) + E(B) = 2 ぢゃろう。
A開封前のA+Bの分布は、
平均2 範囲0から4 の一様分布と推定ぢゃ
転 胴元プログラム言語風アルゴの推定
U ← 平均2 範囲0から4 の一様乱数
High ← (2/3) * U Low ← (1/3) * U
R ← 範囲0から1 の一様乱数
R > 0.5の場合、{A ← High B ← Low}
以外 {A ← Low B ← High}
結 E(B) - E(A) = 0 ∴
参加料金>Aで、胴元利益ぢゃ 英国ロンドン・ビジネススクールのリンダ・グラットン教授の研究によると、
2007年に日本で生まれた子供は、107才まで生きる確率が50%もあるという 《平均寿命のワシの超確率Kサン論》
例えば、寿命の西暦3001年の統計が
極めて簡単かつ仮に
P(0才→20才 | 2980年生) = 0.01
P(20才→40才 | 2960年生) = 1
P(40才→60才 | 2940年生) = 1
P(60才→80才 | 2920年生) = 1
P(80才→100才 | 2900年生) =0.99
P(100才→120才 | 2880年生) = 0.0
としよう。
西暦3001年平均寿命は、ワシのKサン論なら
0.01*(0+20)/2 + 0.99*(80+100)/2 = 89.2才
尚、2980年生れの子は、
20才まで生きる確率は、0.99
40才まで生きる確率は、0.99^2
60才まで生きる確率は、0.99^3
…
138才まで生きる確率は、0.99^69 = 0.5
なのぢゃ。
ぢゃ〜また。 ベイズとはたぶん無関係だが話題提供。
壺の中に n 種類の異なるクーポンが入っている。1回の試行で壺の中から1枚クーポンを引き、引いたものと同じ種類のクーポンを壺の中に戻すものとする。
n 種類(全種類)のクーポンを集めようとしたとき、 t 回以上の試行回数が必要となる確率はいくつだろうか? むずい・・・壺とかコインをイメージしただけで拒絶反応が出る 〔参考書〕
H.C.von Baeyer 「QB ism - 量子×ベイズ」 森北出版 (2018/Mar)
256p.3024円 松浦俊輔 (訳)、 木村 元 (解説)
量子情報時代の新解釈
http://www.morikita.co.jp/books/book/3166 帰無仮説が正しいときに棄却する確率Pr(Reject | H0)が第一種の過誤。
棄却された帰無仮説が正しい確率Pr(H0 | Reject)をFalse Positive Report Probabilityと呼ぶらしい。
条件付き確率で条件入れ替えってベイズぽいよね。 P(H0|Reject)=P(Reject|H0)P(H0)/P(Reject)
=P(Reject|H0)P(H0) / { P(Reject|H0)P(H0) + P(Reject|H1)P(H1) }
第一の過誤=α 第二種の過誤βとすると
P(H0|Reject)= αP(H0)/{αP(H0) + (1-β)(1-P(H0))}
でP(H0)を事前確率に想定しなければ算出できないな。 FPRP = Pr(H0|y)
= BF*PO/(BF*PO+1)
( BF = Pr(y|H0)/Pr(y | H1) : Bayes factor , PO = π0/(1-π0) 帰無仮説のオッズ) 「ビールには水が入っている」
「ウィスキーにも水が入っている」
「ブランデーにも水が入っている」
よって「水を飲むと酔っ払う」(・∀・) >>616
水が重回帰で選択されなかったら
いいのかな?
選択されたら介入で因果関係を証明するしかないのかな? >>618
統計学は数学と無関係というのが帰無仮説かな。 薬剤yを1人ずつ投与して効果判定したら、3人めで効果が確認できた。
薬剤gを9人同時に投与したら3人に効果があった。
どちらの有効性が高いか?
別バージョン(こっちがオリジナルw)
ゆるゆる女子大生に1人ずつメールで誘ったら3人めが開脚。、
がばがば女子大生9人に一斉にメールを送ったら3人が開脚。
どっちが開脚が容易か?
開脚率の期待値を計算してみた。
ゆるゆる女子大生の開脚率期待値:r人目で初めて開脚
r=3
Ex.yuru <- function(r){
integrate(function(x)x*(1-x)^(r-1)*x,0,1)$value/integrate(function(x)(1-x)^(r-1)*x,0,1)$value
}
Ex.yuru(r)
2/(r+2)
がばがば女子大生の開脚率期待値:N人中z人開脚
N=9
z=3
Ex.gaba <- function(N,z){
integrate(function(x) x*choose(N,z)*x^z*(1-x)^(N-z),0,1)$value/integrate(function(x)choose(N,z)*x^z*(1-x)^(N-z),0,1)$value
}
Ex.gaba(9,3)
(z+1)/(N+2) オークションでの出品者の評価が
出品者A 良い9人 悪い1人
出品者B 良い4人 悪い0人
であったとするとどちらが評価の高い出品者と言えるか? よく確率で、英語だと、
such thatって出てきますけど、
どういう意味ですか?
〜みたいな、で解釈してもいい? >>620
ex.gaba ex.yuru にはやられました。 >>618
> 統計学は他の板へ。
> 数学とは何も関係ないから。
禿同
統計学板を作って隔離して欲しいよね。
理論統計とか気持ち悪くて吐きそう 予備校の持ってる偏差値ピッグデータの方が噴飯モノの欧米のデータサイエンティスト笑わせだろ >>632
GOOGLEで
統計学で検索すると約 40,000,000 件
統計学 数学で検索すると約14,700,000 件
統計学 物理学で検索すると約 6,310,000 件
数学と物理学で統計学との関係の強さに差はない、を帰無仮説にする。
χ二乗検定でX-squared = 4543700でp.value < 2.2e-16
で帰無仮説は棄却された。 予備校の模試での合否判定ってロジスティク回帰でやってのかな 一様事前分布の代わりに使われるJefferyの分布beta(0.5,0.5)って
何の有用性があるのか今一つわからない。
2/π*arcsin(√x)になるのはわかるんだが。 >>640
Jefferyのは一対一のパラメータ変換後も関係が維持されて不偏になって余計なこと考えずに済む。
Φ=t(θ)のとき、
p(θ)〜|J(θ)|^1\2→p(Φ)〜|J(Φ)|^1\2
β(0.5,0.5)はpdfがベルヌーイ分布の時だな、ほかの時は知らん
wikiでよければこの辺は書いてある
https://en.m.wikipedia.org/wiki/Jeffreys_prior 江戸末期の田舎の下級武士に経済ユダヤが支援してテロを起こさせ江戸幕府を転覆させたのが明治維新。
江戸末期から日本は経済ユダヤとの繋がりがありお互いの利益の均衡を目指してきたのが今日までの政治
の中心課題だと言えます。複式簿記 資本主義 株式制度 現在の経済の根幹を作ったのは彼等であり、
全ての産業を掌握する彼等(総資産数京円以上)の意向を無視出来ません。旧ソ連 中国共産党 北朝鮮
ISISを作ったのは彼等であり、日本の技術流出 東芝の半導体事業からの撤退、シャープの倒産全て彼らの
シナリオ通りに動いてます。また、ここ数百年における世界の全ての紛争、戦争は彼等によって引き起こさ
れました。
彼らの目指している世界は自分達を支配階級とした人類の管理であり歯向かう人間の排除です。
私達が右や左と罵り合う姿は彼らにとって好都合であり、対立は彼らの支配体制の強化になります。そういっ
たことを全ての日本人が理解しないと同じことを繰り返し、十数年後 あの時安部が日本を滅茶苦茶にした。
今度の保守の誰々さんこそ日本を救うと喚いてるかもしれません。消費税廃止 移民反対と当たり前のことを
各政治家に要求し続けると同時に政治家は全員ユダヤの手先だと疑い続けないと日本の独立は成し得ません。
世界中の人間が知るべきこと
・世界の全てのメディアはユダ金が牛耳っている。
・トランプ プーチン 習近平 安部 麻生 テリーザ・メイ メルケル 文在寅 金正恩はユダ金の手下であり仲間である。
テレビに出てる有名な政治家は国内外問わず全員ユダヤの手先だと考える事。右や左などによる対立は茶番である。
・全てのテロと紛争と戦争は、ユダ金達と軍産複合体によって引き起こされている。 >>642
ありがとうございました。
Fisherの情報量から勉強してみます。 >>646
( 1/6*n*(n+1)*(2*n+1) + 1/2*n*(n+1) )/2 >>618
何も関係ないw
でも根拠は出さない
おまえの主観なんてだれも興味ねぇよ
何も強い関係ないなんて、全称命題的な否定するやつはまずバカ >>646
求める個数の一般解は
婆(k+1)/2
=這這1
ロリーローリンの公式から
n(n+1)(n+2)/3!
n=100より求める個数は
100・101・102/6
=10100・17
=171700 ■このゲームができるのは1回だけです
Aのツボは99個の青い球と1個の赤い球が詰まっている
Bのツボは99個の赤い球と1個の青い球が詰まっている
このとき、自分の目の前のツボから1個球を
取り出してみたら赤い球であった
目の前のツボはAのツボだろうか、Bのツボだろうか 問題
99人の囚人がいます。彼らの頭に1〜100までのナンバーカードが貼りつけられた帽子をランダムにかぶせます。
他人の帽子は見ることができても、自分の帽子は見ることができません。
帽子の数は全部で100なので、一つ使われずに余ります。
そのナンバーは囚人達にはわからないようにしておきます。
この状況で、囚人たちに一斉に自分のナンバーを宣言させて、全員が正解だったら釈放するという賭けをします。
囚人たちには帽子をかぶせられる前に相談タイムが設けられています。
どういう戦略を取れば、助かる確率を最も高くできるでしょうか? >>651
98人の数字に出てこなかった2つをお互いに申告したら使われてない数字が分かるから自分の数字が分かるンじゃないの? >>652
帽子を被されてからは囚人間の意思疎通はできない前提の問題。 >>650
Aを選ぶ確率がJeffery分布に従うとすると
# b=1-a
# P(r|a)=1/100
# P(r|b)=99/100
# P(a|r)=P(r|a)P(a)/[P(r|a)P(a)+P(r|b)P(b)]=0.01p/(0.01p+0.99(1-p))
library(rjags)
data=list(shape1=0.5,shape2=0.5)
modelstring='model{
par=0.01*p/(0.01*p+0.99*(1-p))
p ~ dbeta(shape1,shape2)
}めあ
'
writeLines(modelstring,'TEMPmodel.txt')
model=jags.model('TEMPmodel.txt',data=data)
update(model)
samples = coda.samples( jagsModel , variable=c("par",'p'), n.iter=100000 )
coda::HPDinterval(samples[,'par'])
hist(as.matrix(samples)[,'par'],freq=FALSE,main='',col='gray',xlab='Pr(A|red)',
breaks=50, axes=FALSE,ylab=''); axis(1)
求める確率P(箱A|赤玉)は
平均
> mean(as.matrix(samples)[,'par'])
[1] 0.03687427
信頼区間
> coda::HPDinterval(samples[,'par'])
[[1]]
lower upper
var1 0.0000001471041 0.1601718
attr(,"Probability")
[1] 0.95 # タイプミス修正
library(rjags)
data=list(shape1=0.5,shape2=0.5)
modelstring='model{
par=0.01*p/(0.01*p+0.99*(1-p))
p ~ dbeta(shape1,shape2)
}
'
writeLines(modelstring,'TEMPmodel.txt')
model=jags.model('TEMPmodel.txt',data=data)
update(model)
samples = coda.samples( jagsModel , variable=c("par",'p'), n.iter=100000 )
coda::HPDinterval(samples[,'par'])
par=as.matrix(samples)[,'par']
hist(par,freq=FALSE,main='',col='gray',xlab='Pr(A|red)',
breaks=50, axes=FALSE,ylab=''); axis(1)
BEST::plotPost(par,showMode=TRUE)
mean(par)
quantile(par,c(0.025,0.50,0.975)) 確率分布を考えないなら
赤玉でたときにAの箱であった確率は
> 0.01*0.5/(0.01*0.5+0.99*0.5)
[1] 0.01
一様分布にしたらこうなった。
> mean(par)
[1] 0.0369026
> coda::HPDinterval(samples[,'par'])
[[1]]
lower upper
var1 0.0000001761594 0.1594358
attr(,"Probability")
[1] 0.95 >>650
一様分布でのシミュレーションを100万回繰り返してみた。
pickup <- function(){ # A:Box 1, Red:Ball 1
A=c(1,rep(0,99))
B=c(0,rep(1,99))
AB=list(A,B)
Box=sample(1:2,1)
Ball=sample(AB[[Box]],1)
c(Box=Box,Ball=Ball)
}
pickup.sim <- function(k=1e3){
re=replicate(k,pickup())
PAR=sum(re['Box',]==1 & re['Ball',]==1)/sum(re['Ball',]==1)
return(PAR)
}
re=replicate(1e3,pickup.sim())
mean(re)
HDInterval::hdi(re)
median(re)
Mode(re)[1]
平均値
> mean(re)
[1] 0.01009577
95%信頼区間
> HDInterval::hdi(re)
lower upper
0.001901141 0.018329939
attr(,"credMass")
[1] 0.95
中央値
> median(re)
[1] 0.01002004
最頻値
> Mode(re)[1]
x
0.01020133 >>652
囚人がランダムに答えると、2の99乗分の1の釈放確率。
ネットで検索すると解答がみつかる。
釈放確率が1/2にできるという。
解説読んでも理解できなかったが、シミュレーションしたらその通りだった。
解答のurlと
シミュレーションのスクリプトはこれ。
http://rio2016.2ch.net/test/read.cgi/math/1501755792/443 ある大学の学生数は500以上1000人以下であることはわかっている。
無作為に2人を抽出して調べたところ
二人とも女子学生である確率は1/2であった。
この大学の学生数と女子学生数を求めよ。 問題文に問題があると思うが、意図を汲んで解くと
学生数=696
女子学生数=492 確率がちょうど1/2になる整数のペアは
女子 男子
3 1
15 6
85 35
493 204
問題文の表現に問題あるかな?
xC2 ÷ yC2=1/2の解を求める問題。 >>661
次に1/2になるのは
女子 2871 男子1189 総数4060 日本人の血液型はA,O,B,ABの比率が概略4:3:2:1であるという。
全部の血液型を集めるのは平均で何人集めればよいか?
シミュレーションで12.37、切り上げて13人になった。
解析解はよくわからん。 2x(x-1)(x-2)(x-3)=y(y-1)(y-2)(y-3)の整点は? >>666
式値=0は除くと
x=7, y=8
2*7*6*5*4=8*7*6*5 A:2x(x-1)=y(y-1)
この曲線Aは、4個の自明な整点
(x,y) ∈ {0,1}×{0,1}
を持つ
これが
無作為に2人を抽出して可能となる組み合わせ
{男男 男女 女男 女女}
に対応するという事かね?(´・ω・`) >>668
>659は
xC2 ÷ yC2=1/2
500<y<100
の自然数解を求めるだけの話。 学生数x 女子学生数y
無作為に2人を抽出して可能となる組み合わせ
{男男 男女 女男 女女}
{女女}50%…a
{男男 男女 女男}50%…b
500≦x≦1000
x=a+b
250≦a=x−b
bを分割する
{男男}…b1
{男女}…b2
{女男}…b3
事象aが観測された元でのそれぞれの確率は
P(b1|a)=P(b1) * P(a|b1)
P(b2|a)=P(b2) * P(a|b2)
P(b3|a)=P(b3) * P(a|b3)
学生数xに占める女子学生数yの割合は
y/x=7/10が尤もらしい
ゆえに、
P(b1|a)=P(b1) * P(a|b1)=3/10
P(b2|a)=P(b2) * P(a|b2)=1/10
P(b3|a)=P(b3) * P(a|b3)=1/10 あるタクシー会社のタクシーには1から通し番号がふられている。
タクシー会社の規模から保有タクシー台数は100台以下とわかっている(弱情報事前分布)。
この会社のタクシーを5台みかけた。最大の番号が60であった。
この会社の保有するタクシー台数の期待値と95%信用区間を求めよ。 Sum[n C[59,4]/C[n,5],{n,60,100}]/Sum[C[59,4]/C[n,5],{n,60,100}]
=2590100/36231≒71.4885
Sum[C[59,4]/C[n,5],{n,60,92}]/Sum[C[59,4]/C[n,5],{n,60,100}]
=0.947035
Sum[C[59,4]/C[n,5],{n,60,93}]/Sum[C[59,4]/C[n,5],{n,60,100}]
=0.95496
60〜93 ■ このスレッドは過去ログ倉庫に格納されています