ベイズの統計学を学び始めたんだけど
■ このスレッドは過去ログ倉庫に格納されています
信用に値するのか疑問です。
人工知能とかではなく日々の動機付けに利用する予定です 一様分布はβ分布B(1,1)に相当。共役分布の概念を理解していれば
n発n中でベイズ更新されて事後分布はB(n+1,1)になるので
平均値は(n+1)/(n+2)となる。
この説明でわかる人はわかる。 コインを投げて表が出る確率pとしてpが一様分布に従うとすると
n回投げてk回表が出た時に、次に投げて表が出る確率は(k+1)/(n+2)
サイコロの各目が出る確率p1,p2,…,p6として
0≦p_i≦1,p1+p2+…+p6=1の範囲で<p1,p2,…,p6>が一様分布に従うとすると
n回投げてiの目がk回出た時に次の出目がiである確率は(k+1)/(n+6) >>542の数式を勝手に確認してみた。
2発2中なら3/4となるはず。
計算して確認してみた。
確認方法概要
事前分布は、ゴルゴ10人 1発1中後分布
事後分布は、さらに 1発1中した分布
事後分布の期待値は、3/4を確認する。
では解説ぢゃ。
Step1) 確率変数のワシの定義ぢゃ
p ≡ゴルゴ15の命中確率
E1 ≡ ゴルゴ15はp=19/20ぢゃ
E2 ≡ ゴルゴ15はp=17/20ぢゃ
E3 ≡ ゴルゴ15はp=15/20ぢゃ
…
E10 ≡ ゴルゴ15はp=1/20ぢゃ
Step2) 事前分布、1発1発中した分布ぢゃ
P(E1) = 0.19
P(E2) = 0.17
P(E3) = 0.15
…
P(E10) = 0.01
Step3) P(1発1中)ぢゃ
★≡ 1発1中とおくとP(★)=133/200ぢゃ
Step4)事後分布ぢゃ
P(E1|★) = 0.19*19/20/P(★)= 19^2/1330
P(E2|★) = 0.17*17/20/P(★)= 17^2/1330
P(E3|★) = 0.15*15/20/P(★)= 15^2/1330
…
P(E10|★) = 0.01*1/20/P(★)= 1^2/1330
Step5) 事後分布の期待値ぢゃ
Step4より、まぁ、とにかく、
(19^3+17^3+15^3+ … +3^3+1^3)/26600
∴199/266 = 0.7481…
3/4 = 0.75とほぼ同じ値ぢゃ
結論
n発n中で(n+1)/(n+2)なりそうぢゃ >>543さんのコイントスの式は、
一様分布でn回中k回表での確率
つまり、(k+1)/(n+2) を解説した式ぢゃ。
例えば、
「5回中4回表 ⇒ 表確率4/5」ぢゃなくて、
「5回中4回表 ⇒ 表確率5/7」とのことぢゃ
勝手にコイン10枚の一様分布計算で確認
では、軽く解説ぢゃ
Step1) 確率変数のワシの定義
p ≡ コイントスの表の確率
E1 ≡ p=0.95
E2 ≡ p=0.85
E3 ≡ p=0.75 という感ぢぢゃ
Step2) 事前分布、一様分布ぢゃ
P(E1) = 0.1
P(E2) = 0.1
P(E3) = 0.1 という感ぢぢゃ
Step3) P(5回中4回表)ぢゃが
★≡ 5回中4回表という事象ぢゃ
P(★) = P(E1) *P(★|E1)
+ P(E2) *P(★|E2)
+ P(E3) *P(★|E3)
…
= 0.5 * 0.33745625
Step4)事後分布の計算ぢゃ
P(E1|★)=P(E1) *P(★|E1) / P(★)
= 0.95^4 * 0.05^1 / 0.33745625
= 0.120683237
という感ぢで計算、スナワチ、
P(E1|★) = 0.95^5 * 0.05^1 / 0.33745625
P(E2|★) = 0.85^5 * 0.15^1 / 0.33745625
P(E3|★) = 0.75^5 * 0.25^1 / 0.33745625
という感ぢで、β分布ぽい離散分布ぢゃ
Step5)事後分布ぢゃ
P(E1|★) = 0.1146
P(E2|★) = 0.1972
P(E3|★) = 0.1758
P(E4|★) = 0.1203
…
P(E10|★) = 0.0000
Step6)事後分布の期待値ぢゃ
Step5よりとにかく、0.7177ぢゃ
なお、コイン50枚で計算したら0.7144
ほぼ完璧に、5/7ぢゃ
《結論》
コインの確率は、ワシの感ぢた通り、
(k+1)/(n+2)で計算すると善い感ぢぢゃ タイプミスった。
以下の如く、改訂する。
Step5)事後分布ぢゃ
P(E1|★) = 0.1146 ぢゃなくて0.1207
P(E2|★) = 0.1972 ぢゃなくて0.2320
P(E3|★) = 0.1758 ぢゃなくて0.2344
P(E4|★) = 0.1203 ぢゃなくて0.1851
…
P(E10|★) = 0.0000 >>547
見えない要因(潜伏変数)を完全に無視できれば
因果関係があるように推測される >>543
ベータ分布のベイズ更新で
B(1+k,1+n-k)
平均は(1+k)/(1+k+1+n-k)=(k+1)/(n+2)
ディリクレ分布のベイズ更新で
ij (j=1~6)をn 回サイコロを振ってj の目がでた回数とすると
事後分布はD(1+i1,1+i2,1+i3,1+i4,1+i5,1+i6)
となる
6
琶j = n
1
なので
jの目のでる確率は(ij+1)/(n+6) 同じコイン投げでも、15歳が行うのと80歳がするのとでは
結果に差が生じることは容易に推察される
また快適な室内で行うのと、寒い戸外とでは
結果が違ってくるであろう >>552
80歳の老人には手の甲に深い皺があるだろう? 差が無いを帰無仮説にするのが通例。
ベイズだと事前確率分布。 事象発生前に、
事前確率からベイズで事後確率算出は、
素晴らしいと思う。が
事象発生後に、
事前確率からベイズで事後確率算出は、
何だか、違和感を感じる。
気のせいかも 太陽が昇る後に気温が上昇した場合は
必然性のある因果関係があるだろう
しかし、おみくじで凶を引いた後に、悪いことが起きたとしても、
これは因果関係ではなく必然性のない先後関係と言える 《サイコロ試行回数Zeroでの確率分布》
神のみぞ知る 無限大の希望の未来
ラプラスの悪魔のみぞ知る サイコロ出目
胴元だけ知る サイコロの事前確率分布
不可能予測を、可能予測にベイズ改訂!
それは真の統計理論を極めた者が知り得る。
さて、コイン試行回数Zeroで確率1/2ぢゃ
サイコロ試行回数Zeroなら確率1/6ポィ
iの目が出る確率密度分布は、超感覚的に
P(0 ≦ p_i ≦ 1) ≠ 1 ∵サイコロ
P(0 ≦ p_i ≦ 1/6) = 5 かつ、
P(1/6 < p_i ≦ 1) = 1/5 なのぢゃ
ぢゃ、上記 確率密度分布の超詳細χ説ぢゃ
P(0 ≦ p_i ≦ 1/6) = C Cは定数 (1)
P(1/6 < p_i ≦ 1) = C' C'も定数 (2)
分布P(p_i) の p_i平均は、1/6 (3)
分布P(p_i) は確率分布 ∴∫P(p_i) = 1 (4)
(1)(2)(3) より C:C' = 25:1 で、(4) より
iの目が出る 超感覚的 確率密度分布は、
P(0 ≦ p_i ≦ 1/6) = 5
P(1/6 < p_i ≦ 1) = 1/5 ぽいのぢゃ
いぢょう、ぢゃ。 # 封筒A,Bで一方の封筒に他方の2倍が入っているという2封筒問題を考えてみた。
# 封筒Aにz円(z=0~1)入っている確率をP(A=z)で表すことにする。
# P(A=z)は不明
# P(B=2z|A=z)も不明、この確率pとする
# P(B=0.5z|A=z)は1 - p
# 封筒Bに入っている金額の期待値は
# 2z*P(B=2z|A=z) + 0.5z*P(B=0.5z|A=z)
# = 2z*p + 0.5z*(1-p)
# = 1.5zp+0.5z
# これは封筒Aの1.5p+0.5倍の期待値である。
# これは封筒Aと期待値の差は(1.5p-0.5)円である。 封筒Aと封筒Bの期待値の差の件
精密には (1.5p-0.5)z円 ぢゃ。
まぁそれは、ともかく
pが不明⇒p=1/2 と見なしてはイケナイ。
ぢゃ χ説
封筒Aと封筒B、期待値は同じぢゃっ!
∵理由はないからぢゃ
z=0でもz≠0でも、期待値は同ぢゃから、
∴1.5p-0.5 = 0
∴p=1/3ぢゃ、多分ぢゃが此で善いのぢゃ
然るに、
2封筒の事前確率分布は、
p(Low=1 ∧ High = 2) = 1/2
p(Low=2 ∧ High = 4) = 1/4
p(Low=4 ∧ High = 8) = 1/8
…
p(Low=∞ ∧ High = 2*∞) = 1/∞
───────────────
Σp = 1/2 + 1/4 + 1/8 +…+ 1/∞ = 1
一意に何故か定まっちゃた。
いぢょう、ぢゃ 相関関係は因果関係と同じではない
相関関係は因果関係の単なる必要条件の1つである 相関関係があるだけでは因果関係があるとは断定できず、
因果関係の前提に過ぎない >>563
ベイズでは確率=credibilityゆえ因果と相関を論じてるのは無意味。 592 名前:デフォルトの名無しさん 投稿日:2018/01/25(木) 09:50:27.30 ID:SBd2lywo0
陰陽五行説とは固有値求めることと見つけたり(笑)
593 名前:デフォルトの名無しさん 投稿日:2018/01/25(木) 10:39:30.87 ID:ZxAe+MwB0
干支も木火土金水だし60進法の基底ベクトルではある
594 名前:デフォルトの名無しさん 投稿日:2018/01/25(木) 18:55:33.72 ID:C/gST0Ked
小出しにしないで、陰陽五行と線形代数?の関連性を詳しくご教示いただけると非常に有り難く存じます。
あなた様は真理をご存知の方とお見受けいたします。
595 名前:デフォルトの名無しさん 投稿日:2018/01/25(木) 20:22:39.65 ID:ID0HK2lBM
弥勒が顕現するころに察するでしょう
596 名前:デフォルトの名無しさん 投稿日:2018/01/25(木) 20:37:38.48 ID:MrSJapun0
曼荼羅とはフラクタルなり >>562
# 封筒内の金額は有限とする。
# 封筒A,Bで一方の封筒に他方の n 倍が入っているという2封筒問題を考えてみた。
# 封筒Aに z 万円(z=0~1)入っている確率をP(A=z)で表すことにする。
# P(B=nz|A=z) = pとして一様分布に従うとする。
# P(B=z/n|A=z)は1 - p
# 封筒Bの期待値はz*(n*p+(1-p)/n)
# これはp=1/(n+1)のとき封筒Aの中味zと等しくなる。 >>567
何が「一様分布に従う」か謎だが、
pは、[0,1]の変数ぢゃが定数なのぢゃ。
数式 z = z(np+(1-p)/n)を解くと
p = 1/(n+1) ⇔ A = Bの期待値 (1)
のようぢゃ
nを定めれば、例えばn=2と定めれば、
pは変数でなく定数1/3 に定まる。
さて、 (1) の対偶をとると、
A ≠ Bの期待値 ⇔ p≠ 1/(n+1)
∴
A < Bの期待値 ⇒ p≠ 1/(n+1)
多分、もしかぢゃが、
p> 1/(n+1) なら、AからBに
チェンジすると より善いハズぢゃ >>568
n=2のとき
Aの封筒に1万円入っていたときBの封筒に2万円入っている確率がp
このpが一様分布する
という前提 n=1/2で
Aの封筒に1万円入っていたときBの封筒に5千円入っている確率は
考えなくてもいいの? >>571
封筒に入る金は2:1だから
2万円入っている確率がpなら5千円が入っている確率は1 - p
でよくね? >>572
二つの封筒問題はプレイヤがAとBの封筒をランダムに選ぶことに
意味があるからそれはだめだ >>573
AとBに入っている金の組み合わせをプレイヤーが選べるわけではないだろ? A=2B か A=1/2Bなので
A=2Bの確率がpならA=1/2Bの確率は1-pでいいと思うのだが。 2つの封筒問題に於いて、
事象(B=2z | A=z)と事象(B=z/2 | A=z)は、
排反事象ぢゃから、
pとおくと1-pは、正解ぢゃ。
さて、例えば、z = 10000円では、
P(A=5000∧B=10000) = q とおくと、
P(A=10000∧B=5000) = q であり、
P(A=10000∧B=20000) = r とおくと、
P(A=20000∧B=10000) = r である。
P(B=20000 | A=10000) = p とおくと勿論
P(B=5000 | A=10000) = 1-p である。
∵排反事象ぢゃ
ベイズ的な計算により、p = r/(q+r) 《2つの封筒問題の胴元のアルゴ推定》
起 AとBの2つの封筒問題に於いて、
Aを開封で、A=1(万円)だとしよう。
Bの期待値E(B)=1(万円)なのぢゃ。
承 E(A) + E(B) = 2 ぢゃろう。
A開封前のA+Bの分布は、
平均2 範囲0から4 の一様分布と推定ぢゃ
転 胴元プログラム言語風アルゴの推定
U ← 平均2 範囲0から4 の一様乱数
High ← (2/3) * U Low ← (1/3) * U
R ← 範囲0から1 の一様乱数
R > 0.5の場合、{A ← High B ← Low}
以外 {A ← Low B ← High}
結 E(B) - E(A) = 0 ∴
参加料金>Aで、胴元利益ぢゃ 英国ロンドン・ビジネススクールのリンダ・グラットン教授の研究によると、
2007年に日本で生まれた子供は、107才まで生きる確率が50%もあるという 《平均寿命のワシの超確率Kサン論》
例えば、寿命の西暦3001年の統計が
極めて簡単かつ仮に
P(0才→20才 | 2980年生) = 0.01
P(20才→40才 | 2960年生) = 1
P(40才→60才 | 2940年生) = 1
P(60才→80才 | 2920年生) = 1
P(80才→100才 | 2900年生) =0.99
P(100才→120才 | 2880年生) = 0.0
としよう。
西暦3001年平均寿命は、ワシのKサン論なら
0.01*(0+20)/2 + 0.99*(80+100)/2 = 89.2才
尚、2980年生れの子は、
20才まで生きる確率は、0.99
40才まで生きる確率は、0.99^2
60才まで生きる確率は、0.99^3
…
138才まで生きる確率は、0.99^69 = 0.5
なのぢゃ。
ぢゃ〜また。 ベイズとはたぶん無関係だが話題提供。
壺の中に n 種類の異なるクーポンが入っている。1回の試行で壺の中から1枚クーポンを引き、引いたものと同じ種類のクーポンを壺の中に戻すものとする。
n 種類(全種類)のクーポンを集めようとしたとき、 t 回以上の試行回数が必要となる確率はいくつだろうか? むずい・・・壺とかコインをイメージしただけで拒絶反応が出る 〔参考書〕
H.C.von Baeyer 「QB ism - 量子×ベイズ」 森北出版 (2018/Mar)
256p.3024円 松浦俊輔 (訳)、 木村 元 (解説)
量子情報時代の新解釈
http://www.morikita.co.jp/books/book/3166 帰無仮説が正しいときに棄却する確率Pr(Reject | H0)が第一種の過誤。
棄却された帰無仮説が正しい確率Pr(H0 | Reject)をFalse Positive Report Probabilityと呼ぶらしい。
条件付き確率で条件入れ替えってベイズぽいよね。 P(H0|Reject)=P(Reject|H0)P(H0)/P(Reject)
=P(Reject|H0)P(H0) / { P(Reject|H0)P(H0) + P(Reject|H1)P(H1) }
第一の過誤=α 第二種の過誤βとすると
P(H0|Reject)= αP(H0)/{αP(H0) + (1-β)(1-P(H0))}
でP(H0)を事前確率に想定しなければ算出できないな。 FPRP = Pr(H0|y)
= BF*PO/(BF*PO+1)
( BF = Pr(y|H0)/Pr(y | H1) : Bayes factor , PO = π0/(1-π0) 帰無仮説のオッズ) 「ビールには水が入っている」
「ウィスキーにも水が入っている」
「ブランデーにも水が入っている」
よって「水を飲むと酔っ払う」(・∀・) >>616
水が重回帰で選択されなかったら
いいのかな?
選択されたら介入で因果関係を証明するしかないのかな? >>618
統計学は数学と無関係というのが帰無仮説かな。 薬剤yを1人ずつ投与して効果判定したら、3人めで効果が確認できた。
薬剤gを9人同時に投与したら3人に効果があった。
どちらの有効性が高いか?
別バージョン(こっちがオリジナルw)
ゆるゆる女子大生に1人ずつメールで誘ったら3人めが開脚。、
がばがば女子大生9人に一斉にメールを送ったら3人が開脚。
どっちが開脚が容易か?
開脚率の期待値を計算してみた。
ゆるゆる女子大生の開脚率期待値:r人目で初めて開脚
r=3
Ex.yuru <- function(r){
integrate(function(x)x*(1-x)^(r-1)*x,0,1)$value/integrate(function(x)(1-x)^(r-1)*x,0,1)$value
}
Ex.yuru(r)
2/(r+2)
がばがば女子大生の開脚率期待値:N人中z人開脚
N=9
z=3
Ex.gaba <- function(N,z){
integrate(function(x) x*choose(N,z)*x^z*(1-x)^(N-z),0,1)$value/integrate(function(x)choose(N,z)*x^z*(1-x)^(N-z),0,1)$value
}
Ex.gaba(9,3)
(z+1)/(N+2) オークションでの出品者の評価が
出品者A 良い9人 悪い1人
出品者B 良い4人 悪い0人
であったとするとどちらが評価の高い出品者と言えるか? よく確率で、英語だと、
such thatって出てきますけど、
どういう意味ですか?
〜みたいな、で解釈してもいい? >>620
ex.gaba ex.yuru にはやられました。 >>618
> 統計学は他の板へ。
> 数学とは何も関係ないから。
禿同
統計学板を作って隔離して欲しいよね。
理論統計とか気持ち悪くて吐きそう 予備校の持ってる偏差値ピッグデータの方が噴飯モノの欧米のデータサイエンティスト笑わせだろ >>632
GOOGLEで
統計学で検索すると約 40,000,000 件
統計学 数学で検索すると約14,700,000 件
統計学 物理学で検索すると約 6,310,000 件
数学と物理学で統計学との関係の強さに差はない、を帰無仮説にする。
χ二乗検定でX-squared = 4543700でp.value < 2.2e-16
で帰無仮説は棄却された。 予備校の模試での合否判定ってロジスティク回帰でやってのかな 一様事前分布の代わりに使われるJefferyの分布beta(0.5,0.5)って
何の有用性があるのか今一つわからない。
2/π*arcsin(√x)になるのはわかるんだが。 >>640
Jefferyのは一対一のパラメータ変換後も関係が維持されて不偏になって余計なこと考えずに済む。
Φ=t(θ)のとき、
p(θ)〜|J(θ)|^1\2→p(Φ)〜|J(Φ)|^1\2
β(0.5,0.5)はpdfがベルヌーイ分布の時だな、ほかの時は知らん
wikiでよければこの辺は書いてある
https://en.m.wikipedia.org/wiki/Jeffreys_prior ■ このスレッドは過去ログ倉庫に格納されています