統計学Part17 [無断転載禁止]©2ch.net

1132人目の素数さん2016/11/11(金) 02:34:18.63ID:4ofrRMLG

5332052017/09/24(日) 18:14:00.13ID:yN+7qIU3
>>532
の計算をすると
>>531
の結果を得られるということですね

ちょっと試してみます
ありがとうございました

534132人目の素数さん2017/10/20(金) 22:47:02.95ID:49lv/Gr+
>>511
これからの実学では、「データ・サイエンティスト」が脚光を浴びる
模様です。
1ノチラ ★2017/10/10(火) 12:30:31.49ID:CAP_USER
今年また、米国の大学で助教授として働いていた2人の友人がアマゾンに引き
抜かれた・・・大学の研究職を辞してアマゾンなどの企業へ転職する経済学者・
統計学者・情報工学者などはこの数年で格段に増え・・・引き抜きの対象に
なっているのが「データ・サイエンティスト」と呼ばれる、データ分析に長けた
研究者たちだ。例えば、統計学・計量経済学の専門知識を持つ統計学者・経済学者、
そして、人工知能を使ったデータ分析を開発する工学者など・・・ 「データ分析の力」を
持った人材を集めることが、ビジネス成功の大きな柱になってきているためで・・・・・・・・
【IT】いま一番稼げるのは「データ・サイエンティスト」かもしれない。新卒でも「破格の待遇」
http://egg.5ch.net/test/read.cgi/bizplus/1507606231/

535◆2VB8wsVUoo 2017/10/23(月) 17:56:41.34ID:Dl6USvMt

536◆2VB8wsVUoo 2017/10/23(月) 17:57:07.62ID:Dl6USvMt

537◆2VB8wsVUoo 2017/10/23(月) 17:57:28.42ID:Dl6USvMt

538◆2VB8wsVUoo 2017/10/23(月) 17:57:48.56ID:Dl6USvMt

539◆2VB8wsVUoo 2017/10/23(月) 17:58:09.66ID:Dl6USvMt

540◆2VB8wsVUoo 2017/10/23(月) 17:58:29.43ID:Dl6USvMt

541◆2VB8wsVUoo 2017/10/23(月) 17:58:47.49ID:Dl6USvMt

542◆2VB8wsVUoo 2017/10/23(月) 17:59:08.94ID:Dl6USvMt

543◆2VB8wsVUoo 2017/10/23(月) 17:59:31.50ID:Dl6USvMt

544◆2VB8wsVUoo 2017/10/23(月) 17:59:50.45ID:Dl6USvMt

545132人目の素数さん2017/11/14(火) 14:50:33.34ID:joPUMHzn
スレチかもしれないが、適合しそうなスレがここだったんで書かせてもらいました。

構造方程式モデリングで、あるサービスの全体的な満足度とその構成サービスの品質の関係を7段階評価のアンケートで得た情報を元に求めようとしてます。

ただ、問題は回答者が構成サービスを全て使っている(又は経験がある)とは限らない点です。
個別の構成サービスの利用経験がない場合の回答はそもそも品質の評価が出来ないはずなのに、良い・悪いと回答するものが一定数あります。
その場合、そのまま扱うことは問題があると思います。
このデータは欠測値として処理すべきか、或はどちらとも言えないのような回答に纏めてしまうのが妥当か悩んでいます。
どちらも問題があるように感じてはいるんですが、自分ではどうすれば良いかわからないんです。知恵を貸してください。

546132人目の素数さん2017/12/21(木) 01:52:39.52ID:hyfnWguS
>>523
以下の後発スレの方が、適当では?
ベイズの統計学を学び始めたんだけど
http://rio2016.5ch.net/test/read.cgi/math/1512229947/

547132人目の素数さん2017/12/23(土) 13:56:04.80ID:GaEzdGdo
学校の課題で問題が出されたのですが、全くわかりません。
問題は、
問1 平均値μ=2、および標準偏差σ=2の正規分布に従う確率変数を考える。このとき、この確率変数が次の区間に含ま
れる確率を小数第4位まで計算しなさい。
1 (4, ∞)
2 (-∞, 2.7)
3 (0.88, 5.6)
4 (1.46, 3.24)

問2 ある検問所で記録された車のスピードのデータによると、そこを通過する車は平均時速61.6km、標準偏差7.0kmで、だいたい正規分布に従っている。このとき、次の割合を100分率(パーセント)で小数第1位まで計算しなさい。
1 時速70kmをこえている車は全体の○%である
2 時速49kmよりも遅い車は全体の○%である
3 時速56kmから時速63kmまでの車は全体の ○%である

誰か助けてください、、答えだけでいいです、、、

548132人目の素数さん2017/12/23(土) 14:44:16.56ID:o3B98gr+
流石に授業も出てない、教科書も1章も読んでないのはスレチ
宿題外注スレへどうぞ

549132人目の素数さん2017/12/23(土) 14:58:59.29ID:JamHfM57
■モンティホール問題(空箱とダイヤ)

このゲームができるのは1回だけです

外からは中が見えない空箱100個の中のひとつに
ダイヤモンドを1個入れます

その中から1個の箱を選びます

98個の空箱を取り除きます

最後に残った2個の箱の中から1個の箱を選びます

ダイヤモンドが当たる確率は何%でしょうか?

550132人目の素数さん2017/12/23(土) 15:06:05.15ID:QY1eU5UE
ネットで何か知りたいときは下手に出るより出来るだけ挑発的に書いたほうがいいぞ
>>548みたいな奴が釣れて正解にたどり着けることが多い

551132人目の素数さん2017/12/23(土) 15:25:40.20ID:o3B98gr+
>>550
そろそろ釣れたかなw?

552132人目の素数さん2017/12/23(土) 15:29:40.77ID:QY1eU5UE
>>551
イミフ

553132人目の素数さん2017/12/24(日) 09:09:12.18ID:vhl+dUcQ
>>547
マジで簡単だから知恵袋にコピペしたら

554132人目の素数さん2017/12/24(日) 13:01:21.02ID:KJnyU+1/
>>553
自分でやったら
0.1587
0.6368
0.6763
0.3388

11.5
3.6
36.7 になった

555132人目の素数さん2017/12/24(日) 17:29:20.70ID:7IbDDB6m
>>545
もういないだろうが

データを除外するならデータ数がへるので検定力がさがる
つまり第二種の過誤がふえる
データ数が少ないならもんだいになる
どちらともいえないという回答にいれるってことは
線引きの問題がでてくる
線引きが外形的客観的にできないおそれがあるなら問題がでてくる
場合に応じてかんがえるべき

556132人目の素数さん2017/12/24(日) 17:33:16.87ID:ZCfw2SV/

557132人目の素数さん2017/12/24(日) 19:45:42.56ID:SlrroN1n
教科書を勉強して正規分布やポアソン分布や中心極限定理
推定や検定(点推定区間推定〜母平均母分散)
辺りまではやったのですが
次の段階としてどのテキストがお勧めでしょうか?

独学で学んでいるので、どれを学べばいいのかわからなくて困っています

558132人目の素数さん2017/12/24(日) 20:49:28.91ID:7IbDDB6m
>>557
東大教養課程編なんたらの
統計学入門なんたら
統計学入門人文学系なんたら
おなじく自然科学系なんたら
やっとけ
いいかどうか知らんが一応鉄板テキストだ

読み物なら駄目な統計学はよんどけ

時間に余裕があってより上をめざすなら
線形代数
速度論ルベーグ積分
集合論
はやっとけ

559132人目の素数さん2017/12/25(月) 18:06:49.35ID:Jjgc4VsK
>>558
ありがとうございます
3冊あるようなので内容を確認の上購入したいと思います
線形代数は学習済みなので測度論ルベーグ積分集合論について学習していきます

560132人目の素数さん2017/12/26(火) 13:11:11.22ID:8L4wMsz6
線形代数でも集合使ってんじゃないの?

561132人目の素数さん2018/01/02(火) 15:52:53.13ID:wG0bXeaR
東洋大の往路優勝はヴェイパーフライ4%の効果である。

これを統計学で証明できますか?
どのようにアプローチするのか勉強したいです。

562132人目の素数さん2018/01/05(金) 18:09:17.78ID:4Wd05fvH
重回帰分析で重決定係数が0.2などと低い場合は、偏回帰係数がいくつでもあまり意味がないのですか?

563132人目の素数さん2018/01/07(日) 00:22:03.05ID:bVIRAbtE
うんあんま意味ないよ。
回帰係数は傾きやからあてはまりとは関係ない。ほかの変数固定して固定しなかった変数を1かえるとどんだけ被説明変数が変動するかの目安でしかない。

564132人目の素数さん2018/01/13(土) 12:48:29.00ID:6Jex7paj
統計知識はあるR初心者が、R Studioを学ぶのに良い本はありますか?英語でも構いません。

565132人目の素数さん2018/01/14(日) 19:37:56.17ID:g8ARdrLk
ある製品の重さ100枚を測定して
平均値が100g、最大101.5g、最小98.5gだったとします。
この製品は100枚をワンセットとして包装するため、
100枚あるかの確認のために秤を使用することにしました。
しかしながら、仮に最大あるいは最小の製品が100枚続くと仮定すると、
100枚時総重量は製品1枚分の100g以上に違いがでてしまいます。
100枚がそろっていることを確認するためには、
OKの範囲をいくつに設定すればいいのでしょうか?

566132人目の素数さん2018/01/14(日) 23:10:16.26ID:Qd/O3m2F
>>565
正規分布だと仮定すると ±3σ(99.73%)で 1kg ± 19.35g
一枚の重量を確率変数としてその分布を考え、それが100枚集まった新たな確率変数が従う分布を考えればいいんじゃないかな。

567132人目の素数さん2018/01/16(火) 23:42:26.22ID:xmxgcibx
>>566
>>一枚の重量を確率変数としてその分布を考え、それが100枚集まった新たな確率変数が従う分布を考えれば
まさにそういうことがやりたかったけど具体的にどう計算したらいいかわからなかったです

568132人目の素数さん2018/01/20(土) 01:49:30.12ID:Gqu+xipX
>>567
確率変数 和 積 平均 分散 あたりで調べてごらん。

569132人目の素数さん2018/01/20(土) 20:29:51.89ID:bEiI/N73
マルチ失礼します
(分からない問題スレで間違って自分が化学の問題ぶち込んだせいで、回答が得られそうにないので泣)

統計学の問題なのですが、問4(2)のやり方、答えがわかりません。教えてください。

https://i.imgur.com/2tYtqzV.jpg

570132人目の素数さん2018/01/21(日) 02:18:13.47ID:nCiEPs2d
人生はリベンジマッチ
https://youtu.be/BXanBVhXCBY

571132人目の素数さん2018/01/21(日) 23:33:23.70ID:QoayuEoo
回帰係数の表裏の相乗平均が相関係数(符号無視)

572132人目の素数さん2018/02/01(木) 01:05:41.29ID:mDL9j4ny
最近は何が流行ってるのかね。高次元統計ももう随分長く研究されてきてopen problemがどれほどあるんだろうか?

573132人目の素数さん2018/02/02(金) 17:27:00.25ID:ZGDX6yca
とある大学のテストなんですが、どなたか解いてください。
マル付いてたりするけどあんまり気にしなくて大丈夫です
https://i.imgur.com/xOQbdFf.jpg
https://i.imgur.com/dVOZJ2L.jpg
https://i.imgur.com/ftkXVGy.jpg
https://i.imgur.com/bvvW8uy.jpg

574132人目の素数さん2018/02/03(土) 08:23:02.65ID:Khu+UKxP
知恵袋に出しといたら誰かやってくれるよ

575132人目の素数さん2018/02/04(日) 12:50:38.43ID:e/Db4a5+
>>565
(最小×100)以上でいいじゃん

576132人目の素数さん2018/02/06(火) 14:18:09.65ID:x2G+n3vp
1と0の数列が乱数によって並べられたものなのか
意図的に並べられたものなのかを調べる方法を知りたいのです。

1010101010101010101010101010101010101010

上の数列の場合、1と0の出現率はともに20回ずつなので出現率だけを見ると乱数で偶然起こり得ると思いますが
1と0が等間隔にならんでおり偶然この様にならぶ確率は低いと思います。

1011001011001011001011001011001011001011

上の数列の場合、一見不規則に並んでる様で「101100」の繰り返しになってます。
この様な事を調べるにはどうしたら良いのでしょうか?何を勉強したらいいのですか?
乱数検定?恥ずかしながら中学校までの数学の知識しかないのですがだれか助けてください

577132人目の素数さん2018/02/07(水) 13:56:30.72ID:yVTOoFc7
統計学学んでないのに、自店と、近隣の同業店の顧客に対する出口調査を行って
アンケート結果を分析することになったんだけど、
重回帰分析のサイトとかを事前に読んで、以下のデータは用意できた

・それぞれの店の総合評価(1〜5点)

・店内設備に対する満足度
 ・総合評価 ・駐車場 ・カート ・空調 ・レジの数 ・etc...

・スタッフに対する満足度

・品揃えに対する満足度
 ・総合評価 ・肉類 ・魚介系 ・お菓子 ・生活雑貨 ・etc...

----------------------------------

分析の結果としてほしいものは
「顧客は●●を重視している」的なことなんだけど、

総合評価を目的変数、それ以外を説明変数(すべて0or1のダミー変数)として
重回帰分析かけてみたらいいの?
作業はエクセルで行う予定

578132人目の素数さん2018/02/07(水) 18:27:44.82ID:K8x6sUH6
>>576
ウィルコクソンの順位和検定で検索してみ。

579132人目の素数さん2018/02/07(水) 22:22:37.00ID:OsFynxpx
>>578
ありがとうございます。
ググって見たけどその検定をどう使うのかわからなかったです。。。
二群を比較する際に使う検定のようですが1つの数列の判断する時はどう使うんですか?

580132人目の素数さん2018/02/10(土) 16:51:32.51ID:asDI+gHi
おれなら自己相関とかFFTとかで見るかな

581132人目の素数さん2018/02/10(土) 19:14:48.60ID:s7a0skcA
>>579
ヒントの出し方悪かったね。「乱数 検定」とか「ランダム 判断」の方が分かりやすい解説出てくるかも。
ざっくりいうと、理想的な場合(この場合は乱数)の特徴と今問題にしている数列の特徴を比較することで(二群の比較)判定するのが検定の考え方。
二値の場合、期待値と分散が理想乱数と同じになる場合があるので符号和みたいなテクニックが必要になるんだね。

>580
乱数→ホワイトノイズ→フーリエスペクトル一定で判定できそう、って連想するよね。なんかまだ研究中みたいだけど。詳しい人いるかな?

5825762018/02/11(日) 08:07:30.86ID:pJsVwN51
お二方ありがとう。
頂いたヒントを元に調べてみます。

583132人目の素数さん2018/02/11(日) 18:00:58.25ID:XYpvNV0x
>>564
RStudioの何を学びたいの?

新着レスの表示
レスを投稿する