統計学Part17 [無断転載禁止]©2ch.net

**１３２人目の素数さん** · 2016/11/11(金) 02:34:18.63

前スレ

統計学Part16
http://rio2016.2ch.net/test/read.cgi/math/1410263098/

統計学なんでもスレッド14
http://uni.2ch.net/test/read.cgi/math/1326471964/

**１３２人目の素数さん** · 2017/12/24(日) 17:33:16.87

あ

**１３２人目の素数さん** · 2017/12/24(日) 19:45:42.56

教科書を勉強して正規分布やポアソン分布や中心極限定理
推定や検定（点推定区間推定～母平均母分散）
辺りまではやったのですが
次の段階としてどのテキストがお勧めでしょうか？

独学で学んでいるので、どれを学べばいいのかわからなくて困っています

**１３２人目の素数さん** · 2017/12/24(日) 20:49:28.91

>>557
東大教養課程編なんたらの
統計学入門なんたら
統計学入門人文学系なんたら
おなじく自然科学系なんたら
やっとけ
いいかどうか知らんが一応鉄板テキストだ

読み物なら駄目な統計学はよんどけ

時間に余裕があってより上をめざすなら
線形代数
速度論ルベーグ積分
集合論
はやっとけ

**１３２人目の素数さん** · 2017/12/25(月) 18:06:49.35

>>558
ありがとうございます
３冊あるようなので内容を確認の上購入したいと思います
線形代数は学習済みなので測度論ルベーグ積分集合論について学習していきます

**１３２人目の素数さん** · 2017/12/26(火) 13:11:11.22

線形代数でも集合使ってんじゃないの？

**１３２人目の素数さん** · 2018/01/02(火) 15:52:53.13

東洋大の往路優勝はヴェイパーフライ4％の効果である。

これを統計学で証明できますか？
どのようにアプローチするのか勉強したいです。

**１３２人目の素数さん** · 2018/01/05(金) 18:09:17.78

重回帰分析で重決定係数が0.2などと低い場合は、偏回帰係数がいくつでもあまり意味がないのですか？

**１３２人目の素数さん** · 2018/01/07(日) 00:22:03.05

うんあんま意味ないよ。
回帰係数は傾きやからあてはまりとは関係ない。ほかの変数固定して固定しなかった変数を１かえるとどんだけ被説明変数が変動するかの目安でしかない。

**１３２人目の素数さん** · 2018/01/13(土) 12:48:29.00

統計知識はあるR初心者が、R Studioを学ぶのに良い本はありますか？英語でも構いません。

**１３２人目の素数さん** · 2018/01/14(日) 19:37:56.17

ある製品の重さ１００枚を測定して
平均値が100ｇ、最大101.5g、最小98.5ｇだったとします。
この製品は１００枚をワンセットとして包装するため、
１００枚あるかの確認のために秤を使用することにしました。
しかしながら、仮に最大あるいは最小の製品が100枚続くと仮定すると、
１００枚時総重量は製品１枚分の100g以上に違いがでてしまいます。
１００枚がそろっていることを確認するためには、
OKの範囲をいくつに設定すればいいのでしょうか？

**１３２人目の素数さん** · 2018/01/14(日) 23:10:16.26

>>565
正規分布だと仮定すると ±3σ(99.73%)で 1kg ± 19.35g
一枚の重量を確率変数としてその分布を考え、それが100枚集まった新たな確率変数が従う分布を考えればいいんじゃないかな。

**１３２人目の素数さん** · 2018/01/16(火) 23:42:26.22

>>566
>>一枚の重量を確率変数としてその分布を考え、それが100枚集まった新たな確率変数が従う分布を考えれば
まさにそういうことがやりたかったけど具体的にどう計算したらいいかわからなかったです

**１３２人目の素数さん** · 2018/01/20(土) 01:49:30.12

>>567
確率変数和積平均分散あたりで調べてごらん。

**１３２人目の素数さん** · 2018/01/20(土) 20:29:51.89

マルチ失礼します
(分からない問題スレで間違って自分が化学の問題ぶち込んだせいで、回答が得られそうにないので泣)

統計学の問題なのですが、問4(2)のやり方、答えがわかりません。教えてください。

https://i.imgur.com/2tYtqzV.jpg

**１３２人目の素数さん** · 2018/01/21(日) 02:18:13.47

人生はリベンジマッチ
https://youtu.be/BXanBVhXCBY

**１３２人目の素数さん** · 2018/01/21(日) 23:33:23.70

回帰係数の表裏の相乗平均が相関係数(符号無視)

**１３２人目の素数さん** · 2018/02/01(木) 01:05:41.29

最近は何が流行ってるのかね。高次元統計ももう随分長く研究されてきてopen problemがどれほどあるんだろうか？

**１３２人目の素数さん** · 2018/02/02(金) 17:27:00.25

とある大学のテストなんですが、どなたか解いてください。
マル付いてたりするけどあんまり気にしなくて大丈夫です
https://i.imgur.com/xOQbdFf.jpg
https://i.imgur.com/dVOZJ2L.jpg
https://i.imgur.com/ftkXVGy.jpg
https://i.imgur.com/bvvW8uy.jpg

**１３２人目の素数さん** · 2018/02/03(土) 08:23:02.65

知恵袋に出しといたら誰かやってくれるよ

**１３２人目の素数さん** · 2018/02/04(日) 12:50:38.43

>>565
(最小×100)以上でいいじゃん

**１３２人目の素数さん** · 2018/02/06(火) 14:18:09.65

1と0の数列が乱数によって並べられたものなのか
意図的に並べられたものなのかを調べる方法を知りたいのです。

1010101010101010101010101010101010101010

上の数列の場合、1と0の出現率はともに20回ずつなので出現率だけを見ると乱数で偶然起こり得ると思いますが
1と0が等間隔にならんでおり偶然この様にならぶ確率は低いと思います。

1011001011001011001011001011001011001011

上の数列の場合、一見不規則に並んでる様で「101100」の繰り返しになってます。
この様な事を調べるにはどうしたら良いのでしょうか？何を勉強したらいいのですか？
乱数検定？恥ずかしながら中学校までの数学の知識しかないのですがだれか助けてください

**１３２人目の素数さん** · 2018/02/07(水) 13:56:30.72

統計学学んでないのに、自店と、近隣の同業店の顧客に対する出口調査を行って
アンケート結果を分析することになったんだけど、
重回帰分析のサイトとかを事前に読んで、以下のデータは用意できた

・それぞれの店の総合評価(1～5点)

・店内設備に対する満足度
　・総合評価　・駐車場　・カート　・空調　・レジの数　・etc...

・スタッフに対する満足度

・品揃えに対する満足度
　・総合評価　・肉類　・魚介系　・お菓子　・生活雑貨　・etc...

----------------------------------

分析の結果としてほしいものは
「顧客は●●を重視している」的なことなんだけど、

総合評価を目的変数、それ以外を説明変数(すべて0or1のダミー変数)として
重回帰分析かけてみたらいいの？
作業はエクセルで行う予定

**１３２人目の素数さん** · 2018/02/07(水) 18:27:44.82

>>576
ウィルコクソンの順位和検定で検索してみ。

**１３２人目の素数さん** · 2018/02/07(水) 22:22:37.00

>>578
ありがとうございます。
ググって見たけどその検定をどう使うのかわからなかったです。。。
二群を比較する際に使う検定のようですが1つの数列の判断する時はどう使うんですか？

**１３２人目の素数さん** · 2018/02/10(土) 16:51:32.51

おれなら自己相関とかFFTとかで見るかな

**１３２人目の素数さん** · 2018/02/10(土) 19:14:48.60

>>579
ヒントの出し方悪かったね。「乱数検定」とか「ランダム判断」の方が分かりやすい解説出てくるかも。
ざっくりいうと、理想的な場合（この場合は乱数）の特徴と今問題にしている数列の特徴を比較することで（二群の比較）判定するのが検定の考え方。
二値の場合、期待値と分散が理想乱数と同じになる場合があるので符号和みたいなテクニックが必要になるんだね。

>580
乱数→ホワイトノイズ→フーリエスペクトル一定で判定できそう、って連想するよね。なんかまだ研究中みたいだけど。詳しい人いるかな？

**576** · 2018/02/11(日) 08:07:30.86

お二方ありがとう。
頂いたヒントを元に調べてみます。

**１３２人目の素数さん** · 2018/02/11(日) 18:00:58.25

>>564
RStudioの何を学びたいの？

**１３２人目の素数さん** · 2018/02/25(日) 17:53:25.97

統計学とウェブ解析を交えて実践的な勉強と練習を
したいのですが、おすすめな書籍やサイトはありますか。
実際に解析ツールや分析ツールを用いて
自分で分析解析してから
解答を見て適切な手順や方法、考察を
解説してくれるものが良いです。

統計学は統計検定2級の知識はありますが
ウェブ解析はテキスト読んだだけです。

**１３２人目の素数さん** · 2018/02/28(水) 06:57:35.95

偏差を標準偏差で割った値はなんといいますか？参考書等にも明確には定義されていないようです。

**１３２人目の素数さん** · 2018/02/28(水) 09:10:13.21

zスコアとか？

**１３２人目の素数さん** · 2018/02/28(水) 17:37:59.68

Z値

**１３２人目の素数さん** · 2018/03/02(金) 11:01:57.06

文科省の次期学習指導要領（まだ案の段階）では
高校生に統計を必修にするために空間座標やベクトルを
数Cに追い出したんだが

統計ってベクトルを追い出してまで
高校生のうちから勉強する必要があるのかな

**588** · 2018/03/02(金) 11:32:38.93

別にスレを建てた方がよいかな。
教育系の板でなく数学板で書いてるのは
お受験のためではなく
将来の日本の科学技術の基礎力という観点から
議論したい為。

**１３２人目の素数さん** · 2018/03/02(金) 13:39:53.06

少なくとも文系とる人のが多いんですからそういう人にとっては有益でしょうね

**１３２人目の素数さん** · 2018/03/02(金) 14:21:56.28

高卒者と文学部（心理学以外）・法学部に進学する人は全く触れる機会がなかっただろうから

**１３２人目の素数さん** · 2018/03/02(金) 15:56:16.74

つまり文系に必要だから、理系の必須事項はどんどん高3に回してゆこう
ということか。

残念ながら理系の高3の多くは
・高1〜2で学んだ事を入試問題が解けるレベルまで引き上げること
・新たに数IIIの微積分を学習し、更に入試問題が解けるレベルまで引き上げること
で手一杯で、微積分以外で新たに学ぶ項目はとても定着が悪い。

例えば複素平面は今数IIIだが、数Bにあった頃に比べて、とても出来が悪い。

なので「理系だけがやればいい」とか言ってベクトルや空間座標を
3年に回してしまうと、理系の学生は大学に入ってからの線形代数に
ついて行けなくなる危険がある。

一方、大学の理系の統計では、線形代数の知識も要求される。
教える順序が間違っていると思うなあ。

**１３２人目の素数さん** · 2018/03/02(金) 15:59:21.26

あと、文系であっても経済学部だと線形代数は要求される。
2〜3次元の幾何ベクトルがシッカリ身に付いていないと
n次元の線形代数の理解はとても貧弱になると思うがどうだろうか。

それよりも高校生の段階で統計を学んでおく事の方が重要なんだろうか。

**１３２人目の素数さん** · 2018/03/02(金) 16:01:56.89

やっぱり別スレの方が良さそうだが
その前に統計スレで煽っておこうw

**１３２人目の素数さん** · 2018/03/02(金) 16:23:35.82

統計学の端緒に触れるのに果たして幾何ベクトルの理解が必要なのかね
単なる数の並びで十分な気がする
しかも高校の学習内容に理論的な完全さは端から求められていないだろうし

**１３２人目の素数さん** · 2018/03/02(金) 16:34:53.40

理系以外の教養の底上げが狙いだとすると、日本の科学技術の基礎力という観点だけでは是非を問えないね
統計学は科学技術の担い手だけのものではないので

**１３２人目の素数さん** · 2018/03/02(金) 16:41:46.06

数学の項目を削って統計を入れるという発想がおかしい

**１３２人目の素数さん** · 2018/03/02(金) 16:43:52.82

>>595
> 統計学の端緒に触れるのに果たして幾何ベクトルの理解が必要なのかね

そのような主張はしていませんが？

**１３２人目の素数さん** · 2018/03/02(金) 16:47:59.08

科学技術の基礎力という観点だけでは是非を問えないと言ったろ
まず議論の出発点を見直さなきゃ

**１３２人目の素数さん** · 2018/03/02(金) 17:01:04.15

理系はどうせ数IIIやるんだから問題なくないですか？

**１３２人目の素数さん** · 2018/03/02(金) 17:14:01.95

このへんなんだろう（適当）

生徒が数学が社会に出ていないと感じていること
企業からの要望
応用重視へ

**１３２人目の素数さん** · 2018/03/02(金) 17:14:23.05

そうですね。統計は科学技術以外でも重要です。しかし
その普及のために科学技術者の養成を疎かにして良いこと
にはなりません。

文系の大学で統計を必須にしたって良いわけです。
ただでさえ理系と文系では大学で要求される時間数が
全然違うのだから、文系に統計が入ったくらいで
理系よりも時間数が多くなることはないでしょう。

あるいは高３の文系で統計を必須にするという選択肢もある。
あるいは高校で文理に分かれる時期を今よりも早めるとか、
学年に縛られず統計は2年で3年でも取れるようにするとか、
理系を犠牲にせずに文系に統計を教える方法はいくらでもある。

**１３２人目の素数さん** · 2018/03/02(金) 17:21:14.37

文部官僚は指導要領をいじってみたいのよ

**１３２人目の素数さん** · 2018/03/02(金) 17:33:31.85

本当に問題だと思うならこんなとこに書き込んでないで行動を起こしたら

**１３２人目の素数さん** · 2018/03/02(金) 22:47:00.74

まあパブリックコメントは書くつもりだよ。

**１３２人目の素数さん** · 2018/03/02(金) 23:13:12.04

パブコメ募集してんの？

**１３２人目の素数さん** · 2018/03/03(土) 13:34:57.51

自分で勉強すりゃ良い事だ

**１３２人目の素数さん** · 2018/03/03(土) 13:41:57.35

>>606
募集中、締め切りは確定申告と同じ3/15

パブリックコメント
http://search.e-gov.go.jp/servlet/Public?CLASSNAME=PCMMSTDETAIL&;id=185000958

**１３２人目の素数さん** · 2018/03/05(月) 14:12:34.81

高校数学での統計学必修化は間違っている
http://webronza.asahi.com/science/articles/2018022700003.html?iref=wrp_top_theme1

**１３２人目の素数さん** · 2018/03/06(火) 19:35:06.78

いきなり正規分布を三次元プロットする入門書が悪い

**１３２人目の素数さん** · 2018/03/24(土) 14:59:47.12

統計学必修化するなら統計詐欺の代表的手法も紹介しとかないとマズイ
生兵法が一番危険だからね
ますます数学からかけ離れちゃうけど

**１３２人目の素数さん** · 2018/03/24(土) 15:15:18.49

是非はともかくとして、大学ではなく高校で学習することには大いに意味があると思うよ
大学受験に必要となれば皆が真面目に勉強する
受験生の真面目さと大学生の不真面目さを対照すれば、これがどれほど重大な差かわかると思う

**１３２人目の素数さん** · 2018/03/29(木) 14:05:06.36

ベクトルは数学のあらゆる分野の土台となる。
統計学も進んだ理論にはベクトルの理解は不可欠。

逆に統計学は数学の各分野の土台となるだろうか。

だから

ベクトルを犠牲にしてでも統計をやらねば！！！！！！！

**fig** · 2018/04/04(水) 19:29:27.67

株価でも為替でもいいのですが、値動きのチャートが
ブラウン運動（ランダム）に沿っているのかどうかを
判定することは可能ですか？

**１３２人目の素数さん** · 2018/04/05(木) 01:12:02.82

いいえ、ブラウン運動には従っていません

**fig** · 2018/04/05(木) 02:28:09.08

それをT検定したいのですが。難しいですかね。

**fig** · 2018/04/05(木) 02:37:00.97

>>576 ～>>581あたりがヒントになりそうだね。ありがとう。

￥ ◆2VB8wsVUoo · 2018/04/07(土) 11:32:11.56

￥

￥ ◆2VB8wsVUoo · 2018/04/07(土) 11:32:31.82

￥

￥ ◆2VB8wsVUoo · 2018/04/07(土) 11:32:52.31

￥

￥ ◆2VB8wsVUoo · 2018/04/07(土) 11:33:11.36

￥

￥ ◆2VB8wsVUoo · 2018/04/07(土) 11:33:32.71

￥

￥ ◆2VB8wsVUoo · 2018/04/07(土) 11:33:55.94

￥

￥ ◆2VB8wsVUoo · 2018/04/07(土) 11:34:18.46

￥

￥ ◆2VB8wsVUoo · 2018/04/07(土) 11:34:43.80

￥

￥ ◆2VB8wsVUoo · 2018/04/07(土) 11:35:04.81

￥

￥ ◆2VB8wsVUoo · 2018/04/07(土) 11:35:39.61

￥

**１３２人目の素数さん** · 2018/04/13(金) 19:25:25.97

ここの住人は標本数と標本の大きさの誤用についてどう思っているのか聞きたい。

**１３２人目の素数さん** · 2018/04/13(金) 21:59:46.38

>>628
言葉遊びだと思うけど、
こだわる椰子がいるから俺はサンプルサイズと言ってる。

2018/04/24(火) 18:28:27.51

統計三世ぐらいかな？

**１３２人目の素数さん** · 2018/04/26(木) 16:28:34.37

>>629
英語じゃないと駄目な言葉多いな

**１３２人目の素数さん** · 2018/04/26(木) 18:20:10.78

英語で混同してるなら元々の用語に問題があるんだよ。
単位系が定義変更してるのだから用語変更もすべき

￥ ◆2VB8wsVUoo · 2018/04/27(金) 01:08:09.69

￥

￥ ◆2VB8wsVUoo · 2018/04/27(金) 01:08:28.01

￥

￥ ◆2VB8wsVUoo · 2018/04/27(金) 01:08:46.88

￥

￥ ◆2VB8wsVUoo · 2018/04/27(金) 01:09:07.26

￥

￥ ◆2VB8wsVUoo · 2018/04/27(金) 01:09:30.10

￥

￥ ◆2VB8wsVUoo · 2018/04/27(金) 01:09:48.02

￥

￥ ◆2VB8wsVUoo · 2018/04/27(金) 01:10:04.34

￥

￥ ◆2VB8wsVUoo · 2018/04/27(金) 01:10:25.34

￥

￥ ◆2VB8wsVUoo · 2018/04/27(金) 01:10:47.20

￥

￥ ◆2VB8wsVUoo · 2018/04/27(金) 01:11:07.88

￥

**１３２人目の素数さん** · 2018/05/30(水) 13:02:27.74

Excelのマクロで統計関係の自作関数作って公開している人知っている？
わざわざRに取り込んだりするのめんどい

**１３２人目の素数さん** · 2018/05/30(水) 15:46:15.18

EXCELは結果怪しいことが結構ある

**１３２人目の素数さん** · 2018/05/30(水) 22:59:00.46

エクセルのソルバーは信用してないな。

**643** · 2018/05/30(水) 23:16:31.14

うん、分析ツールは良くないっていう話はよく聞くよね。

俺の妄想は、Excelシート上のA列にN数、B列に陽性数が入っているとして
C列に

=confint(A1,B1,0.95,"wald")

みたいにすると、簡単に信頼区間が得られるようなユーザ定義関数。

あ、RExcelがあるか

**１３２人目の素数さん** · 2018/05/31(木) 00:11:02.18

RExcelってまだあんの？

**１３２人目の素数さん** · 2018/05/31(木) 10:56:29.42

>>646
Rの方が面倒くさくないよ。
パッケージbinomを使えば

A=c(1,2,3)
N=c(5,6,7)
for(i in 1:length(A))
print(binom::binom.confint(A[i],N[i],conf=0.95))
で一気に様々な信頼区間が表示される。

http://imagizer.imageshack.com/img921/964/oNNsrh.jpg

**643** · 2018/05/31(木) 19:48:49.58

>>648
便利そうなパッケージ、教えてくれてありがとう。
俺の説明不足だったんだけど、
そのRのコンソールに出力されたテキストを結局また元のExcelへコピペして、
「区切り位置」とかでパースしたりいろいろして表の体裁に仕上げる、
という作業に、何となく徒労感があるんだ。

ちなみにExcelに戻すのは、色つけろ枠つけろみたいな要求に
R で対応するスキルが足りないから。
knit とか覚えればいいのかな。

>>647
http://sunsite.univie.ac.at/rcom/
開発は続いているよう。

**１３２人目の素数さん** · 2018/05/31(木) 20:18:19.79

>>649
情報ありがとう。

以前、インストールでめちゃくちゃ苦労して、パソコン変わった際にはインストールする気が起きなかった記憶がある。それ以来、ご無沙汰してるわ

**643** · 2018/06/01(金) 07:34:41.66

それな。
俺も昔苦労して最終的に入るには入ったんだけど、
Excelが全体的に重くなってしまうのがストレスで、あまりいい思い出がない。
今のPCはメモリたくさん積んでるから当時よりはましかもしれない。

統計学らしくない話を振ってしまってすまなかった。名無しに戻ります。

**１３２人目の素数さん** · 2018/06/01(金) 09:36:03.25

https://ab-abo.com/drama-video-girl

**１３２人目の素数さん** · 2018/06/20(水) 19:27:08.42

既存の評価指標Aが0～10までしか計測できないところを
0～50まで図れる新規の評価指標Bを作りました。

信頼性と妥当性を検証したいんですけど、
信頼性は級内相関でいいとして、妥当性はどう検証すればいいでしょう？
BはAを内包している関係なので、相関係数が高くて収束的妥当性があってもよくないし
低くて弁別性があってもよくないと思うんです。

BがAを内包していますみたいなことを検証する統計ってあるんですか？

**１３２人目の素数さん** · 2018/06/21(木) 13:56:27.00

>>628
今読んでる本(国立大の統計学の教授が翻訳)には
サンプルサイズのことを標本数と表現してあったので調べたが
読者等の混乱を避けるためにサンプルサイズ(標本の大きさ)と標本数は使い分けたほうがいいということらしい。

実際いま本読ん出る時に、どっちのことか混乱することがあるので
読者がいるようなものは使い分けたほうがいいとおもうわ。

**１３２人目の素数さん** · 2018/06/22(金) 03:49:34.67

>>653
階層クラスター分析?

**１３２人目の素数さん** · 2018/08/26(日) 14:42:57.20

>>646
>うん、分析ツールは良くないっていう話はよく聞く・・・・・・・・・・・・
良くないというのは、Excelのどのバージョンのどのサブメニューのことなのか？
良くないというのは、分析結果の精度が粗い？分析結果が間違っている？

それとも、うん、>>646と>>645を受けたレスということは、分析ツールとは別メニューの
Excelのソルバー>>645が、良くないという趣旨なのか？
ソルバーが良くないというのは、他の統計ツールと分析結果が相異するからなの？