統計学Part17 [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
教科書を勉強して正規分布やポアソン分布や中心極限定理
推定や検定(点推定区間推定〜母平均母分散)
辺りまではやったのですが
次の段階としてどのテキストがお勧めでしょうか?
独学で学んでいるので、どれを学べばいいのかわからなくて困っています >>557
東大教養課程編なんたらの
統計学入門なんたら
統計学入門人文学系なんたら
おなじく自然科学系なんたら
やっとけ
いいかどうか知らんが一応鉄板テキストだ
読み物なら駄目な統計学はよんどけ
時間に余裕があってより上をめざすなら
線形代数
速度論ルベーグ積分
集合論
はやっとけ >>558
ありがとうございます
3冊あるようなので内容を確認の上購入したいと思います
線形代数は学習済みなので測度論ルベーグ積分集合論について学習していきます 東洋大の往路優勝はヴェイパーフライ4%の効果である。
これを統計学で証明できますか?
どのようにアプローチするのか勉強したいです。 重回帰分析で重決定係数が0.2などと低い場合は、偏回帰係数がいくつでもあまり意味がないのですか? うんあんま意味ないよ。
回帰係数は傾きやからあてはまりとは関係ない。ほかの変数固定して固定しなかった変数を1かえるとどんだけ被説明変数が変動するかの目安でしかない。 統計知識はあるR初心者が、R Studioを学ぶのに良い本はありますか?英語でも構いません。 ある製品の重さ100枚を測定して
平均値が100g、最大101.5g、最小98.5gだったとします。
この製品は100枚をワンセットとして包装するため、
100枚あるかの確認のために秤を使用することにしました。
しかしながら、仮に最大あるいは最小の製品が100枚続くと仮定すると、
100枚時総重量は製品1枚分の100g以上に違いがでてしまいます。
100枚がそろっていることを確認するためには、
OKの範囲をいくつに設定すればいいのでしょうか? >>565
正規分布だと仮定すると ±3σ(99.73%)で 1kg ± 19.35g
一枚の重量を確率変数としてその分布を考え、それが100枚集まった新たな確率変数が従う分布を考えればいいんじゃないかな。 >>566
>>一枚の重量を確率変数としてその分布を考え、それが100枚集まった新たな確率変数が従う分布を考えれば
まさにそういうことがやりたかったけど具体的にどう計算したらいいかわからなかったです >>567
確率変数 和 積 平均 分散 あたりで調べてごらん。 マルチ失礼します
(分からない問題スレで間違って自分が化学の問題ぶち込んだせいで、回答が得られそうにないので泣)
統計学の問題なのですが、問4(2)のやり方、答えがわかりません。教えてください。
https://i.imgur.com/2tYtqzV.jpg 最近は何が流行ってるのかね。高次元統計ももう随分長く研究されてきてopen problemがどれほどあるんだろうか? 1と0の数列が乱数によって並べられたものなのか
意図的に並べられたものなのかを調べる方法を知りたいのです。
1010101010101010101010101010101010101010
上の数列の場合、1と0の出現率はともに20回ずつなので出現率だけを見ると乱数で偶然起こり得ると思いますが
1と0が等間隔にならんでおり偶然この様にならぶ確率は低いと思います。
1011001011001011001011001011001011001011
上の数列の場合、一見不規則に並んでる様で「101100」の繰り返しになってます。
この様な事を調べるにはどうしたら良いのでしょうか?何を勉強したらいいのですか?
乱数検定?恥ずかしながら中学校までの数学の知識しかないのですがだれか助けてください 統計学学んでないのに、自店と、近隣の同業店の顧客に対する出口調査を行って
アンケート結果を分析することになったんだけど、
重回帰分析のサイトとかを事前に読んで、以下のデータは用意できた
・それぞれの店の総合評価(1〜5点)
・店内設備に対する満足度
・総合評価 ・駐車場 ・カート ・空調 ・レジの数 ・etc...
・スタッフに対する満足度
・品揃えに対する満足度
・総合評価 ・肉類 ・魚介系 ・お菓子 ・生活雑貨 ・etc...
----------------------------------
分析の結果としてほしいものは
「顧客は●●を重視している」的なことなんだけど、
総合評価を目的変数、それ以外を説明変数(すべて0or1のダミー変数)として
重回帰分析かけてみたらいいの?
作業はエクセルで行う予定 >>576
ウィルコクソンの順位和検定で検索してみ。 >>578
ありがとうございます。
ググって見たけどその検定をどう使うのかわからなかったです。。。
二群を比較する際に使う検定のようですが1つの数列の判断する時はどう使うんですか? >>579
ヒントの出し方悪かったね。「乱数 検定」とか「ランダム 判断」の方が分かりやすい解説出てくるかも。
ざっくりいうと、理想的な場合(この場合は乱数)の特徴と今問題にしている数列の特徴を比較することで(二群の比較)判定するのが検定の考え方。
二値の場合、期待値と分散が理想乱数と同じになる場合があるので符号和みたいなテクニックが必要になるんだね。
>580
乱数→ホワイトノイズ→フーリエスペクトル一定で判定できそう、って連想するよね。なんかまだ研究中みたいだけど。詳しい人いるかな? お二方ありがとう。
頂いたヒントを元に調べてみます。 統計学とウェブ解析を交えて実践的な勉強と練習を
したいのですが、おすすめな書籍やサイトはありますか。
実際に解析ツールや分析ツールを用いて
自分で分析解析してから
解答を見て適切な手順や方法、考察を
解説してくれるものが良いです。
統計学は統計検定2級の知識はありますが
ウェブ解析はテキスト読んだだけです。 偏差を標準偏差で割った値はなんといいますか?参考書等にも明確には定義されていないようです。 文科省の次期学習指導要領(まだ案の段階)では
高校生に統計を必修にするために空間座標やベクトルを
数Cに追い出したんだが
統計ってベクトルを追い出してまで
高校生のうちから勉強する必要があるのかな 別にスレを建てた方がよいかな。
教育系の板でなく数学板で書いてるのは
お受験のためではなく
将来の日本の科学技術の基礎力という観点から
議論したい為。 少なくとも文系とる人のが多いんですからそういう人にとっては有益でしょうね 高卒者と文学部(心理学以外)・法学部に進学する人は全く触れる機会がなかっただろうから つまり文系に必要だから、理系の必須事項はどんどん高3に回してゆこう
ということか。
残念ながら理系の高3の多くは
・高1〜2で学んだ事を入試問題が解けるレベルまで引き上げること
・新たに数IIIの微積分を学習し、更に入試問題が解けるレベルまで引き上げること
で手一杯で、微積分以外で新たに学ぶ項目はとても定着が悪い。
例えば複素平面は今数IIIだが、数Bにあった頃に比べて、とても出来が悪い。
なので「理系だけがやればいい」とか言ってベクトルや空間座標を
3年に回してしまうと、理系の学生は大学に入ってからの線形代数に
ついて行けなくなる危険がある。
一方、大学の理系の統計では、線形代数の知識も要求される。
教える順序が間違っていると思うなあ。 あと、文系であっても経済学部だと線形代数は要求される。
2〜3次元の幾何ベクトルがシッカリ身に付いていないと
n次元の線形代数の理解はとても貧弱になると思うがどうだろうか。
それよりも高校生の段階で統計を学んでおく事の方が重要なんだろうか。 やっぱり別スレの方が良さそうだが
その前に統計スレで煽っておこうw 統計学の端緒に触れるのに果たして幾何ベクトルの理解が必要なのかね
単なる数の並びで十分な気がする
しかも高校の学習内容に理論的な完全さは端から求められていないだろうし 理系以外の教養の底上げが狙いだとすると、日本の科学技術の基礎力という観点だけでは是非を問えないね
統計学は科学技術の担い手だけのものではないので 数学の項目を削って統計を入れるという発想がおかしい >>595
> 統計学の端緒に触れるのに果たして幾何ベクトルの理解が必要なのかね
そのような主張はしていませんが? 科学技術の基礎力という観点だけでは是非を問えないと言ったろ
まず議論の出発点を見直さなきゃ 理系はどうせ数IIIやるんだから問題なくないですか? このへんなんだろう(適当)
生徒が数学が社会に出ていないと感じていること
企業からの要望
応用重視へ そうですね。統計は科学技術以外でも重要です。しかし
その普及のために科学技術者の養成を疎かにして良いこと
にはなりません。
文系の大学で統計を必須にしたって良いわけです。
ただでさえ理系と文系では大学で要求される時間数が
全然違うのだから、文系に統計が入ったくらいで
理系よりも時間数が多くなることはないでしょう。
あるいは高3の文系で統計を必須にするという選択肢もある。
あるいは高校で文理に分かれる時期を今よりも早めるとか、
学年に縛られず統計は2年で3年でも取れるようにするとか、
理系を犠牲にせずに文系に統計を教える方法はいくらでもある。 本当に問題だと思うならこんなとこに書き込んでないで行動を起こしたら 統計学必修化するなら統計詐欺の代表的手法も紹介しとかないとマズイ
生兵法が一番危険だからね
ますます数学からかけ離れちゃうけど 是非はともかくとして、大学ではなく高校で学習することには大いに意味があると思うよ
大学受験に必要となれば皆が真面目に勉強する
受験生の真面目さと大学生の不真面目さを対照すれば、これがどれほど重大な差かわかると思う ベクトルは数学のあらゆる分野の土台となる。
統計学も進んだ理論にはベクトルの理解は不可欠。
逆に統計学は数学の各分野の土台となるだろうか。
だから
ベクトルを犠牲にしてでも統計をやらねば!!!!!!! 株価でも為替でもいいのですが、値動きのチャートが
ブラウン運動(ランダム)に沿っているのかどうかを
判定することは可能ですか? >>576 〜>>581あたりがヒントになりそうだね。ありがとう。 ここの住人は標本数と標本の大きさの誤用についてどう思っているのか聞きたい。 >>628
言葉遊びだと思うけど、
こだわる椰子がいるから俺はサンプルサイズと言ってる。 英語で混同してるなら元々の用語に問題があるんだよ。
単位系が定義変更してるのだから用語変更もすべき Excelのマクロで統計関係の自作関数作って公開している人知っている?
わざわざRに取り込んだりするのめんどい うん、分析ツールは良くないっていう話はよく聞くよね。
俺の妄想は、Excelシート上のA列にN数、B列に陽性数が入っているとして
C列に
=confint(A1,B1,0.95,"wald")
みたいにすると、簡単に信頼区間が得られるようなユーザ定義関数。
あ、RExcelがあるか >>646
Rの方が面倒くさくないよ。
パッケージbinomを使えば
A=c(1,2,3)
N=c(5,6,7)
for(i in 1:length(A))
print(binom::binom.confint(A[i],N[i],conf=0.95))
で一気に様々な信頼区間が表示される。
http://imagizer.imageshack.com/img921/964/oNNsrh.jpg >>648
便利そうなパッケージ、教えてくれてありがとう。
俺の説明不足だったんだけど、
そのRのコンソールに出力されたテキストを結局また元のExcelへコピペして、
「区切り位置」とかでパースしたりいろいろして表の体裁に仕上げる、
という作業に、何となく徒労感があるんだ。
ちなみにExcelに戻すのは、色つけろ枠つけろみたいな要求に
R で対応するスキルが足りないから。
knit とか覚えればいいのかな。
>>647
http://sunsite.univie.ac.at/rcom/
開発は続いているよう。 >>649
情報ありがとう。
以前、インストールでめちゃくちゃ苦労して、パソコン変わった際にはインストールする気が起きなかった記憶がある。それ以来、ご無沙汰してるわ それな。
俺も昔苦労して最終的に入るには入ったんだけど、
Excelが全体的に重くなってしまうのがストレスで、あまりいい思い出がない。
今のPCはメモリたくさん積んでるから当時よりはましかもしれない。
統計学らしくない話を振ってしまってすまなかった。名無しに戻ります。 既存の評価指標Aが0〜10までしか計測できないところを
0〜50まで図れる新規の評価指標Bを作りました。
信頼性と妥当性を検証したいんですけど、
信頼性は級内相関でいいとして、妥当性はどう検証すればいいでしょう?
BはAを内包している関係なので、相関係数が高くて収束的妥当性があってもよくないし
低くて弁別性があってもよくないと思うんです。
BがAを内包していますみたいなことを検証する統計ってあるんですか? >>628
今読んでる本(国立大の統計学の教授が翻訳)には
サンプルサイズのことを標本数と表現してあったので調べたが
読者等の混乱を避けるためにサンプルサイズ(標本の大きさ)と標本数は使い分けたほうがいいということらしい。
実際いま本読ん出る時に、どっちのことか混乱することがあるので
読者がいるようなものは使い分けたほうがいいとおもうわ。 >>646
>うん、分析ツールは良くないっていう話はよく聞く・・・・・・・・・・・・
良くないというのは、Excelのどのバージョンのどのサブメニューのことなのか?
良くないというのは、分析結果の精度が粗い?分析結果が間違っている?
それとも、うん、>>646と>>645を受けたレスということは、分析ツールとは別メニューの
Excelのソルバー>>645が、良くないという趣旨なのか?
ソルバーが良くないというのは、他の統計ツールと分析結果が相異するからなの? ■ このスレッドは過去ログ倉庫に格納されています