【R言語】統計解析フリーソフトＲ第6章【GNU R】 [無断転載禁止]©2ch.net

**１３２人目の素数さん** · 2017/08/03(木) 19:23:12.67

R は統計計算とグラフィックスのための言語・環境です。
統計計算で重宝するデータ型や、複数要素を処理する演算や関数、
解析結果を表示するグラフィックなど、多彩な機能を提供します。

●関連サイト
The R Project
http://www.r-project.org/
RjpWiki
http://www.okada.jp.org/RWiki/
リンク集
http://www.okada.jp.org/RWiki/?%A5%EA%A5%F3%A5%AF%BD%B8
※前スレ
【R言語】統計解析フリーソフトＲ第５章【GNU R】
http://rio2016.2ch.net/test/read.cgi/math/1380168442/

**１３２人目の素数さん** · 2017/11/24(金) 22:49:54.91

>>276
前にヘルプで見ようと思ったら書いてなかった覚えが…。マニアックな関数だったんで、そんなもんかな～と諦めてた。やっぱ基本はヘルプか。
>>277
argsは見れる関数と見れない関数があるのであんまり役に立たない印象。

￥ ◆2VB8wsVUoo · 2017/11/25(土) 00:22:59.73

￥

￥ ◆2VB8wsVUoo · 2017/11/25(土) 00:23:21.36

￥

￥ ◆2VB8wsVUoo · 2017/11/25(土) 00:23:46.66

￥

￥ ◆2VB8wsVUoo · 2017/11/25(土) 00:24:03.98

￥

￥ ◆2VB8wsVUoo · 2017/11/25(土) 00:24:22.25

￥

￥ ◆2VB8wsVUoo · 2017/11/25(土) 00:24:46.55

￥

￥ ◆2VB8wsVUoo · 2017/11/25(土) 00:25:07.98

￥

￥ ◆2VB8wsVUoo · 2017/11/25(土) 00:25:29.17

￥

￥ ◆2VB8wsVUoo · 2017/11/25(土) 00:25:50.80

￥

￥ ◆2VB8wsVUoo · 2017/11/25(土) 00:26:12.77

￥

**１３２人目の素数さん** · 2017/11/25(土) 01:57:31.82

>>278
>argsは見れる関数と見れない関数があるのであんまり役に立たない
だったら、例が悪いよ。見られない関数の例をあげないと

> ヘルプで見ようと思ったら書いてなかった
こっちだってわざわざ下請け関数のオプションまでは書かないよ。
ヘルプを見て未解決ならソースを見てくれ。

￥ ◆2VB8wsVUoo · 2017/11/25(土) 06:17:05.29

￥

￥ ◆2VB8wsVUoo · 2017/11/25(土) 06:17:23.25

￥

￥ ◆2VB8wsVUoo · 2017/11/25(土) 06:17:39.26

￥

￥ ◆2VB8wsVUoo · 2017/11/25(土) 06:17:55.24

￥

￥ ◆2VB8wsVUoo · 2017/11/25(土) 06:18:11.86

￥

￥ ◆2VB8wsVUoo · 2017/11/25(土) 06:18:28.49

￥

￥ ◆2VB8wsVUoo · 2017/11/25(土) 06:18:44.12

￥

￥ ◆2VB8wsVUoo · 2017/11/25(土) 06:19:01.27

￥

￥ ◆2VB8wsVUoo · 2017/11/25(土) 06:19:19.56

￥

￥ ◆2VB8wsVUoo · 2017/11/25(土) 06:19:36.14

￥

**１３２人目の素数さん** · 2017/11/26(日) 17:41:27.37

rm(list=ls())

で　R　のメモリーをクリア

**１３２人目の素数さん** · 2017/11/28(火) 13:00:14.06

先週長々と質問させていただいたものです。その後、試行錯誤して行った結果十解決しました。

以前は「summary」としか入れていなかったのですが、「dd$summary」と入力したところ
全体のデータが出力されました。それ以後「dd$summary$dir.area」等で出せるようになりました。
大変初期的な場面で躓いておりましたが、現在何とか進んでおります。
色々とお答えくださった方々、とても参考になりました。本当にありがとうございました。

**１３２人目の素数さん** · 2017/12/10(日) 13:11:49.22

N(=100)回コインをなげてｎ(=5回)以上続けて表がでる確率。

seqn<-function(n=5,N=100,p=0.5){
rn=rbinom(N,1,p)
count=0
for(i in 1:N){
if(rn[i] & count<n){
count=count+1
}
else{
if(count==n) {return(TRUE)}
else{
count=0
}
}
}
return(count==n)
}
mean(replicate(10^5,seqn()))

> mean(replicate(10^5,seqn()))
[1] 0.81085

案外、高い確率になった。

**１３２人目の素数さん** · 2017/12/10(日) 22:28:22.98

ポアソンでやるやつだっけ

**１３２人目の素数さん** · 2017/12/11(月) 07:47:07.43

pooledVariance <- function(...) {
args = list(...)
n.args=length(args)
ss2=0
df=0
for(i in 1:n.args){
ss2 = ss2 + var(args[[i]])*(length(args[[i]])-1)
df = df + (length(args[[i]])-1)
}
ss2/df
}

effectsize <- function(y1,y2){
diff=mean(y1)-mean(y2)
var=(var(x1)*(length(x1)-1)+ var(x2)*(length(x2)-1))/(length(c(y1,y2))-2)
sd=sqrt(var)
diff/sd
}

library(effsize)
cohen.d()

**１３２人目の素数さん** · 2017/12/11(月) 07:50:22.91

>>303
単なる二項分布。
コインが５回続けて表がでたら、0.5^5 <0.05なのでイカサマコインといわれちゃいそうなんだが、
１００回やってみると案外、５回表が続くので確率を計算しようと思ったが、解析的にできる頭がないので
シミュレーションしてみた。

**１３２人目の素数さん** · 2017/12/11(月) 07:55:42.42

>302は

> rbinom(100,1,0.5)
[1] 0 1 0 0 1 0 0 0 1 1 1 0 1 0 1 1 0 1 1 0 1 1 0 0 0 1 0 1 1 1 1 0
[33] 0 1 0 0 0 0 0 0 1 0 1 1 0 0 0 1 0 0 1 0 1 1 1 1 1 1 1 1 1 1 1 0
[65] 0 0 1 1 0 0 1 0 1 0 0 0 0 0 0 1 0 0 1 1 1 1 1 0 1 1 0 0 1 1 0 0
[97] 0 0 1 1

で５回以上１が連続するときTRUEを返す関数なのだが
もっと簡単にやれないかなぁとは思っている。

rep(1,5) %in% rbinom(100,1,0.5)は１個ずつ評価されてTRUEが５個返ってくるだけ。

文字列にしてgrepを使うとなんとかなりそうな気がしないでもないのだけど....

**１３２人目の素数さん** · 2017/12/22(金) 17:21:16.51

すまん、教えてほしいだけど
分析するために初めてＲをインストールしようと思って、このスレのあるように公式サイト行ったら、esetが「JS/Redirector.NAV トロイの木馬」を検知したんだが…；
どうしたらいいだ…

**１３２人目の素数さん** · 2017/12/22(金) 20:09:03.17

そっちじゃなくてCRAN行け

**１３２人目の素数さん** · 2017/12/22(金) 20:42:31.02

ホームページダメとかわけわかんねぇ・・・とんでもねぇな
ありがとう

**１３２人目の素数さん** · 2017/12/22(金) 20:50:20.52

>>307
エロサイトにアクセスしてないｗ？

**１３２人目の素数さん** · 2017/12/22(金) 21:27:01.31

>>309
CRANはここ
https://cran.r-project.org

プロジェクトの方はESETの誤検知っぽいんだよな

**１３２人目の素数さん** · 2017/12/23(土) 09:28:44.66

>>310
してねぇよｗｗ
totalvirusで調べると一件引っかかるし、Redirector検知だから、しょうがないね

**１３２人目の素数さん** · 2017/12/24(日) 20:42:51.55

col=rgb(runif(1),runif(1),runif(1),runif(1))で色指定すると

走らせるたびに色がちがっておもしろい。

hist(rnorm(100),col=rgb(runif(1),runif(1),runif(1),runif(1)))

**１３２人目の素数さん** · 2017/12/31(日) 17:23:19.35

stanやJAGSのコードでgamma関数を使おうとして
y = gamma(x)
と、書いたらエラーになった。

stanだと　y=tgamma(x)、JAGSだとy=exp(loggam(x))で動作した。

**１３２人目の素数さん** · 2018/01/02(火) 08:46:50.95

ある大学の入学者男女の比率は１であるという帰無仮説を検定する課題が花子と太郎に課された。

花子は５０人を調査できたら終了として入学者を５０人をみつけて１８人が女子であるという結果を得た。
帰無仮説のもとで
５０人中１８人が女子である確率は 0.01603475
これ以下になるのは５０人中０～１８人と３２～５０人が女子の場合なので
両側検定して
> sum(dbinom(c(0:18,32:50),50,0.5))
[1] 0.06490865
> binom.test(18,50,0.5)$p.value
[1] 0.06490865
で帰無仮説は棄却できないと結論した。
http://i.imgur.com/XDIp9rM.png

一方、本番と十八番が好きな太郎は一人ずつ調べて１８人めの女子がみつかったところで調査を終えることにした。
１８人めがみつかったのは花子と同じく５０人めであった。
帰無仮説のもとで
１８人がみつかるのが５０人めである確率は0.005772512
これ以下になるのは２３人以下５０人以上番めで女子１８人めがみつかった場合なので
両側検定して
pnb=dnbinom(0:999,18,0.5)
> 1 - sum(pnb[-which(pnb<=dnbinom(50-18,18,0.5))]) # < 0.05
[1] 0.02750309
http://i.imgur.com/K3T7utr.png
で帰無仮説は棄却される。

どちらの検定が正しいか、どちらも正しくないか？
検定する意図によってｐ値が変わるのは頻度主義統計の欠陥といえるか？

花子の横軸は裏口入学者数、太郎の横軸はサンプル数なので
サンプルでの裏口入学率を横軸にして９５％信頼区間を示す。
花子の検定での信頼区間は0.36～0.72で18/50を含む、p=0.06491
http://i.imgur.com/SeTLk8K.jpg
太郎の検定での信頼区間は0.375～0.72で18/50を含まない、p= 0.0275
http://i.imgur.com/tNzlfxe.jpg
主観である、検定の中止の基準の差でｐ値や信頼区間が変化するのは変だという批判である。

**１３２人目の素数さん** · 2018/01/03(水) 10:35:48.54

（訂正）
ある大学の入学者男女の比率は１であるという帰無仮説を検定する課題が花子と太郎に課された。

花子は５０人を調査できたら終了として入学者を５０人をみつけて１８人が女子であるという結果を得た。
帰無仮説のもとで
５０人中１８人が女子である確率は 0.01603475
これ以下になるのは５０人中０～１８人と３２～５０人が女子の場合なので
両側検定して
> sum(dbinom(c(0:18,32:50),50,0.5))
[1] 0.06490865
> binom.test(18,50,0.5)$p.value
[1] 0.06490865
で帰無仮説は棄却できないと結論した。
http://i.imgur.com/XDIp9rM.png

一方、十八という数字が好きな太郎は一人ずつ調べて１８人めの女子がみつかったところで調査を終えることにした。
１８人めがみつかったのは花子と同じく５０人めであった。
帰無仮説のもとで
１８人がみつかるのが５０人めである確率は0.005772512
これ以下になるのは２３人以下５０人以上番めで女子１８人めがみつかった場合なので
両側検定して
pnb=dnbinom(0:999,18,0.5)
> 1 - sum(pnb[-which(pnb<=dnbinom(50-18,18,0.5))]) # < 0.05
[1] 0.02750309
http://i.imgur.com/K3T7utr.png
で帰無仮説は棄却される。

どちらの検定が正しいか、どちらも正しくないか？
検定する意図によってｐ値が変わるのは頻度主義統計の欠陥といえるか？

花子の横軸は女子数、太郎の横軸はサンプル数なので
サンプルでの女子の割合を横軸にして９５％信頼区間を示す。
花子の検定での信頼区間は0.36～0.72で18/50を含む、p=0.06491
http://i.imgur.com/SeTLk8K.jpg
太郎の検定での信頼区間は0.375～0.72で18/50を含まない、p= 0.0275
http://i.imgur.com/tNzlfxe.jpg
主観である、検定の中止の基準の差でｐ値や信頼区間が変化するのは変だという批判である。

**１３２人目の素数さん** · 2018/01/15(月) 16:30:41.76

kainokousiki<-function(a,b,c){return (-b+sqrt(b^2-4*a*c))/(2*a)} #解の公式
kainokousiki(1,-5,6)

でrunすると3じゃなくて6を返すんだけど、どこが間違ってる？

**１３２人目の素数さん** · 2018/01/15(月) 16:35:00.20

自己解決
かっこが足りなかった

**１３２人目の素数さん** · 2018/01/19(金) 12:12:23.00

Pythonのスレはないのか

￥ ◆2VB8wsVUoo · 2018/01/21(日) 20:11:34.35

￥

￥ ◆2VB8wsVUoo · 2018/01/21(日) 20:11:56.34

￥

￥ ◆2VB8wsVUoo · 2018/01/21(日) 20:12:22.56

￥

￥ ◆2VB8wsVUoo · 2018/01/21(日) 20:12:47.97

￥

￥ ◆2VB8wsVUoo · 2018/01/21(日) 20:13:05.14

￥

￥ ◆2VB8wsVUoo · 2018/01/21(日) 20:13:34.57

￥

￥ ◆2VB8wsVUoo · 2018/01/21(日) 20:14:02.66

￥

￥ ◆2VB8wsVUoo · 2018/01/21(日) 20:14:16.99

￥

￥ ◆2VB8wsVUoo · 2018/01/21(日) 20:14:35.47

￥

￥ ◆2VB8wsVUoo · 2018/01/21(日) 20:15:07.01

￥

**１３２人目の素数さん** · 2018/02/05(月) 19:08:34.64

機械学習をきっかけにPythonに逆転された感じだね

**１３２人目の素数さん** · 2018/02/06(火) 18:35:39.90

『Rを使った～』だとPythonじゃないのかよって思うよね

**１３２人目の素数さん** · 2018/02/06(火) 21:37:32.10

ずっとRだけでPython触ったこと無いけど、覚え直す価値ある？
環境構築からもう面倒なイメージ

**１３２人目の素数さん** · 2018/02/06(火) 22:43:23.82

Python自体は:と直後のインデントさえ気を付ければかなり簡単
3系は数が全て小数扱いなので楽

Anacondaというパッケージでインストールすれば、今流行りのJupyter Notebookという開発環境で対話的にコーディングできる（Rも使える）

**１３２人目の素数さん** · 2018/02/07(水) 20:40:49.48

アナコンダてのがRぽくできるのね、ありがとう
dplyrやggplot2みたいに素人でも簡単便利だといいんだけど
Pythonはオブジェクト志向ぽいしすぐ諦めそう

**１３２人目の素数さん** · 2018/02/12(月) 16:19:11.21

ブラウザ環境なくなっちゃったの？

**１３２人目の素数さん** · 2018/02/12(月) 17:06:56.33

>>335
誤爆？
何をブラウズする環境が無くなったの？

**１３２人目の素数さん** · 2018/02/13(火) 18:21:54.45

ブラウザでプログラミングする環境

**１３２人目の素数さん** · 2018/02/13(火) 21:09:53.07

>>337
RStudio Serverの話？

**１３２人目の素数さん** · 2018/02/13(火) 22:27:26.57

RStudio Severあるで。Dockerで使うのがいいんじゃないかな？！

**１３２人目の素数さん** · 2018/02/25(日) 18:12:28.68

統計学とウェブ解析を交えて実践的な勉強と練習を
したいのですが、おすすめな書籍やサイトはありますか。
実際に解析ツールや分析ツールを用いて
自分で分析解析してから
解答を見て適切な手順や方法、考察を
解説してくれるものが良いです。

統計学は統計検定2級の知識はありますが
ウェブ解析はテキスト読んだだけです。

**１３２人目の素数さん** · 2018/02/26(月) 12:43:55.13

ウェブ解析とは具体的になんですか

**１３２人目の素数さん** · 2018/02/27(火) 00:54:41.17

R studioは日本語コメント書く度にIMEが無効になったりカーソルがずれたり黒文字の予測変換が黒背景と重なって見えなくなったりと散々だわ

**１３２人目の素数さん** · 2018/02/27(火) 01:06:58.09

Windows環境で使うから

**１３２人目の素数さん** · 2018/02/27(火) 01:16:41.39

会社規定なんでしかたない
UNIX環境使えるのが羨ましい

**１３２人目の素数さん** · 2018/02/27(火) 01:25:59.40

Docker for WindowsでRStudioサーバー動かせば？

**１３２人目の素数さん** · 2018/02/27(火) 12:19:33.31

なぜPythonスレッドがない？

**１３２人目の素数さん** · 2018/02/27(火) 14:05:09.17

板名読める？

**１３２人目の素数さん** · 2018/03/04(日) 20:14:10.91

>>342
IME無効になるのは俺だけじゃなかったと知ってほっとした。

**１３２人目の素数さん** · 2018/03/04(日) 21:28:34.58

ストアアプリも同じ症状でるからRStudio固有の問題でなくWindows環境の不治の病だと思ってる

**１３２人目の素数さん** · 2018/03/26(月) 20:57:59.83

Run any R code you like. There are over three thousand R packages preloaded.

https://rdrr.io/snippets/

**１３２人目の素数さん** · 2018/03/26(月) 21:11:25.16

>>350
日本語あると動作しないが、
グラフを描いてくれるのはうれしい。

http://imagizer.imageshack.com/img923/2879/m59LVv.png

**１３２人目の素数さん** · 2018/04/04(水) 07:52:09.98

Fisher test検定時に
p<2.2e-16
と表示されるんですが、これより小さい値の指数桁数を正確に表記する方法教えて下さい。
例えば5.8e-35となるようにです。

**１３２人目の素数さん** · 2018/04/04(水) 08:05:49.72

返値の中にあるp値を参照しなされ

**１３２人目の素数さん** · 2018/04/04(水) 10:02:52.31

fisher.test関数の返り値はlist型で、その中にp.valueという名前でp値が格納されているから$演算子を使って直接参照するか、broom::tidy関数に返り値を渡してdata.frame形式で出力してやれば見れる

**１３２人目の素数さん** · 2018/04/04(水) 12:43:50.08

>>352
>>354が言う直接的な参照
> fisher.test(matrix(c(1,120,130,2),2))$p.value
[1] 1.691912e-69

**１３２人目の素数さん** · 2018/04/04(水) 13:06:17.36

352です。よく分かりました！
ありがとうございます！

**１３２人目の素数さん** · 2018/04/04(水) 14:44:33.05

>>356
技術的な助言をしたけど、学術的に言えば、
p < 0.01 は全て p < 0.01 として、具体的なp値を考える意味はないと思うよ。
一部の例外的な研究分野を除いて(e.g., 遺伝統計学)。

**１３２人目の素数さん** · 2018/04/04(水) 15:18:50.72

はい、まさにその例外的な分野で使おうとしてます。ありがとうございます。

￥ ◆2VB8wsVUoo · 2018/04/07(土) 06:52:38.98

￥

￥ ◆2VB8wsVUoo · 2018/04/07(土) 06:53:00.80

￥

￥ ◆2VB8wsVUoo · 2018/04/07(土) 06:53:20.77

￥

￥ ◆2VB8wsVUoo · 2018/04/07(土) 06:53:40.58

￥

￥ ◆2VB8wsVUoo · 2018/04/07(土) 06:54:01.92

￥

￥ ◆2VB8wsVUoo · 2018/04/07(土) 06:54:24.32

￥

￥ ◆2VB8wsVUoo · 2018/04/07(土) 06:54:47.76

￥

￥ ◆2VB8wsVUoo · 2018/04/07(土) 06:55:08.41

￥

￥ ◆2VB8wsVUoo · 2018/04/07(土) 06:55:30.46

￥

￥ ◆2VB8wsVUoo · 2018/04/07(土) 06:55:54.53

￥

**１３２人目の素数さん** · 2018/04/07(土) 10:24:54.55

>>357
多重比較だと意味あるかも

**１３２人目の素数さん** · 2018/04/19(木) 21:35:35.54

Rのガンマ関数はいくつでオーバーフローするかやってみた。

> i=1
> while(gamma(i)!=Inf){
+ i=i+1
+ }
Warning message:
In gamma(i) : value out of range in 'gammafn'
> i
[1] 172
> gamma(172)
[1] Inf
Warning message:
value out of range in 'gammafn'
> gamma(171)
[1] 7.257416e+306

**１３２人目の素数さん** · 2018/04/29(日) 00:21:51.67

matplot()で折れ線グラフ描いたときに、X軸をカテゴリで示したいのですが、
可能でしょうか？

例えばtemp <- c("0時間","8時間","24時間","48時間")として、
matplot()の引数にtempをとるやり方です。
他にもやり方あれば教えてください。

**１３２人目の素数さん** · 2018/04/29(日) 01:55:59.75

>>371
matplot(..., xaxt="n")
axis(1, at=seq(along=temp), lab=temp)

**１３２人目の素数さん** · 2018/04/30(月) 16:50:51.65

>>372
遅くなりましたがありがとうございました。
できました！

￥ ◆2VB8wsVUoo · 2018/04/30(月) 23:55:02.74

￥

￥ ◆2VB8wsVUoo · 2018/04/30(月) 23:55:22.50

￥

￥ ◆2VB8wsVUoo · 2018/04/30(月) 23:55:43.19

￥

￥ ◆2VB8wsVUoo · 2018/04/30(月) 23:56:02.89

￥

￥ ◆2VB8wsVUoo · 2018/04/30(月) 23:56:23.17

￥

【R言語】統計解析フリーソフトＲ 第6章【GNU R】 [無断転載禁止]©2ch.net

【R言語】統計解析フリーソフトＲ第6章【GNU R】 [無断転載禁止]©2ch.net