2012-06-01から1ヶ月間の記事一覧
一般的な電卓の計算精度というか扱える数値の最大値は我々が思っているよりは小さい。一般的には 1e100 程度だ。 コンピュータはそれよりは大きいものの限度はある。.Machine によれば, > .Machine :$double.xmax[1] 1.797693e+308ということなので,例え…
「DNA鑑定とバースデイ・パラドクス」にて・対数を使うにしても、Rでやるにもn!;n=10^9とかになってくると、メモリの問題が出てくるようだ・そんなのを少し回避しながら計算してみたメモリと計算時間は互いにトレードオフの関係にある。計算時間は掛かる(べ…
「DNA鑑定とバースデイ・パラドクス」にてns を 10^(seq(from=0,to=8,by=0.1)) に対して確率を求めているが,各 ns[i] について,毎回 1 からns[i] まで重複して計算をしている始めることになっている。無駄だ。何を計算しているのか,よく考えよう。> syste…
「簡易ROC」について もろもろ。プログラムの書き方自体も相変わらずだけど(ひょっとして,Hatena では,ちゃんと書いたプログラムでも,空白がはがされてこんなになるのだろうかと??)。my.roc2 のように書く方がよいだろうということで。 my.roc<-functio…
フィボナッチ数の「一般項を求める式を用いた解法」において 当然のことではあるが,フィボナッチ数は整数のはず。示されたプログラムは,numeric(double) を使っているのだから,限界がある。しかるに,限界についてなんの言及もないのは困ったものだ。 フ…
「Rの手作りプログラム」中の「標本分散,標本共分散」について#標本分散sample.variance<-function(a) var(a)*(length(a)-1)/length(a) #以下でも同じ。 #sample2.variance<-function(x) mean(x^2)-(mean(x))^2 #標本共分散sample.covariance<-function(x,y…
「Rの手作りプログラム」の中の「異常値の数」「標準偏差の±k 倍を超えた標本数」とわざわざ注記しているのに,提示されたプログラムは,その要件を満たしていない。#異常値の数(標準偏差の±k 倍を超えた標本数)abnormal.number <- function(x, k) { z <- …
計算誤差については人一倍気を遣っていたつもりなのだけど,別の問題をチェックしていてキモを冷やした。 以下を見て,何とも思わない人は幸せな人なんだろうか。 > c(sin=sin(pi), cos=cos(pi), tan=tan(pi)) sin cos tan 1.224647e-16 -1.000000e+00 -1.22…
「2012-06-12 ベクトルの要素にベクトル」で不思議がっているが?? 「R では,ベクトルの添え字はベクトルで与えることができる。また,同じ要素を何回も重複して取り出すこともできるし,重複を許すからもとの要素数より多くの要素数を取り出すこともできる…
「2012-06-12 RのLevy過程シミュレーション関数」で プログラムというのは,規則性のある繰り返しをうまく書くべきものなのだから... library(adehabitat)# help(simm.levy)system.time({set.seed(411)w <- simm.levy(1:500, mu = 1.5, burst = "mu = 1.5")u …
「R で計量ミクロ」にあるんだけど,よくまあ,こんなに複雑な式を入力したものだと思う。よく出てくる部分式をまとめて置き換えると,実に簡単な式になることがわかった。1/2 乗しているけど,そんなもの必要ない。だって,中身が2乗なのだから。2乗したも…
Rで計量ミクロ> ダミー変数の作成> Rでは説明変数に因子が含まれている場合、因子を自動でダミー変数に変換してくれるのでパッケージを利用するだけであればそのままでもかまいません。しかし、計量をSTATAやEviewsといった裏で何を計算しているのかわからな…
「前の記事」で指摘したことについて,その正しさを検証しておこう。 簡単なことだ。一行でできる。 > mean(replicate(1000000, sum(runif(100) < 0.1518244) >= 10))[1] 0.950551 解説しておこうか? runif(100) < 0.1518244 は,100 回試行して,設定した…
ガチャコンプ問題で,SNSゲームの実体というか問題点が白日の下にさらされて,それに,しぶしぶ?対応したのかとは思うが,その背景が,こんないい加減な,間違った意思決定によるものだとしたら,腹が立つ以前に笑っちゃうね。(今回は,消費者には不利でな…
どこかにあるけど,そこは別に最適化をしようといっているのではないので,明示しない。 for は遅い。replicate も for と同じくらい。やはり,colMeans は速い。という,つまらない結果だけど,掲示しておく。 > library(rbenchmark)> n <- 100000> x <- c(…
「Rあんなときこんなとき(tokyo r#12)」にて 問題 答え がっかりだなあ。少なくとも,ファイル名の文字ベクトルを作るときに,列挙はないだろう。実際の場合に,ファイル名に何の規則性もないなんてことはないだろう(もし何の規則性もないならそちらの方が…
「統計学とRのはなし」にて リンク切れスライド38で,普通に起こること95%を中央に設定したのが間違いの元。左側のみが5%になる-λを設定しないといけない。プログラムで言えば,qnorm(0.025) ではなくて qnorm(0.05) とすべし。また,r <- sample(1:100, 1) …
同じく「5/30 MIKUセミナー」について result <- lapply(mapply(rep, 0, seqs), unique) 何をやろうとしているか,上のプログラムを見るだけでわかるだろうか?私にはわからなかった。result <- vector("list", seqs) のようだ。temp_res <- rep(0, use_amin…
「5/30 MIKUセミナー」について 「21個のアミノ酸,コドンを一生懸命打ったのでメモ」ということだが,21個のアミノ酸というのは,end <- c("T", "C", "A", "G")codon <- list(paste("G", "C", end, sep=""), paste("T", "G", end[1:2], sep=""), paste("G",…