過去 1 週間のページビュー

2011年5月30日月曜日

この男多忙につき。

朝の四時くらいまでかかって、終わらせる。

時間に際限がなかったら、なんか終われないんだよね。うん。

で、6時過ぎに就寝10時半起床。

体は動かしてないから意外と行けます。

で、11時半学校着、からの勉強。(飯は市役所)

16時半から授業。

効果の指標に関して。

また、すごく初歩的なこととして、推定量と推定値の違い。

比率と割合の違い。

習ってるんだけど、自分のものになっていない。

反省。

今週は明日が出張。

水曜は所内の歓迎会。その後学会へ。

木曜金曜学会。

土日で立川へ。

勉強をどうしようか。

学会でどのくらい頭を使うのかが未知数。

もちろん自分次第なのだろうけど。

今日はこれからご飯食べに帰って、もう一回学校来るかスタバで論文を読む。

時間の使い方を明確にしないとたぶん今週はやられる予感。

なんとなくすぎないように。

はい。

2011年5月29日日曜日

わたわた。

金曜のゼミでは、先週からの続き。

英語の読み方が適当と指摘された。

論文ってめっちゃ推敲してるはずやから、意味のない言葉なんかない。

なぜこの動詞を使っているのか、なぜこの接続詞なのか、副詞なのか。

大体こんな感じだろうと思って論文を読んでると、そのうちしわ寄せがくる。

自分の研究が穴だらけになるだけでなく、もしその論文を書いた人と話す機会があったとしても、読みましたなんか言えない。

そう思った。

そう考えたら、あの本読ませていただいてます。なんて、言えないな。持ってますとは言えても。

金曜夜は同期と焼肉へ。

半額だとチラシが入っていたので、言ってみた。

ただ、半額なのに岡山で食べるのと同じくらいの値段がした。

たぶんもう行かない。というかいけない。でも、いろいろと話せて楽しかった。

土曜は家の掃除をして、昼間は勉強。

月曜の概論の準備やなんやらで意外と時間はすぐすぎた。

夜は岡山での知り合いと飲み会。

日曜は、朝10時起床。

昼に親戚が岡山に来るというので、立川を知りもしないのに紹介。

で、今に至る!

今から12時くらいまでは頑張るつもり。

とりあえずそんな感じ。

36か月の2か月が終わろうとしている。

そんな日曜日。

2011年5月26日木曜日

勉強のできない一週間。

朝クリーニングを出すために少し家で待機。家でやろうとも思ったが、健康診断でご飯が食べられず、水のもめず、なんとなく過ごしてしまう。

で、学校に行き、論文を読み進める。

昼過ぎに健康診断に出発。

思った通り、ちょっと痩せなさいよとのこと。

まぁわかっています。

帰りに弁当を買って、再開。

で、今に至る。(なが!)

まだやっぱり飲むのに慣れていない。というか、式を見て、いろいろ想像するのに時間がかかる。

もっと読まないと。勉強しないと。

実は今週全然勉強の時間が取れていない。

月曜授業のレポートづくり
火曜出張
水曜出張
木曜論文解読
金曜ゼミ

うーん。土日ちょっと頑張るか!?

モチベーションがあがってきた。

火曜は夜に少し論文について確認。いろいろと読みたいものがたまってきた。
6月を死の一か月にするのにふさわしい分量になってきました。
自分を一度追い込みます。

本日は朝論文を読み、昼から、研究所主催のセミナーへ。
先生が主となってやっているみたいで、話を聞かせていただきました。

自分が今やろうとしている研究が実際にどう使われているのかがすごく明確になり、すごく世界が広がった気がします。

明日からやるぞ!

2011年5月24日火曜日

空で描けるか。

昨日はレポートのことをやっていたら意外と時間が過ぎてしまい、あまりできませんでした。
夜はフットサルで汗を流しました。
みんなすごく動けていて、びっくりしました。
少し走りこもうと思いました。

とりあえず今日は、判別分析の意味というか、学部の時に習っていたけど、それがより明確になりました。

最近授業をするということがどういうことなのかということがすごく教える側の目線ではいってきます。

正直、重回帰にしろ判別にしろ、使い方は大体わかっているつもりです。

ただ、それを授業で説明するとなると、つまり、教科書に載っているような式をいつも頭の中に入れることができているかといわれると正直ノーです。

もう少ししっかりと勉強しなくてはなりません。

もっと、もっと。

2011年5月20日金曜日

今読んでいる本

今読んでる本です。時間の配分もしてるんだけど、読めるときは読めるし、進まないときは全然進まないけど。とりあえず研究ではなく勉強のパートとして。

まずRの教科書を2つ。
Rによる統計解析ハンドブック 第2版 [単行本]
最近始めました。まだあんまり読めていません。
The R Tips―データ解析環境Rの基本技・グラフィックス活用集 [単行本]
岡山で買いました。卒業旅行中でもすこしずつ進めました。毎日触れば必ずできるって教えてくれます。すごくいい本だと思います。
[改訂第4版] LaTeX2ε美文書作成入門 [大型本]
計算機ソフトではないけど文章を書くためにはやっておかなくてはならないかなぁと思って、院1年の時に購入。第5版がもう出ているようですが、まだこれで我慢しています。
現代数理統計学 (創文社現代経済学選書) [単行本]
これが理論固め。もう知ってるけど、教えてと言われてわからないと統計をしているといえないような基礎の基礎。ですよね。
統計数学 (現代数学ゼミナール) [単行本]
同じように、基礎的な内容だと思います。ただ、よくつまずきます・・・。え?
統計学辞典 [単行本]
最近出た辞典です。英語で買うともっと安いのですが、とりあえず日本語を選びました。
Modern Epidemiology [ハードカバー]
研究の地盤固めです。疫学をやっている方にはこれが決定版です。
ロスマンの疫学―科学的思考への誘い [単行本]
日本語で疫学の基本がわかります。数学わからない人にもわかりやすいと思います。

とりあえずこの8冊+研究+データ科学の授業ってことでやってもやってもやることがなくならない毎日です。

ただ、今日ゼミだったのですが、少しずつですが、先生と会話ができるようになってきています。来週までにまた、論文を何本か読んできてくれと言われました。

がんばるしかない!

計画ミス?

本日9時起床。結局8時過ぎに親睦会は終わったのですが、同期のN君と家の近くの店で12時くらいまで飲んでまして、いろいろと統計な話ができてよかったです。

ということで、寝たのが1時過ぎで、起きたのが、9時半。ちゃっかり8時間睡眠をとれたということで、今日は頑張って読み進めました。

といいたいことろですが、論文を探したり、しているうちにあれよあれよと時間は過ぎてしまい、もうこの時間です。計画がまずかったのか・・・?

とりあえず明日ゼミなので、今日はもう少し頑張ります。

ではお疲れ様でした。

因子分析など

水曜日は意を決して10時に起きる。

そのままシャワー→学校で11時に到着。

論文を読み、公開講座へ。

授業の一環で受けました。主に因子分析のこと。
学部の時に何度か聞いた話でしたが、数式を極限にまで減らした講座でしたので、すごく直感的に理解できた気がします。

というか、この公開講座は、年に何回かの予定でやっているようなのですが、関東の学生はいいですね。こうやって、統計が学べない学生にも統計の門戸が開かれている。会社のマーケティングアプリケーションとして統計を学べる環境がある。

関西でもあるのでしょうか。ちょっと調べてみたいです。

で、少しそれが伸びてしまい、統計数理セミナーは聞けず。

少し論文を読み進めていると月1恒例の親睦会が始まったので、そちらに参加。

いろいろな先生方と話すことができました。

EMアルゴリズム。

火曜は起きたのが、9時。実に11時間睡眠で完全復活。

朝は、家の掃除などをし、少し勉強をしていたらいつもの出張の時間になったので、出発。

その後、研究室に戻り、パソコンのセッティングなどをしながら、EMアルゴリズムの勉強。

いやー、本当嫌になるくらい適当に理解しています。

もうそろそろ、こういう気持ちになるのは嫌なのですが、しょうがないですね。

ちなみにこの日は朝6時ごろまでやってました。

結局夜型。

うーん。

回帰

で、月曜日は、結婚式は楽しかったのですが、少し疲れがとれないまま、すでに木曜日くらいの体力で開始。

新PCが来たものの、セッティングする体力がなく、結局勉強だけで終わってしまいました。

授業では、回帰のあたりをもう少し。

回帰の時、説明変数のほうも動く場合はどのような式になるか。

自由度調整はなぜ必要か。

ガウスマルコフの定理

BLUE

その辺を復習していただきました。

で、その授業が6時までで、そのあと先生にお願いさせた仕事を済ませたらバタンキュー。

でした。

産官学

週末は友達の結婚式でした。

大学の同期です。本当におめでとうございます。

また、またほかの同期がある製薬会社の研究職で働いているので、いろいろと話をしました。

岡山との環境の違い。

会社と研究所の違い。

やりたいことが同じでも全然違うのだなと思いました。

正直、3月まで、研究を続けるのならアカデミックと決めつけていました。

でも、隣に、会社で働きながら研究をしている人がいます。

産官学。

そういう意味で少し今迷っています。

結婚式のことも書きたいですが、こちらは研究関係のブログなので、この辺で。

週末の日記

書こうと思ったらメンテが始まっていて、書けなかった分。

そこで微妙に継続が途切れていました。


昨日は結局夜10時くらいに雨がやんだので帰宅。

とりあえず月曜までのレポートがどうにか形になってきた。

というか、13章のレポートを書くのに結局全部よまなあかんとかw

まぁすごくレポートの出し方が上手いというか、うん。ベテランの匂い!
簡単なようで実は時間かかるレポート。いいです。

で、帰宅後意外と疲れていたので、就寝。

朝は雑務があったので、少し長めに寝る。

9時行動開始。

で学校に12時過ぎに到着。

で、13時半からのゼミに向けていろいろと準備して、

望む。

2週間前に全く答えられなかったことを答えることができて良かった。

14日分進んだかどうかはわかんないけど、少しは知識量増えてます。

で、その後論文とかも読もうかって言われて、いろいろ検索してました。

来週は勉強としてEMアルゴリズムの式の理解から出来れば実装まで。

論文は3日で1報、その後2日で2報(無理な目標)

こんな感じで。

今日はこれから用があるので、家に帰ります。

週末はいろんな人と会えるので楽しみです。

2011年5月12日木曜日

自由度調整済み決定係数についてアウトプット

なぜ自由度調整済み決定係数でないとだめなのか?
まず、決定係数とは、総変動のうち回帰式で説明できる変動の割合です。
ちなみに総変動は(予測値による変動)+(残差による変動)
変動とはその値からの散らばり具合。


で、決定係数を計算すると、0から1までの値が出てきます。
厳密には0とか1は考えなくていいのですが、とりあえず書きやすいのでそう書きます。

で、回帰は変数の数+1個のデータの組があればできるので、変数の数をp、データの組の数をnとします。
しかし、少しまずいことが起こるのです。

例えばp=2として、n=3とします。つまり、これはn=p+1という状況なのですが、

このとき従属変数のyも含めて、変数は2+1=3つ、データの組は3組つまり、これは回帰をしようと思っているのに、
3元の連立方程式とすれば、決まってしまうのです。ここで決定係数は上のようなものであったので、1となります。
回帰しようと思っているのに、これは違います。

これは何を意味しているかというと、例えばもう少し数字を大きくして、n=30を考えましょう。
学校のクラスと考えればよいです。

このとき、変数の数を例えば5とかにします。クラスの勉強の出来をそれで回帰するとしましょう。
このとき、ある数字が決定係数としてかえってきます。
で、決定係数が少し低いなと思って、変数を増やしてみます。
すると、残差が減るので、確実に決定係数が上がります。

そして、数字が上がればよいということをいいことにどんどん増やします。
そして、変数を29個にします。
すると、n=p+1となり、先ほどと同じ状況になります。
Rも1となります。

こういう状況では変数を増やすという行為は数字を大きくするという意味以上の意味はなさない。

このとき決定係数は1-(残差平方和÷総平方和)となっているので、分散に対して普遍分散を考えたときのように、
残差平方和n-p-1で割り、総平方和はn-1で割ったような数値とすれば自由度が調整される。
ここで、データの数は変わらないので、
動く数値は分子のpであるが、pは分子の中では分母にあり、変数を追加すれば平方和は小さくなる.
分母も変数を追加すれば小さくなる.
ので、これを大きくするためには、関係のありそうな(残差を大きく減らしてくれそうな)変数のみを入れることが望まれる。
そして、自由度調整済み決定係数とは、決定係数に自由度を大きくすることでトレードオフの関係を作るという意味で、
自然に導かれる数値であります。

実際には、自由度調整済み決定係数は、1-(自由度調整済み残差平方和÷自由度調整済み総平方和)となるので、それぞれ分子をn-p-1、分母をn-1で割ったものとなる。
これを解釈すると、データの数は変わらないとするならば、モデル選択中に変更できるのは、残差平方和のほうである。
つまり、変数を増やせば、残差は減るが、自由度が大きくなり、全体としてバランスをとることが求められます。
つまり、変数はできるだけ少なく、残差を大きく減らしてくれる変数を入れるべきだという事になります。

何も見ずにでの今の理解です。あってるのかなー。

2011年5月11日水曜日

歓迎会

昨日は朝勉強して昼から出張。

検定とか推定とかを引き続き洗い直している。
体にしみこむように練習問題とかしつつ、学部生に授業が出来るレベルまで引き上げたい。
カンペなしで。

で、夜は飲み。新入生歓迎ということで先輩に奢っていただきました。
研究の話とかもいろいろできて、ネットワークも増えた感じです。

2次会も少しあり、結構飲んでしまいました。まぁたまには!

で、今日、案の定9時過ぎに目が覚め、あーーーーと思って、急いで用意をして外に出ようとすると雨。。。

やまないかなと思いつつ昼過ぎまで家で勉強をしていました。

今日は研究のバックグラウンドの勉強を少し。

いろんな文献を読んで、なんとなくだが、人に話せるくらいにはなってきたかなぁ・・・厳密な話は出来ないけど、俺こんなことやろうとしているんですよ。という感じには。
いつでもアウトプットを想定するによってインプットの効率が上がると思うので、その辺意識して。

で、昼過ぎても雨は止まず、セミナーがあったので、モノレールで学校へ。
話はT先生のはずれ値の話とSさんのインフルエンザの話。
T先生の話を聞いて、対数変換をすることがどれ大事かということがわかった。
あとSさんの話は多分連合で同じ組で話していたような内容だったような。
その時は自分にいっぱいいっぱいだったのですが。
SEIRモデルの拡張の話で、岡山のI先生の話ともろかぶりだったので、よく理解できました。

正直、統計理論を研究されている方の発表は難解でキーワードを控えて部屋に帰って調べるという作業しかできないのですが、今日の発表は凄くわかりやすかったです。

もっと知識を増やしたいです。

その後、今日は、週末に向けてちょっと雑務があったので、そのまま帰宅。今家で続きをやっているところです。

風呂を入れて、入ってからもう少ししなくてはなりませんが、とりあえずこれを書いてから入ることにします。

というわけでもう少し頑張りますが、お疲れ様でした。

2011年5月9日月曜日

アイデアいっぱい!

6時半起床7時15分出発
週末に溜まっていたメールを返信して勉強開始。

今日の授業のレポートがまだ微妙に詰めれそうだったので、その辺を中心に。

自分の使ったことあるデータを再考察せよっていうものだったけど、今ならいろいろまた思いつくなぁ・・・。

たとえば、マラリアで使ってたデータだけど、乾季と雨季を分けて解析したらどうなってたかな。とか、サンプリングのことを学んだり、はずれ値の事を学んだり、ちょちょっと多重性のこととかを教えていただいて、自分でフォローしたりしていろいろ知っていくことがあって・・・結構今、なんかパニックていうか、もう少しやりたいんだけど、継続のためにそろそろ帰ろうかなって感じなところです。

思考の整理学って本にも書いてたけど、少し考えるのをやめることによって、寝かせることによって、いろいろなアイデアは整理されるというのは本当だなぁと思った今日でした。

明日は出張の日で、学生飲みもあるので、いろんな人と話せて楽しみである。

ということでお疲れ様でした。

2011年5月6日金曜日

先回り。

朝6時起床。

結局ネットサーフィンしてて寝たの1時半・・・。

javaについて調べてたのですが、なんかどれを落としたらいいかわからない。

おしえてjavaな人・・・。

で、起きて少し走って、7時半くらいからちょっとうとうとしてしまって、起きたら9時前!!!

てことでとりあえず登校。

ゼミの準備。

でゼミ。前回よりは準備できてるしと思ってたけど、あまあまでした。

もっとしっかりやらないと。言われたことを完璧にしていくのではなく、先生がなぜそれを聞いてくるのかを察知して、先回りしないと・・・。

とりあえずまた1週間いただいたので、その間に検定は授業が出来るくらいにはなりたい。

来週はtest weekだ!(いやな響き・・・)

とりあえず荷物が来るので、ちょっと帰宅して、今日は家で少し勉強しよう。

あと、もうちょっと走りたいので、走る。

じゃあ今日はもうちょっとやるけどお疲れ様でした。

では。

2011年5月5日木曜日

GW終盤

4日はとりあえず休み。

時間気にせず寝て(結局8時におきたけど)適当にストレッチしながらテレビ見て、昼になったので、ご飯作って、少し遠くに入ってみようと自転車をこぎました。

で、近くの(といっても5キロくらい離れてる)イオンモールがあったので、そこで休憩。

なんかいわゆるイオンですごく安心しました。ほとんど同じつくり。同じような店。

で家に帰って、就寝。

5日は朝から勉強。

6時におきてとりあえず来週の試験勉強。うーん。結構厳しい気がする・・・。とりあえず受けて様子見でもいいですが・・・。

で、9時くらいから、すこしだらだらして、昼になったので、学校へ。

明日のゼミの準備を中心に。

検定についてはわかってきました。明日うまく発表できるかどうか・・・。

で、勉強をしていると、岡山での先輩で今研究所で研究されているK先生が一緒にご飯に行こうとさそってくださったので、はじめていく中華の店へ。

おいしかったです。ちょっと高めだったですが、ご馳走いただきました!(ありがとうございます!!!)

で、帰って、もう少しもう少しと思っていたらこんな時間です。

明日も6時おきでやる予定。

がんばります。

ではお疲れ様でした。

2011年5月3日火曜日

p値

朝のうちに勉強して昼前から出張。

出張って表現でいいんでしょうか?まぁとりあえず外に行きます。今はまだ場所は言えないのです。

とりあえず朝はp値について勉強。

p値の概念は知っていたんだけど、記法としてどういう風になっているのかなどよくわかってない部分がかなりあったので、論文とかいろいろ見ながら自分の中でまとめていく。

とりあえず、簡単に簡単にまとめると、

①帰無仮説のもとでのp値というのはその帰無仮説を棄却する確率。検定で棄却する場合は有意水準を定めてそれとの大小関係で考えるが、p値は数値として与えられるので、その分情報量が多い。

②いろいろな計算を少し行うだけで、帰無仮説のもとでp値は[0,1]の一様分布に従うという事がわかる。

とりあえずこんなところ。①は知ってたけど、②は正直知らなかった。でも今覚えた。

で、その辺の話をゼミの前だけど先生と話した。(この勉強をしているのは、前のゼミでp値についてあいまいな知識しかなかったことが原因)

正直、実務上ではそういう事は知らなくていいんだけど、研究だけやってればいいのではなくて、人におしえるという事も同時に研究者はしなくてはならないから、そういう意味では知っておいたほうがいい。それは僕(先生)から教わるのではなく、自分で補完しておくこと。

との事。その通りだと思うし、やるしかないと思う。

漫然と前にあるものをやるだけではなくて、1日10時間なら10時間を上手く分割して、研究の勉強時間、基礎の勉強時間、論文を読む時間、メールを返す時間、その他もろもろが必要だと思った。

1カ月やって、何となく、何となくだが、いろいろとそういう意味でつかめてきた部分は多い。

曖昧さがなくなるとすごく制約が増えてストレスなんだけど、一度がちがちのスケジューリングも今月中にやっておこう。

まだ試しの期間はもう少し続きます。

今日もお疲れ様です。

ジョナサンに初めて行きました。

4時に家に帰宅。
寝落ち。
本日4時に起床。迷惑と思いながらも掃除機以外の炊事洗濯をして、家を出る。
近くのファミレス(じょなさん)で朝飯。家に何もなかったので。あと、きれいにした家を汚したくなかったので。

600円のモーニングを頼む。
岡山でよくジョイフルに言っていたが、そこまでのコストパフォーマンスはないとしても、ドリンクバーもついてるし、実は今は期間限定でモーニング30団体限定で新聞がついてくるので、まだ新聞を取り始めていない僕にはうれしい限り。

ビンラディンさんの話が一年であった。

で、そのまま、ドリンクバーがあるのをいいことに少し勉強。PCが目の前にないのでいつもよりはかどったり・・・。

で、今学校につきました。

今日は出張の予定ありなのでしっかり朝勉強してしまいます。

研究のほうもやらないとな・・・。

2011年5月2日月曜日

今週もがんばる。

金曜
朝とりあえず起きて、書留郵便を待ちながら家の片づけ。
エントロピーはやはり増大しています。汚い!!!
で、夜に夜行バスで京都へ。そこで感じたことはこちらへ。

で、今日の6時半くらいに立川に帰ってきて、そのまま研究室で今。という感じ。

今日はとりあえず昼くらいまで学務の連絡を待ちつつ、座学。GWの課題を早めに終わらせ、自分の勉強に戻りたい。この週末でリフレッシュはできたので、とりあえずまたがんばる。

今すごくしんどいけど、楽しい。曖昧なことに気づかされるのはものすごくつらいけど、その後勉強して理解したときはすごく楽しい。早く発表したいなってなる。このレベルを上げて、誰も知らない結果を導けるようになりたい。

ちなみに今こういう本を読んでいる。フェルマーの大定理に関する本であるのだが、昔ハード版で読んでたときは楕円曲線ってのが何かわかんなくてとりあえず読み流した感じだった。でも、数理学科に通っていたおかげで、モジュラーも楕円方程式も名前くらいはわかるので、すごくイメージをわかせながら読んでいる。ワイルズ先生を始め、もちろん、志村先生、谷山先生がやってきた研究方法が書いていて、すごく楽しそうだなと思って読んでいる。こういう研究者の本というのは本当に今の自分にモチベーションになっている。