まずは参考書頼み!

とりあえず、今回非常に約にたった本を一通り紹介します。

Rによるデータサイエンス データ解析の基礎から最新手法まで

Rによるデータサイエンス データ解析の基礎から最新手法まで

まず、この本でざっとどんなことができるのか?ということを全体的に把握するのにすごく役立ちました。
良著です。

Rで学ぶデータマイニング〈1〉データ解析の視点から

Rで学ぶデータマイニング〈1〉データ解析の視点から

Rで学ぶデータマイニング〈2〉シミュレーションの視点から

Rで学ぶデータマイニング〈2〉シミュレーションの視点から

こちらのほうは、具体的なプログラミングに役立ちました。

さて、カテゴリ変数の統計処理って・・・

最近、統計処理の依頼で、いわゆる「カテゴリ変数」の処理をする必要がでてきました。

まあ、医療統計なので一般的には、クロス集計から始まって、感度・特異度の算出、決定木の算出や数量化?類などが対象となるんでしょうが、いざやろうとすると、意外とすらすら指が動かないので、ちょっと自分でも驚いてしまいました。

R-2.7.0 R(D)COM / RExcelとの相性

まず、R(D)COMをインストールする場合には、前のバージョンを完全にアンインストールしておかなければなりません。(それは前のバージョンからずっと同じ)

で、CRANから普通にRSrv250.exeをダウンロード後、インストールしてもうまくいきません。

困っていたところ、こんなページがありました。

R(D)COM, rcom and RExcel
http://learnserver.csd.univie.ac.at/rcomwiki/doku.php

そんでもって、この不具合は既知の情報のようです。
http://learnserver.csd.univie.ac.at/rcomwiki/doku.php?id=version_information_and_links

こちらをダウンロード後、インストールすることであっさりうまくいきました。
http://rcom.univie.ac.at/download/current/RSrv250_pl1.exe

#正確には、Rのほうで、rcomライブラリをインストールした後で、
#上記のRSrv250_pl1.exeを実行しました。

R-2.7.0のディレクトリ変更ダイアログ

今までのディレクトリ変更ダイアログは、非常に使い勝手が悪かったのですが、いわゆるWindows標準風で選びやすくなりました。

#頻繁に行う操作だっただけにこれは嬉しいです。

R-2.7.0 インストーラ

インストーラーですが、なんとなく動きが変です。
MDIを指定してもSDIで立ち上がってみたり、一番最初のインストールのときはレジストリの登録について聞いてくるのに、アンインストール後の再インストールでは聞いてこなかったり・・・。

#悪魔的な出来事はまたその後に発生するのですが。。。

R-2.7.0

統計解析言語Rのバージョンが2.6.2から2.7.0になりました。

ある程度、バージョンアップについていかないと最新のモジュールなどが利用できないこともあるので(BioConductorに付随するものなど)、試しに1台アップデートしてみました。

IronPythonとCLRが共存するコツ

まあ、もともとPythonなどのスクリプト言語はglue(糊)として、各種言語で実装したライブラリをつなぎ合わせてつなぐのがよろし!とされてきたいきさつもあります。

そういうことで、当面は、

  • CLRな言語をDLRでいじくるのがよろしい。
  • DLRな言語をCLRでいじくるような設計にはしないほうがよろしい。
  • 意外な処理で信じられないほど遅くなることがある。x[5:10]など。

ということで納得した私たちでした。