無料の統計ソフト「R」を使用した医学統計

論文や学会発表に統計は欠かせません。

発想が良くても、統計がない論文や発表は評価されません。

 

私たちが使う統計にはt-検定やχ2乗検定などもありますが、医学系の研究者が一番必要な統計は「Kaplan-meier (カプランマイヤー)」でしょう。ところが、長らく医学者の統計ソフトとして使用されていたStat-Viewがmacで使用できなくなり、Kaplan-miereを計算できる簡単で安い統計ソフトがないことが頭痛の種でした。

 

SASSPSSなど統計のプロが使うようなソフトもあります。 (研究者の統計についてはhttp://www.kenkyuu.net/comp-soft-01.html に比較があり勉強になりました)

しかし、統計ソフトは結構値が張るので、二の足を踏んで、結局古いコンピュータを探してSTAT-Viewを継続している人も多いと思います。

一部の統計に精通した研究者以外の(私を含めた)医学系研究者が望む統計ソフトは

 ①とりあえず統計ができればよい

 ②なるべく安く

 ③更新はなくて良いので、なるべく長く使いたい

 ④簡単なものが良い

ではないでしょうか?

 

医学研究者が学会発表や論文作成で使用する統計は限られています。

とにかく、複雑な理論は、またの機会に勉強するので、当面の発表を乗り切りたい、というのが正直な感想だと思います。

 

私も、いろいろソフトを探してみました。

お金がかかるので、SASSPSSexelにアドインするようなものは試していません(お試し版もあるようです)。

 

現在は統計ソフトR」を使用しています

私は、コンピュータではインターネットとスライド作りくらいしかしないので、「R」になれるまでは時間がかかりましたが、一旦式を作ってしまっておけば、あとはexelデータがあれば5分くらいで、x2検定やt検定、kaplanmiereの生存曲線、log-rank testや多変量解析までできます

 

R」を使用するのを躊躇する研究者は、

 ①なんか面倒くさそう

 ②本当にタダなの?

 ③どんな統計ができるの?

 ④でも、論文で採択の時に不利になるんじゃないの?

 ⑤ネット環境じゃないところ、家でも使用したい

だと思います。私もそうでした。

 

確かに私もはじめはエラーの連続であきらめかけましたが、慣れると単純作業でカプランマイヤーのグラフが30秒で作れます。そして、本当にタダです(ちなみに、この文章も広告ではありません)。


統計については、t-検定、カイ2乗検定から、Kaplan-miereや多変量解析までできます。多分、使いこなせば、さらに深い統計までできます。

もちろん「R」のダウンロードはネット環境に接続する必要がありますが、その後はネットに接続していなくても自分のコンピュータ上で処理が可能です。

論文採択については不安もありましたが、「R」を使用した論文はNew England Journal of Medicineにも採択されていますし、少しずつ増えてきています。私も「R」で統計処理した6編の英語論文を投稿し採択されました。その過程で10以上の雑誌からrejectを受けましたが、統計ソフトについてのコメントは一度もありませんでした。

 

このホームページでは、R」を使用して、なるべく手っ取り早く統計処理をすることを目的にしています。

どのタイミングで、どの統計を使用するかについては改めて勉強してください。(ここで、この統計処理はおかしいんじゃない?というのも受け付けません。残念ながら私には統計の表面をなでるような知識しかありません)

また、プログラミングについて理解は不十分です。もし、重大な欠陥があれば教えてください。少なくとも私はこれまで問題はありませんでしたが、責任はとれませんので、使用にあたっては御自身で勉強してください。残念ながら、私にはプログラミングの知識はありません。

 

ここでは、全くの初心者を対象にしています。エクセルやワードを使用している研究者なら、多分、1時間もあれば自分のコンピュータ上で生存曲線や多変量解析ができるはずです。

私はmac(macbook OSX 10.7.5)を使用していますので、windowsだと少し違う点もあるかもしれません(もちろんwindowsでも使用できます)。

 

実際の統計処理

<R側の準備>

まず、はじめに「R」をダウンロードしましょう(無料です)

http://essrc.hyogo-u.ac.jp/cran/ (兵庫教育大のサイト)

 

「R」の基本操作はhttp://aoki2.si.gunma-u.ac.jp/R/ などに詳しく書かれています

 

 私が学習した超基本は、

 ①その式を選択するためには、その文書を選択して、⌘+Enter(return)を押す

 ②<-は=のこと

 ③#以降は読まれません

 ④大文字、小文字は識別されます

 ⑤コピー、ペーストは、「⌘+V」などが、普通に使用できます

 

 

Rを開きます

 

このような画面が出てきます
このような画面が出てきます

Rでカプランマイヤーなどの生存解析する際には、「survival」というパッケージが必要です

 

パケージとデータからパッケージインストーラを選択します
パケージとデータからパッケージインストーラを選択します

メニューバーのパッケージとデータから「パッケージインストーラ」を選択します

次に「survival」を検索し、インストールします(下の図参照)

 

 

 

Survivalをインストールします
Survivalをインストールします

 

つぎに、

Rのコンソールに、直接プログラムを打ち込んでも良いのですが、一字でも間違えると認識されないし、同じ指示を何度も打ち込まないといけないので、エディタを使用します。

 

⌘+N(またはメニューバー→ファイル→新規文書)でエディタを表示させます。

 

このエディタは保存できるので、はじめに、プログラムを打ち込んだら保存しておくと何度も使用できて便利です。

 

 

 

<データ側の準備(あくまで初心者のためです。慣れれば自分の使いやすいように変えてください>

①まず、デスクトップに読み込み用の「新規フォルダー」を作成し、ここではフォルダ名を「Rdata」としましょう(大文字、小文字は識別されますので注意してください)

②次に、エクセルでデータの表を作成します(他のデータのコピー&ペーストでも可です)

 ここでは練習用に下記のデータを作成してください

 (日本語は使用しない方が無難です。スペースがあるとエラーになります。大文字小文字は識別されます)

 

 

数字は適当で大丈夫です。スペース不可。日本語不可。Censorはイベント1、うちきり0です
数字は適当で大丈夫です。スペース不可。日本語不可。Censorはイベント1、うちきり0です

 

 

③このファイルを保存します。(ここが重要です)

 ファイルの保存先を、先ほど①で作成した「Rdata」にします

 ファイルの名前を、training1とします

 ファイルの保存形式(種類)を 「テキスト(タブ区切り)(*.txt)にします

 

④一応、「Rdata」内に、「training1.txt」と保存されているのを確認してください

 (ファイルの中を書き換えたりデータを追加する場合は、「このファイルで開く」でexelを選択してください)

 

 

ここまで、面倒だったと思いますが、ここまでくれば後は簡単です

 

次のページへ