useRs Statistical Analyses with R

W: M: D: P: 1
W: M: D: P: 2
W: M: D: P: 3
W: M: D: P: 32
W: M: D: P: 4
W: M: D: P: 5
W: D: P: 15

メタアナリシス

2024.07.31:Scriptの内、P:のパッケージのインストールのためのスクリプトを日本のミラーサイトが山形大学のみになったため、参照URLをそれに合わせて変更しました。

Rのパッケージmetafor、forestplot、mada、lme4、gemtc (rjags、 JAGS)、BRugsその他とOpenBUGSを用いてメタアナリシスを行います。

ScriptボタンをクリックするとW Windows用スクリプト;M Mac用スクリプト;D サンプルデータ;P 必要なパッケージをインストールするためのスクリプトをクリップボードにコピーするための小パネルが表示されます。 四角の部分をクリックするとそれぞれがクリップボードにコピーされるので、スクリプトはRのファイルメニューから新しいスクリプトを開いて、エディターウインドウに貼り付けて実行できます。サンプルデータはExcelに 貼り付けてフォーマットを確認し、自分のデータにに合わせて書き換えて、データの範囲を選択し、コピーし、Rに戻って、スクリプトを実行すると解析が実行されます。実行時点で、サーバーから読み込まれ、実行されます。 実行の際のRのスクリプトを確認したい場合は、四角の部分をクリックする際にShift keyを押しながらしてください。 WまたはMのスクリプトの中のsource()に書いてあるスクリプトがブラウザで別ウインドウに表示されます。なおこのウエブページを開く際にJavaScriptを読み込みますが、時間がかかる場合があります、 四角の部分をクリックしても反転しない場合は、Scriptボタンを再度クリックして、一度小パネルを閉じてからもう一度試してください。

#1. リスク比、オッズ比、リスク差、ハザード比、平均値差のメタアナリシスを実行する。
リスク比についてはバイアス調整メタアナリシスも可。 単独群の率あるいは割合のメタアナリシスも可。リスク比、リスク差、平均値差のメタアナリシスの場合は、対照群、介入群の各群のメタアナリシスも実行し、Forest plotに統合値と標準誤差を表示する。

#2. リスク比、オッズ比、リスク差、ハザード比、平均値差のメタアナリシス。複数のデータセットを一度で解析可能。
サンプルデータは複数のデータソースを含んでいるので、一度Excelに貼り付け、必要な部分をコピーしてから、Rでスクリプトを実行してください。それぞれテンプレートとして自分のデータに置き換え、追加して使用してください。

#3-1. madaを用いる診断精度(Diagnostic Test Accuracy, DTA)研究のメタアナリシス:
感度、特異度のForest plot、診断オッズ比(Diagnostic Odds Ratio, DOR)のForest plot、Proportional hazards modelによるForest plotとAUCおよびpAUC (partial AUC)のプロットを作成し、コンソールに数値データを出力すすとともに、クリップボードに各研究のこれらの値を格納します。Rでのスクリプト実行終了後貼り付けることができます。一番下の行がぞれぞれの統合値、95%信頼区間の値です。

#3-2. Bivariate modelで二項分布を用いる診断精度(Diagnostic Test Accuracy, DTA)研究のメタアナリシス:
lmer()関数で二項分布Binomial distributionを用いる方法です。madaでは近似正規分布を前提としているため、症例数が25以下、感度・特異度が95%以上になるとバイアス(誤差)が大きくなることが指摘されており、Cochrane Handbook for Systematic Reviews of Diagnostic Test Accuracy version 2.0, 2022ではその使用が推奨されていません。

有病率、感度、特異度のForest plot、SROCプロットを作成し、感度・特異度の統合値と95%信頼区間、統合値のDiagnostic Odds Ratio (DOR)、陽性尤度比、陰性尤度比、I二乗値のコンソールへの出力、クリップボードに各研究のこれらの値を格納します。Rでのスクリプト実行終了後貼り付けることができます。
DTA研究用評価シート: DTA_sheet.xlsx

#4. gemtcを用いるベイジアンNework Meta-analysis
Rからrjagsを介してJAGSでベイジアン解析を実行し、結果をR側で処理し表示します。SUCRAもプロットします。
二値変数の場合はOdds Ratop、連続変数の場合は平均値差を効果指標として解析します。データの形式は2種類に対応し、1行に1研究、または、1行に1アームです。 SciptボタンをクリックしてD□で得られるサンプルは1行に1研究の例です。1行に1アームのサンプルは をクリックして表示されるページに載せてあります。コピーしてExcelに貼り付けて、フォーマットを確認してください。自分のデータに書き換えて解析します。

#4-1. 効果指標の値が小さい方が望ましい場合(例:発症率あるいは平均値が低下する):
#4-2. 効果指標の値が大きい方が望ましい場合(例:治癒率あるいは平均値が高くなる):

#5. Dendukuri Nのモデルを用いるR、BRugs、OpenBUGSによる診断精度(Diagnostic Test Accuracy, DTA)研究のベイジアンメタアナリシス。Forest plotまで作成する。
OpenBUGSでの処理に数分かかります。Rは32ビット版を用いること。(注)2023.02.22の時点でRのWindows版はversion 4.2.2ですが、32ビット版のサポートが無くなりました。 BRugsがインストールできないため、このバージョンでは動きません。R-4.0.0およびR-4.0.2の32ビット版では動作することを確認しています。CRANのR for WindowsのページからBaseのページを開き、最新版ののダウンロード用のページでPrevious releasesのページを開きそこから32ビット版をダウンロード・インストールできます。WのスクリプトをコピーしてRで走らせると、最初に結果のファイルを保存するフォルダを選択する画面が出ますが、文字のエンコードの問題でフォルダの場所によっては、パスが読み込めない現象がおきるので、Cドライブの直下にBayes-DTAのような名称のフォルダを作成してそれを選択してください。なお、フォルダ名は任意です。解析が修了するとそのフォルダ内のResultsというフォルダにForestplot、SROCなどの結果のファイルが保存されています。なおもし、BRugsがうまくインストールできない場合は、CRANのPackgesのページを開きBRugsのZIPファイルをダウンロードして、RのパッケージメニューからInstall package(s) from local files...からダウンロードしたファイルを選んでインストールしてみて下さい。


W: M: P: 6
W: M: P: 7

テキストマイニング

PubMed検索後XML形式でダウンロードしたファイルを読み込み単語の出現頻度を解析する。結果は検索式作成の参考にする。

Word Cloudを作成するとともに、文献当たりの出現頻度順にリストを作成し、ブラウザーで表示する。 チェックボックスで選択した単語をANDで組み合わせ検索式を作成し、Search PubMedボタンをクリックすると、PubMed検索を実行する。

検索式のフィールドで修正可能。検索式を保存したい場合は、Ctr+Aで全部を選択して、メモ帳などに貼り付けて、ファイルとして保存のこと。

#1. ひとつのファイルを解析する場合。

#2. 標的文献サンプルと対照文献の二つのファイルを 解析し、頻度の差が大きい単語をリストアップする場合。

いずれの場合も、スクリプトを実行するとXMLファイルを開くためのダイアログボックスが表示されるので、解析対象ファイルを選択すると解析が行われ、 解析結果をCSVファイルとして保存するためのフォルダを選択あるいは新規作成するためのダイアログボックスが表示される。結果はそのフォルダに保存される。

PubMedから検索結果をSaveする際のファイルのFormatはSummary (text)、 PubMed(以前のMEDLINE形式)、PMID、Abstract (text)、CSVに限定されています。XML形式でダウンロードしたい場合は、PMIDのリストを作成し、PubMed2XLを利用することができます。PubMed2XLはIvan Rivera Caraballo氏の作成したウェブツールで、Public domainとのことです。こちらがLink

ファイルのFormatをPMIDでダウンロードするとPMIDが一行ずつ改行で区切られたテキストファイルが得られます。それを開いて、そのままPubMed2XLのフィールドに貼り付けて使用できます。

W: M: D: P: 8
W: M: D: P: 9
W: M: D: P: 10
W: M: D: P: 11
W: M: D: P: 12
W: M: D: P: 13
W: M: D: P: 14

決断分析 Decision Analylsis

#1. Analyltic Hierarchy Process (AHP)。

#1-1. AHPのためのペア比較表の作成。
#1-2. AHP解析を行い、固有値から優先度を算出。

*フォルダを選択あるいは新規作成のダイアログボックスで指定したフォルダに結果が保存される。

#2. Desicion tree

#2-1. Decision treeのスケッチをExcelで準備し、クリップボード経由で読み込み、処理してDecision treeのCSVファイルを作成し、 Excelで開いて必要なパラメータを設定する。

*フォルダを選択あるいは新規作成のダイアログボックスで指定したフォルダにCSVファイルを保存。

#2-2.Decision treeから効用値、コストなどの計算を行う。#3で作成したCSVファイルをExcelで開き、確率、効用値あるいはコストなどパラメータを設定したら、選択肢の効用値あるいはコストを計算する。

#3. Multi-Criteria Decision Analysis

2022.10.06の時点でRのWindows版はversion 4.2.20ですが、32ビット版のサポートが無くなりました。現在の64bit版ではエラーが起きていましたが、 データの文字コードの取り扱いが変わったためのようです。データ中に日本語を含んでいますが、「1か月」のように数字部分が半角文字だと、read.delim()でエラーが起きることが分かりました。 「一か月」に書き換えると動作しますので、データをそのように書き換えました。自分のデータを用いる場合注意してください。(全角の1でもエラーとなりました)。なお、以前のバージョンのRは CRANのRのダウンロード用のページでPrevious releasesからダウンロードできます。

#3-1. Multi-Criteria Decision Analysis (MCDA) with Swing-weighting: 各アウトカム対する効果推定値から最悪、最善の値を設定し、Swing-weightingによりアウトカムの重みを設定し、パラメータ間の相関も取り込んで総スコアaggregate scoreを計算する。重みを変動させた場合の感度分析の結果も出力する。

Step 1: 効果推定値から95%信頼限界の値の中から、最悪、最善の値を候補として抽出してCSVファイルを出力する。
Step 2: 最悪、最善の値を設定したら、Swing-weightingのためのグラフを作成する。
Step 3: 価値関数、相関行列などすべてのデータが準備できたら、介入ごとの総スコアaggregate scoreを算出する。相関が無い場合は対角セル以外はすべて0に設定する。

*フォルダを選択あるいは新規作成のダイアログボックスで指定したフォルダファイルを保存。

⇒Amazon

入門医療統計解析

本書に記述したスクリプトをコピー・ペーストで使用できるよう提供。

スクリプトをコピーしRのエディタ画面に貼り付けて、必要に応じて変数名などを書き換え、実行することで解析をおこなう。BはOpenBUGS用コード。Dはデータ(タブ区切り)。Eはエクセルのファイル。

第1章 ; 29; 37; 38; 46 B; 53 B;

第2章 ; 72; 77 B; 80 B; 81 B; 82 B; 87 B; 93 B; 94 B;

第3章 ; 98; 99; 99 D; 101; 103; 104; 107; 108; 108 D; 110; 113; 120; 126; 133; 133 D; 137; 137 D; 144; 144 D; 149; 153; 156; 160; 169 B; 179; 181 E;

第4章 ; 196; 196 D; 204 B; 211 B; 217; 224 B; 227 B; 228 B; 229 B;

第5章 ; 232; 245; 246;

第6章 ; 254; 256; 258; 262; 269;

第7章 ; 282;

第8章 ; 296; 300; 304; 313; 323; 325;

付録 ; 344; ページ

⇒Amazon

[新版]入門医療統計学

本書に記述したスクリプトをコピー・ペーストで使用できるよう提供。

スクリプトをコピーしRのエディタ画面に貼り付けて、必要に応じて変数名などを書き換え、実行することで解析をおこなう。

第1章 ; 30; 30 D; 35; 35 D; 44; 51; 51 D; ページ

第2章 ; 62; 62 D; 89 ;

第3章 ; 138; 138 D; 141; 153; 153 D-治療群; 153 D-対照群;

第4章 ; 182 ;

第5章 ; 194; 194 D; 202 ;

第6章 ; 217 ;

第7章 ; 235;

第8章 ; 254; 254 D; 254 E ;

第9章 ; 300 E;

付録A ; 310 E; 付録B ; 319;

はじめに

Rを用いて統計解析を行う際にスクリプトを書いて、必要な部分を実行させる作業は、ソフトウェアの操作がグラフィカル・ユーザ・インターフェースが主流になっている現在、 難しく感じる人が多い。

useRsでは、スクリプトをウェブページからコピーしRのエディタ画面に貼り付けて、実行することで解析をおこなえる。

スクリプトを各自のPCで管理する必要はない。それぞれの解析を行いたい場合に、useRsを開いて必要なスクリプトを見つけ、データの形式を確認し、用いることができる。

YouTubeのIZ statチャンネルでは「Rのインストール」「Packageのインストール」「Rでスクリプトを書いて実行する」など動画で解説。

操作

をクリックすると解説、 をクリックするとパネルが表示され、の各ボタンの部分をクリックすると、W:Windows用のスクリプト、 M:Mac用のスクリプト、D:データサンプル、 P:必要なパッケージのチェック・インストールのためのスクリプトがクリップボードにコピーされる。そのままスクリプトはRエディタ、あるいは、データサンプルはExcelに貼り付けて(Ctr+V)そのまま使用できる。RエディタはWindowsはファイルメニューから新しいスクリプト、Macはファイルメニューから新規文書でエディタ画面が開かれる。

Rエディタ中のスクリプトはカーソルを置いた行または選択・反転した範囲を実行できる(Windowsは実行ボタン クリックまたはCtr+R、MacはCommand+Enterキー)。

パッケージのチェック・インストールは最初に1回実行すれば、未インストールのパッケージを自動でインストールする。

Rを起動して、ファイルメニューから新規スクリプトを選択し、Rエディタ画面を開いておく。そのうえで、ブラウザでuseRsを開いて、使用したい解析を探し、 Scriptボタンをクリックして、用いたいスクリプトを選択し、Rに戻り、Rエディタ画面に貼り付け、解析に用いる。


入門医療統計解析と新版入門医療統計学については、該当するページ数の部分をクリックするとスクリプトあるいはデータが小ウインドウに表示される。 そのスクリプトの部分をクリックすると、データがクリップボードにコピーされるので、Rエディタに貼り付けて使用する。データはExcelに貼り付けて形式を確認することができる。