1
はじめに
1.1
What’s this?
1.2
サンプルデータ
1.3
作成・ビルド・管理(読まなくていいです)
1.4
To Do
2
ディレクトリとR Project
2.1
作業ディレクトリ確認
2.2
作業ディレクトリ設定
2.2.1
スクリプトファイルが存在するとこにsetwdしたい
2.2.2
R Project
2.2.3
here
package
3
入力
3.1
CSVファイル読込
3.1.1
read.csv
3.1.2
fread
3.1.3
型を明示して読み込み
3.2
Excelから読込(xlsx)
3.3
SASデータから読込(sas7bdat)
4
データ確認
4.1
列ごと
4.1.1
欠損列を含む列を表示
4.1.2
ユニークデータ数
4.1.3
列の型
4.1.4
列ごとに型、重複無し数、欠損数を表示
4.2
dataframeの概要
4.2.1
dataframeの次元(行数と列数)
4.2.2
package
5
データ編集
5.1
列の追加
5.1.1
mutate
5.1.2
add_column
5.1.3
複数の列から最大や最小を求める
5.1.4
条件分岐
5.1.5
ビニング
5.1.6
1行ずらす
5.2
列の編集
5.2.1
mutate
5.2.2
mutate, across
5.3
列の選択
5.4
列の削除
5.4.1
列名が重複してる場合
5.5
列の入替
5.6
列名関連
5.7
列名確認
5.7.1
一部変更
5.7.2
全体変更
5.8
列の作成・選択・入替・名前変更を一括で
5.9
並べ替え
5.10
条件によるフィルタ
5.11
その人のx番目の行を取得
5.12
その人の上からx番目の行を取得
5.13
特定のデータフレームの列に含まれる行を抽出
5.14
特定のデータフレームの列に含まれない行を抽出
5.15
重複削除
5.15.1
distinct
5.15.2
first
5.16
データを縦に結合
5.17
データを横に結合
5.18
マッチしたデータを横に結合
5.19
部分一致
5.19.1
文字列一致判定
5.19.2
文字列置換
5.19.3
文字列削除
5.20
正規表現
5.21
欠損値
6
ggplot2によるVisualization
6.1
基本
6.2
応用
6.2.1
図中にテキストラベルを入れる
6.2.2
複数の図を並べる
6.3
生存時間分析
6.3.1
ggforest
6.3.2
Kaplan-Meier曲線
6.4
便利なサイト
7
統計解析
7.1
検定
7.1.1
t検定
7.1.2
Wilcoxonの順位和検定
7.1.3
分割表の検定
7.2
回帰分析
7.2.1
重回帰
7.2.2
ロジスティック回帰
7.3
生存時間分析
7.3.1
Cox回帰
8
出力・保存
8.1
表を作る
8.1.1
kable
8.1.2
DT
8.1.3
tableOne
8.1.4
gt, gsummary
8.1.5
flextable, ftExtra
8.2
RData, RDSで出力
8.3
csvで出力
8.3.1
デフォルト関数
8.3.2
fwrite
8.4
xlsxで出力
8.5
結果の出力
8.5.1
sink
9
自作関数
9.1
自作関数の作り方
10
R Markdown
10.1
R Markdownの基本
10.2
Chunk Option
10.2.1
Global Option
10.3
Rmdでのディレクトリ設定
10.4
knitの出力先指定
11
使用パッケージ
11.1
必須
11.1.1
全般
11.1.2
パッケージ管理
11.1.3
データ分析
11.1.4
統計解析
11.1.5
表
11.1.6
グラフ・可視化
11.1.7
R Markdown
11.1.8
アプリ
11.1.9
スクレイピング
11.1.10
Reproducible
11.1.11
Docker
11.2
推奨
11.2.1
汎用
11.2.2
並列処理
11.2.3
R学習
11.2.4
グラフ
11.2.5
RStan
11.2.6
LaTeX
11.2.7
SAS
11.2.8
疫学
11.2.9
データ分析・機械学習
11.2.10
スクレイピング
11.2.11
時間計測
11.2.12
資料作成
11.2.13
アドイン
12
Tips
12.1
R Studioの設定
12.2
ショートカットキー
12.3
# シャープ
12.4
if(0)
12.4.1
パッケージ無かったらインストール
12.4.2
警告を出力せず読み込む
12.5
時間計測
12.5.1
tictoc
12.6
Rの学習・情報を得る
12.6.1
ネット
12.7
パッケージの情報を得る
12.8
ググるにあたって
12.9
コーディングスタイルガイド
12.10
Advanced R
12.11
プログラミング時の留意点
12.11.1
心がけること
12.11.2
できれば行いたいこと
12.12
ミスしがちなところ
12.12.1
汎用的なところ
12.12.2
医療情報データベース特有
12.12.3
Rのアップデート
12.13
メモリ開放
12.14
サンプルデータ作成
12.14.1
data.frame()を使う
12.14.2
read.table()を使う
12.14.3
datapasta
13
テンプレート・フォーマット
13.1
R Markdown
13.1.1
rmdformats
パッケージ
13.1.2
Rmd to Word
13.2
ggplot2
13.3
shiny
医療情報DB解析のためのデータハンドリング大全
6
ggplot2によるVisualization
制作中です
6.1
基本
6.2
応用
6.2.1
図中にテキストラベルを入れる
ggrepel(
https://cran.r-project.org/web/packages/ggrepel/vignettes/ggrepel.html
)
6.2.2
複数の図を並べる
patchwork
6.3
生存時間分析
6.3.1
ggforest
6.3.2
Kaplan-Meier曲線
6.4
便利なサイト
data to viz
手持ちのデータから、どのように視覚化するかを教えてくれる