コマンドの基本構造は、以下の通り。
コマンド名 変数名 (if文) (, オプション)
①generate(genと略せる):新たな変数を作る
a=2という変数を作成するには
gen a=2
と、Doファイルエディタに入力。そしてそれを選択した状態でDoファイルエディタの一番右のボタンを押して、プログラムを走らせる。
そしてStataの結果画面に戻り、ブラウズマークを押して、データがどう変わったか確認。
⇒一番右にaという列が新設され、そこの値はすべて「2」となっている。
②replace:変数を書き換える
すでにある変数aの値をすべて4に書き換えたい。
replace a=4
とDoファイルエディタに入力して、実行する。すると、さきほどのaの列の数字がすべて「4」に変わっている。
③条件文をつくって、連続変数をカテゴリー変数にしてみよう。
例として、連続変数である体重。これを50kg未満、50kg以上80kg未満、80kg以上、のカテゴリーに分けたい。
まず、変数bwtcatを作成(まず全て1にする)。
gen bwtcat =1
次に、条件文を作って、カテゴリーに分けていく。
50kg以上80kg未満を2にする。replace bwtcat =2 if bwt>=50 & bwt<80
80kg以上を3にする。replace bwtcat =3 if bwt >=80
すると、50kg未満の人は2でも3でもなく、1のままになっているので、これでカテゴリー毎に分けることができた。
④summarize(suと略せる):変数を要約する
体重を要約する su bw
体重と年齢をどちらも要約する su bw age
体重と年齢をどちらも詳細に要約する su bw age, detail
体重が50kg未満の人だけ、年齢を詳細に要約する su age if bwt <50,detail
⑤tab :表を作る
喫煙の有無についての表を作る tab smoke
喫煙の有無と糖尿病の有無についての2分表を作る tab smoke diabetes
喫煙の有無と糖尿病の有無についての2分表にパーセンテージも表示したものを作る tab smoke diabetes, column
⑥その他
hist ヒストグラム
scatter(scと略せる) 散布図
graph box 箱ひげ図
stem 幹葉図