・ずらっと選択肢を並べて、「該当するものに〇を付けてください」という形式にすると、選択肢の中にあるのに見落として「その他」の自由記入欄に記載する人がいる。そうするとデータクリーニングが大変。以下のような形式にして、一つずつ、選んでもらうようにした方がよい。
あり | なし | |
心窩部痛 | 1 | 2 |
背部痛 | 1 | 2 |
腹部膨満感 | 1 | 2 |
・単位を間違えて記入する人が多いので、わかりやすくマスを設けるなど工夫する。
身長□□□.□cm、体重□□.□kg といったように。
・以下のような表形式の質問は、答え方を間違えやすい(症状がある選択肢だけ〇を付けたり、選択肢の言葉のところに〇を付けたり)ので、なるべく避ける。
とても痛い | 少し痛い | 痛くない | |
朝起きたときの痛みは? | 1 | 2 | 3 |
食後の痛みは? | 1 | 2 | 3 |
・データ処理の際、変数名はわかりやすいものとし、使っている解析ソフトに対応させる。半角英数で、大文字か小文字かに統一する。注意点として、一番上にあげた質問のような、回答が複数ある質問については、選択肢ごとに変数名をつける(たとえば上の例では、心窩部痛をQ1_1、背部痛をQ1_2とするなど)。
・回答選択肢のコーディングの際には、一問目でいいえ=0、はい=1としたなら、そのあとの質問も同じ規則性でコーディングする。
・欠損値はピリオドで表すことが多いが、例えば未回収と欠損を区別したいときなど、ありえない桁数の数字、例えば未回収9999、欠損8888などとすることもある。
・データ入力は基本、縦に対象者(ID)、横に変数を入力していく。
・入力規則(こういう間違いがある場合、どう対応する)を事前に決めておく。例えば、回答以外の番号が記入されていたら、欠損にするなど。