社会調査を、データ処理方法により大きく2つに分類すると、統計的調査(量的調査)と記述的調査(質的調査)となる。後者には、参与観察や文書の内容分析など、調査とは異なるものが含まれることが多く曖昧多義的であり、本来、質的調査という言葉は適切ではない。前者は俗に言うアンケート(調査票調査、質問紙を用いた調査)と考えて良い。母集団を設定した上で(これが重要)、数百人以上の大規模な対象に調査票(質問紙)を用いて行う。科学的に正確な調査のためには無作為抽出が必須である。いいかげんなアンケートは世の中に多数あるが、科学的に正確な調査を行うためには、正確な方法論を理解する必要がある。誘導尋問など不適切な質問文、無作為抽出のない偏った対象、低回収率の調査では、正確な結果を得ることはできない(なおアンケートとはフランス語で専門家へのききとりを表す言葉であり、本来は調査票調査のことではない。英語ではソーシャル・サーベイ、サーベイ・リサーチ、オピニオン・ポールなどという)。
観察の場合、結果の記述は素人にも分かりやすくおもしろいし予備調査としては意味がある。ただし研究対象はかなり限られた偏ったものとなってしまうため、大規模な社会に対して行うことはできない。観察やエスノメソドロジーは、人類学者が離島や山奥の少数民族の村に住み込み、見た結果を記述するのが典型例だが、基本的にはごく小規模な社会に対してのみ有効な手法である。大規模な現代社会に対して無神経にいいかげんな観察をするのは研究手法として不適切である。また、分析法は結局のところ、研究者の直感や偏見にたよる方法になってしまう。直感や印象批評により誤解を広めることになり、誤解や偏見を修正する確固たる方法はないことにも注意すべきである。
気軽なアンケートや小規模な観察は、簡単そうに見える。しかし、大規模な社会調査を科学的に行うのは、専門知識を得ない限り難しいのである。生きた社会からデータをとるのが社会学の難しいところでもあり、おもしろいところでもある。この科目は、社会調査の方法について学び、大規模な社会調査を実施できる人材を育成することを目的とする。
ネット調査、「不満」高めの傾向 訪問面接と比較 朝日新聞ネット最前線
インターネット調査の特性 〜面接−ネット並行調査〜 行動計量学会
★立教V−Campus 授業支援システムVコーラスも活用します。V−Campusページより、まずスピリット(各自のポータルページ)にログイン(画面左上のログインをクリック)して、画面中のCHORUSをクリックしてください。パスワードを忘れた場合は、学生証を持って8号館4階カウンターへ行けば無料発行されます。
社会調査士科目のA「調査の基本的事項に関する科目」に対応する。具体的には、社会からデータを取るとはどのようなことか、どのような注意点が重要かを重視。
1 社会調査とは何か 2 社会調査の目的と種類 3 調査の種類と実例 4 社会学における理論と調査 5 調査の設計 6 調査倫理 ★今年は、PC教室でのエクセル実習はありません。以下の内容は参考。
A社会調査の基本的事項に関する科目 90分×15週 社会調査法1(1年次必修) B調査設計と実施方法に関する科目 90分×15週 社会調査法2(1年次必修) C基本的な資料とデータの分析に関する科目 90分×15週 社会学データ実習(2年後期必修) D社会調査に必要な統計学に関する科目 90分×15週 社会統計学(以下は基本的に3年次以降) E量的データ解析の方法に関する科目 EかFいずれか 多変量解析 F質的な分析の方法に関する科目 90分×15週 フィードワークの技法 G社会調査の実習を中心とする科目 90分×30週 応用調査実習 統計関連の内容について 1年次必修 「社会調査法」後期 無作為抽出法、標本数と誤差に触れる 2年後期必修 「社会学データ実習」 統計的検定、相関係数 について触れる 「社会統計学」 統計の基礎も触れつつ、重回帰分析、分散分析、因子分析の「考え方」を理解することを中心に。 「データ処理法」 重回帰分析よりは高度な分析法を複数学ぶ。PC教室での実習を行う。 「応用調査実習」 前期はSPSSでの分析実習も行う。クロス集計等の他、重回帰分析や因子分析はできるように。 考え方よりは、SPSS操作の実習が中心。資格のためには、試験等はとくになく、これらの科目の単位を取り、認定機構に審査手数料を支払えば、資格を取得できる。なお、他学科や他大学の単位を含めて資格申請が可能である。詳しくは社会学部掲示板に掲示するので、注意すること。実習科目の締め切りは4月初めなので注意。
・データ行列の中身を理解する
・エクセルの統計関数を使えるようになる
・エクセルでのグラフ作成を習得
ミクロデータ(社会調査データの個人)の分析実習を行います。用いるデータは、立教大学が2010年に行った社会調査のデータファイル(実習用の模擬データファイル)です。各自で、以下の実習用データファイルを、自分のHドライブ(各自のハードディスク)に保存しておいてください。以下の手順で操作すれば保存できます。
本物のデータは1000人以上のものですが、これは200人についての実習用データで、本物のデータではありません。まずは、保存して中身を見ればそれで良いです。以下の調査票も見て、内容を確認してみてください。
上の青字部分(実習用データファイル TK2010.xlsへのハイパーリンク)をマウスで右クリックしてください。そして、「対象を保存」を選び、ウィンドウ上の「保存場所」をクリックして「自分のホームドライブ H」を選んで保存してください。その上で、講義中の指示にしたがってデータ分析実習を行うこと。実習の内容は講義時に説明します。
保存時の画面で、コンピューターをクリックし、「ネットワークの場所」というところを見ると、ネットワーク上のハードディスクがある。これが立教の場合、ホームディレクトリ(Hドライブ)。保存場所としてこれを選ぶ。
★保存法については、下記の注意点をよく読んでください。
保存したら、各自で内容を見ておいてください。横1行が、1人分のデータになっていることが分かると思います。初めの1行目は変数名で、2〜201行目までが、200人分のデータです。中を見るには、保存後に、データファイルをダブルクリックするか、エクセルを起動して、画面上の「ファイル」をクリックし「開く」を選択し、ファイルの場所はHドライブにして、データファイルを選んでください。
また、各ドライブの中に、フォルダ(ディレクトリ)を作って、ドライブの中を区切ることができます。パソコンは、これらのドライブ(記憶装置)と、キーボードや画面と、CPU(中央演算回路)と、RAM(CPUと直接データをやりとりする電子記憶装置、つまりメモリー)からなっています。これがパソコンの仕組みです。このことをよく理解するとよいでしょう。
ドライブの中は自由に見たり書き込んで構いません。ファイルを削除しない限り、パソコンはどういじってもめったに壊れませんので、自由に使ってみてください。
例 セルK2〜K201 についての計算 任意のセルの中に、以下のように書く 合計 =SUM(K2:K201) 平均 =AVERAGE(K2:K201) 標準偏差 =STDEV(K2:K201) K2:K201 のところに、自分の好きな問のセル番地を書けば、計算結果が出る。 挿入をクリックし、関数→すべて表示、で選択してもできますが、最初はまず、自分の手で入力してみること。 平均、標準偏差とは何かについては、自分で統計学の教科書などを読んで学習すると良い。 複数のシートについて合計を出すときは、以下のように書く。例えば、シート2と3のセルB5の合計を出す場合 =SUM(Sheet2:Sheet3!B5) セルB2とB3を単純に足すときは、以下のように書く =B2+B3 セルB2と、B3を2倍した内容を足すときは、以下のように書く =B2+B3*2 かけるは* 割るは/ を用いる。 これらを用いると簡単に計算ができる◆表とグラフ形式の基本 資料PDF ここをクリック4.6.エクセル操作上の注意
★セルの文字の大きさなどを変更 セルを選択した状態で画面上の「書式」をクリックし「セル」を選択(あるいは右クリックして書式設定) フォントや表示形式、罫線などのタブをクリックして変更する ★表示がうまくいかない 列の幅がせまいと、計算結果が表示されず####と出ることがある。その時は、画面上方の、abcdなどと セル番地の名前が書いてあるところにマウスを合わせて引っ張って、列の幅を広げてみる。 ★漢字が出ない 入力を漢字変換モードにするには、キーボード左上すみの「漢字」キー、または「alt+半角/全角」キーを押す。 ★有効桁の統一 データラベルの有効桁数は、小数点以下1桁など、必ずそろえること。誤差範囲となる桁を細かく出しても意味がない。 セルを選択してマウスの右ボタンを押し、「セルの書式設定」を選ぶ。表示形式を 上記の平均値の例ならば、小数点以下1位までの表示にするとよい。 ユーザー定義にすると、小数点の表示を変えることができる。 ★コピー&ペースト(コピーの仕方)の操作法について これを覚えると、エクセルに限らずさまざまなソフトでコピーができる。この操作法を修得しておくととても便利。 平均などを書いたセルをコピー元として、コピー元のセルで 「CTRL+C」を押してから、右隣のセルに移り 「CTRL+V」を押すと、同じ内容がコピーされる。 コピー先のセルの内容を見て、セル番地が変わっていることを確認しよう。 なおシフトキーを押しながら矢印キーを押すと、複数のセルを選択できる。複数を一度にコピーできる。 また、コピー先のセルを複数選んで(シフト+矢印キーで複数選択できる)から、「CTRL+V」(または右クリックして貼り付け)、 一度にたくさん貼り付けできる。 また、CTRL+Cを押した後、コピー先のセルを選んでから右クリックし、「形式を選択して貼り付け」を選ぶと、 値だけをコピーするなどができる。 ★グラフをワード画面にコピーするには エクセルで「グラフ全体を選択した状態」で「CTRL+C」を押し、ワード画面に移って 「CTRL+V」を押すと、ワード画面にエクセルグラフを貼り付けることができる。 ★グラフの形式を整える グラフを作った後に、グラフをダブルクリックすると画面上に「グラフツール」としてデザイン、レイアウト、書式 などが出る。そこで「レイアウト」を選ぶと、データラベルやタイトルの追加などができる。 また、グラフを選択した状態で右クリックして「グラフエリアの書式設定」を選ぶと、グラフの背景の色などを変更できる。 エクセル2003以前では、グラフを作った後に、グラフを選択した状態で右クリックして「グラフの オプション」を選ぶと、データラベルやタイトルの追加などができる。 ★同じ形のグラフを複数作る グラフを作った後に、グラフをダブルクリックすると画面上に「グラフツール」としてデザイン、レイアウト、書式 などが出る。そこで「デザイン」を選ぶと「データの選択」が出る。 同じグラフを2つ作ってから「データの選択」を選び、元のデータとして違う数字を選ぶと、同じ形だが 中身が違うグラフを複数作ることができる。これは便利。 エクセル2003以前では、グラフを選択した状態で右クリックして「元のデータ」を選び、他の数字の入ったセルを選ぶと、 グラフ元データの内容を変えることができる。4.7.エクセルの操作のまとめ
・複数のセルを選択 : マウスで選ぶ、もしくはShift+矢印キー ・コピー Ctrl+C 貼り付け Ctrl+V カット Ctrl+X ・値そのもののコピー : コピーしたい部分を選んでCtrl+C →貼り付けたい部分でマウス右クリック →「形式を選択して貼り付け」 ・数字の縦横を入れ替え : 同上の操作後に「行と列の入れ替え」 ・データ読み込み後の区切り : 画面上「データ」をクリック→区切り位置 ・線を引く : 線を引きたいセルを選択し右クリック →セルの書式設定 →罫線 ・操作の繰り返し(リピート) : F4キー ・操作の取りけし(アンドゥ) : Ctrl+Z ・フィルハンドル(セル右下の黒い十字) : 連続した数字を入れてから引っ張る と続いて連続した数字を自動入力4.8.データの並べ変え
ある変数を選び、その内容順に、データを並べ変えることができる。例えば、調査データは男女がまざっている。性別の問について、上半分を男、下半分を女、のように並べ変えることができる。 ・まず、どこか1つのセルを選ぶ ・画面上「データ」をクリック→並べ替えボタンを押す ・「最優先されるキー」ボックスをクリックして、性別の問を選ぶ ・OKボタンを押すと、データの内容が、並べ変えられている うまくいかない時は、並べ変えしたい行(2〜201行など)をすべて選び、以下の操作をする。 途中に空白列などがあると一部しか並べ変えされない。また、 ふつう、練習用ファイルのように1行目は変数名だし、202以下にいろいろ書き込んだ場合があるので。 ・画面上「データ」をクリック→並べ替えボタンを押す ・「先頭行をデータの見出しとする」のチェックをはずす ・「最優先されるキー」ボックスをクリックして、性別の問を選ぶ ・OKボタンを押すと、データの内容が並べ変えられている4.9.グラフ作成の操作法
1 グラフにしたい平均値や%を、連続したセルに書き込む 上の図のように、間を空けずに数字を書き込むこと。 2 男女などラベルも書く 3 グラフにしたい数字とラベルのセルをマウスで選ぶ 4 画面上の「挿入」→グラフボタン 5 データの縦横が間違っていることがあるので、画面左上の「行/列の切り替え」ボタンを押す 6 画面上の「レイアウト」を選び、グラフタイトルやデータラベルを追加する 7 完成後、模様や線種の変更 : 「グラフ内の棒や線を選択した状態」で右クリック →データ系列の書式設定 →塗りつぶしや、線種変更や、マーカー変更 8 折れ線グラフで縦軸の幅を変更する時は、縦軸を選択して、右クリック →軸の書式設定 エクセル2007以降の場合 グラフをダブルクリックすると、画面の一番上に「グラフオプション」が出るので その下の「レイアウト」や「書式」をクリックしてグラフ内容を変えることができる。 なお、2007以降は、白黒印刷に適した模様のグラフを作ることが非常に難しいのが欠点である。 作る時は以下の見本ファイルを参考に。 クロス表とグラフ見本エクセルファイル
都道府県別のマクロデータ見本エクセルファイル
これらのファイル中のグラフを選択して、テンプレートとして保存するとよい。 グラフを選び、画面上の「グラフツール」 →デザイン →「テンプレートとして保存」を選ぶ。 一度、テンプレートとして保存すると、その形式のグラフを作ることができる。 「グラフの種類の変更」ボタンを押し、「テンプレート」を選ぶとよい。 ◆グラフタイトルは図下に置いた方がよい。タイトルをマウスでつかんで動かすと、位置を動かすことができる。 プロットエリア(線や棒がある部分)も、つかんで動かすことができる。 ◆線と棒の両方があるグラフを作るには ・上の図のように、男と女のデータをセルに書いてから、線が2つある折線グラフを作る。 ・片方の折線を選んで右クリックして、「系列グラフ種類の変更」を選ぶ。 ・棒グラフを選ぶ さらに、メモリの軸を2つ作るには、できた棒を選んで右クリックし、 データ系列書式設定 →系列オプション →使用する軸 として「使用する軸」を変更 ◆人口○○人当たりの数字に直すには bの列に人口が入っている場合 セルに半角英数字で =d2/b2 のように データの番地と人口の番地を入れる。 わるは / かけるは * を使う。 =d2/b2 *10000 と入れると人口1万人あたりの数になる。 ◆散布図を作る時 都道府県別データの場合、人口○○人あたりの数字や、%に直した数字を使う。 まず、数字のセルのみを選択する(文字の入ったところは選択しない)。ctrlキーを押しながら選択すると 離れた2列を選択できる。その後、画面上「挿入」→グラフ 図中に県名など説明を入れたい時 グラフを作った後に、任意の点を選んで右クリックし、データラベルを選ぶ。 表示された数字を、1回クリックして、数字は消して県名に書き換える。特徴的な県を10ほど書くと良い。 あるいは、グラフを選択して、画面上「グラフツール」→ レイアウト → テキストボックス で文字を書き込む。 エクセル散布図の場合、県名は自分で書くしかないが、以下のリンクにあるツールが使えることもある。あるいは、SPSSで散布図を作る(『SPSSによる多変量解析』pp.150- 参照)。 SPSSを起動してエクセルファイルを開く時は、あらかじめファイルの1行目のみを変数名にし、余計な文字などは削除しておく。4.10.発展編
1)データを並べ替える(ソートする)と、男女別の平均値などを分析できる。 データファイルのQ32S1(問32の性別)の列を見ると、1と2が混ざっている。 エクセルで画面上の「データ」をクリックし「並べ替え」を選ぶと、データの上半分が1、下半分が2、などに並べ替えることができる。 2)度数分布を出す(回答内容の単純集計、FREQUENCY関数の使用) エクセルで単純集計を作る(度数分布表を出す)こともできる。 あらかじめ、集計の単位となる数字を、適当なセルに書いておく。例えば、変数の単位(回答内容の選択肢)が1,2,3,4ならば、 縦に連続した4つのセルの中に、上から順に1、2、3、4と以下のように書いておく。この際、無回答9や、予想外の回答も あるので、1、2、3、4、9と書いた方がよい。 まず、1、2、3、4、9と書いたセルの、すぐ右隣のセルを5つマウスで選ぶ。 次に、画面上の「数式」または「挿入」をクリックし、関数を選び =FREQUENCY関数を選択。 ・データ配列ボックスには、集計したいデータのセル、 ・区間配列ボックス(値の間隔)には、集計の単位を書いたセル(1、2、3、4、9と書いたセル)を選択。 最後に、CTRL+SHIFT+ENTERを押す(あるいは、CTRL+SHIFTを押しながらOKボタンを押す)。これがこつ。 データ分析とは、実際には、このようなデータ行列の分析を行っているのである。 エクセルなどの表計算ソフトでも基本的な分析ができる。より高度な分析には、SAS、SPSSなどのデータ分析ソフトを用いる。
◆エクセルを用いた分析 資料PDF ここをクリック
上記のエクセルのデータファイルで、グラフや、202行以下にある内容はすべて削除し、調査結果のデータファイルを名前をつけて保存。
1行目は変数、あとは回答結果のみ、というデータファイルができる。
SPSSの起動
スタートボタンを押し、プログラム・統計→IBM SPSS
最初に出てくるメニュー画面は「キャンセル」にする
SPSSの画面で、ファイル→開く→データ
ファイルの種類はエクセルにする
先ほど作ったデータファイルを開く。
ファイルを開いたら、エクセルと似たようなデータ画面(下にデータビューと変数ビューがある)が出る。200人なら200行ある。
データウィンドウや、分析結果が出る出力ウィンドウがある。画面上の「分析」をクリック
→記述統計→度数分布か、クロス集計などを選ぶ。
自分の好きな変数を入れて、OKボタンを押す。
クロス集計では、1つのボックスに自分の好きな変数と、別のボックスに性別変数など入れて、セルボックスは、行か列か、どちらかの%のみを選び、OKボタンを押すとよい。
参考リンク
エクセル散布図のラベル用ツール
S7code.pdf コード解説
S7hokoku.pdf 調査結果のお知らせ
仮説構築について討論と書き込み 調査員の手引きについて書き込み 調査票を作成しVコーラスで提出など 後ほどやります
★調査票の見本は、冒頭の「練習用の各種データ」ページを見てください。PDFなどがあります。
★調査企画書の見本ファイル
調査準備には、よい企画書を書いて、周囲とよく相談することが重要です。
★調査依頼状の見本ファイル
回収率をあげるためには、適切な依頼状を対象者の方にお渡しすることも重要。この例は郵送調査で世帯に送る場合の文書。
★調査費用の計算用エクセルファイル
費用を計算するためのエクセルファイル
★必要標本数nと誤差範囲の求め方エクセルファイル
公式を簡単に計算するためのエクセルファイル。
エクセルファイルは、リンクを右クリックして「対象ファイルを保存」としてください。
調査の標本数nは、誤差を5%ほど認める場合、400人程度となります(母集団人口により少し変わるが385人前後)。ただし、現実の調査では、結果を男女別に分析したい場合、800は必要なのです。また、当然ながら、男女別や年齢別の分析をすることは多いので、1600は必要となります。回収率が5割ならば、さらにこの倍3200人が必要です。理想的にはこのくらいのサンプル数はほしいところです。
なお、統計的検定の際の帰無仮説とは、簡単に言うと、原因と結果が「無関連」という意味の仮説である。
統計的検定とは、分析の初歩である。これは、関連の有無を見ているだけで、関連の大きさについては言及していない。有無について、1,0で考えると言って良い。関連の大きさについては、検定以外の方法で分析することになる。
質問をいくつか作ろうとしても、基礎項目以外は、なかなかうまく作れないこともある。そのような時は、まず、いくつかの仮説を考えてみるとよい。その上で、必要な質問項目の候補について、自由にアイデアメモを書いてみると良いだろう。また、安田・原『社会調査ハンドブック 第3版』の中には、質問文例が豊富にあり、参考になる。
回収率を上げるためには、とくに以下のことに注意すること。
1)事前に対象者へお願い状(依頼状)を送る
対象者の選び方、調査主体、調査の目的や趣旨、意義等を丁寧に説明。これらを説明していない依頼状は多い。対象者の選び方を詳しく書かないと、なぜ住所を知ったのか、という苦情電話がたくさんくる。
白やクリーム色の紙に角印を押し、固い文書で挨拶分などもきちんと書くと印象がよく信用がある。上記各種資料の依頼状ファイルを参照。
できれば手書きで挨拶を少しでも、書き添えると良い。
大学の封筒で、連絡先をきちんと書き、インチキ調査でなく、調査主体が大学だということを分かってもらえるように。
電話の他、Eメールやホームページアドレスを書いても良い。電話の担当者名も書くと信用が上がる。
2)調査員配置
賃貸アパートが多い場所や、土日の夜は、調査員を多めに配置する。
できれば男女1組で。女性は郊外の安全な住宅地が良い。
3)調査員への指示
不在のお宅には、繰り返し何度も訪問することを徹底させる。
4)調査本部を設置
調査員へ連絡、苦情受け付け、事故待機、現場を巡回。
何人かで調査現場を巡回し、調査員の様子を見て励ますとよい。
5)調査票に書く調査名称は、なるべくやわらかい感じの、分かりやすいものにする。研究企画時とは別の名前でよい。難しい名前だと、自分にはとてもできない、という回答者の反応が多く、回答拒否が増える。
調査が終わったら、結果を数字のファイルにすれば、SPSSなどの分析ソフトで 簡単に分析できる。 以下の例のように、半角数字のみを入れる。数字のみを入れると、 エクセルやSPSSに数字を入力するよりのとくらべ、半分以下の時間ですむ。 注意点 半角数字のみを入れる。全角空白や余計な改行は入れないよう注意。 その点に注意すれば、とくに難しいところはない。 改ページごとに半角空白を1つ入れる(分かりやすくするためでとくに意味はない)。 データの形式見本(2人分) 1101 32400232 10100011 110113110 22099 9621 4317 1102 13101421 11212111 121114112 12299 9631 4317 この例だと、はじめの4桁はサンプル番号。その後、問1で3、問2で2、 問3で4と答えている。 その他注意点 ・複数回答項目(Multiple Answers)は、○がついているものは1、ついていなければ0と入力 例えば、234に○の場合、0111000 と入力 ・無回答は9または99を入力 ・ワードやメモ帳など何で入力しても良いが、保存時はテキストファイル形式で保存する。 保存時に「名前をつけて保存」を選び、保存形式ボックスをクリックして形式を選択する。 ★入力が終わったら、数字の打ち間違いがないか確認してミスを修正する(データクリーニング)。 2人1組で、調査票の数字を読み上げて、ファイルの数字と合っているか確認するとよい。 ★もっともよいのは、データチェック用のソフトを使うことである。詳しくは以下を参照。応用調査実習 データ入力解説
おまけ 期末試験正解
問1 「少数派」に対して調査 誤差範囲 予備サンプル 予想される結果 コーディング
標本数(サンプル数) 「層化」抽出法 (関係者に)挨拶 深層心理 予備調査(プリテスト)
問11日常の行動と特定の行動の質問文 問12威光暗示効果の質問文 −テキスト参照のこと
おまけ 去年の期末試験正解
問1 説明変数と被説明変数 問2 95% 従業上の地位 母集団 エディティング プライバシー 人口 代表性 キャリーオーバー
問10以降 略