卒業論文や、研究活動における論文の作成において、信頼性の高いデータにもとづいた考察が重要です。しかし、それらのデータを集めるには、手間と時間が掛かるため、効率化を図りたいと考える方も多いでしょう。
本記事では、論文、研究、レポート作成に必要なデータ収集方法を詳しく解説します。学生や研究者の方はぜひ参考にしてください。
卒論、研究、レポート、論文作成でデータを集める理由
データ収集は卒論や研究、レポート、論文の成功に直結する重要なステップです。データは結論の信憑性を高め、論理的な議論を構築するための基盤となります。データを集める主な理由を詳しく解説します。
信頼性のある結論を導くため
信頼性のあるデータは、研究の結論が正確であることを保証します。適切なデータを集めることで、研究の結果が再現性を持ち、他の研究者や読者にとって信頼できるものとなります。
例えば、統計データや実験結果など、客観的な数値や事実を用いることで、主張が科学的に裏付けられることになります。信頼性のあるデータは、疑問や反論に対する強力な証拠となり、研究の信憑性を高めるための重要な要素です。
論理的な議論を支えるため
データは論文の中心を成す議論を支える重要な要素です。具体的なデータを引用することで、主張を強化し、論理的な一貫性を保つことができます。
例えば、社会科学の研究では、アンケート調査の結果やインタビューの内容を具体例として示すことで、理論的な枠組みを実証的に支えることが可能です。また、複数のデータソースからの情報を組み合わせることで、多角的な視点から議論を展開し、読者に対して説得力のある主張を提示することができます。
誤った情報を避けるため
信頼できるデータを集めることは、誤った情報や偏った結論を避けるためにも重要です。信頼性の低い情報源からのデータを使用すると、研究全体の信頼性が損なわれる可能性があります。
例えば、インターネット上の未確認情報や信頼性に欠けるブログ記事などは避け、学術論文や公的機関の発表資料を活用することが推奨されます。さらに、データの収集過程においても、収集方法やサンプルサイズなどのバイアスを避けるための工夫が必要です。
適切なデータ収集方法を選択することで、研究の信頼性を高め、誤った結論に導かれるリスクを減少させることができます。
卒論、研究、レポート、論文作成する際のデータ収集の流れ
学術研究のデータ収集の流れとして、やってしまいがちなのが「使うかどうかわからない資料・文献をとにかく大量に集め、その中から使えそうなデータを抽出する」という方法です。
しかしこの方法では、本当に必要なデータを集めきれない可能性があるため、最終的に出来上がった論文は、根拠が乏しいものになる可能性が高くなります。質の高いデータ収集(インプット)が、質の高い論文(アウトプット)につながります。
それでは、どのようなステップでデータ収集を進めれば良いでしょうか。具体的には次の4ステップで進めていきます。
- テーマの決定
- キーワードの調査
- 関連資料の調査
- 資料の入手
続いて各ステップの詳細を解説します。
テーマの決定
いきなりデータ収集から始めるのではなく、まずはテーマを決めることが最優先です。学術論文のテーマとは、すなわち「知りたいことを明確にすること」です。
テーマが抽象的なままでは、その後のデータ収集の精度にも影響し、結果として論文の完成度につながります。そのため、論文を書き始める前には具体的なテーマ設定が大切です。
具体的なテーマとは、狭く・深く掘り下げるということです。たとえば、ファッションというテーマでも、ジャンル・素材・時代などがありますし、さらにジャンルでもカジュアル・モード・ラグジュアリーなどに分けられます。
テーマを決める際は、まずはどんなキーワードが考えられるかすべて書き出し、そこから一つを選んだり組み合わせたりして設定すると良いでしょう。
キーワードの調査
テーマを設定したら、テーマに関連するキーワードを情報媒体を通じて調査していきます。最も手軽なのはインターネット検索ですが、インターネット記事の中には信頼性が乏しい情報も少なくありません。
またインターネットは基本的に広く・多くの人に閲覧してもらうことを前提にしているため、情報の質として専門性に欠けるケースもあります。より専門性を求めるのであれば、事典や専門書などの書籍が有効です。
インターネットでリサーチする場合は、いつ・誰が・どんな目的で発信したかがわかるものを利用するようにし、具体的には政府機関・自治体・研究機関などの情報を優先しましょう。
このように効率よく情報収集を行うためには、目的に合った情報媒体を使い分け、それぞれの媒体の信頼性を見極めることが大切です。
関連資料の調査
学術論文で、より深い考察・洞察を得るには、テーマの直接的な情報だけではなく、関連情報を含めて広く調査します。多面的に調査することで、新しい視点や気づきを得ることができます。
関連資料を調査する方法としては主に、図書・論文・新聞記事があります。それぞれ特徴が異なるため、用途にあわせて使い分けると良いでしょう。
資料の入手
手がかりとなる資料が見つかったら、公共図書館などで蔵書を探します。図書館には蔵書検索端末が設置されているため、そこで目的の蔵書があるか確認できます。
さまざまな研究者や専門家の見解や視点を広く知ることで、自身の関心や疑問が明確になります。データ収集をしていくうちに、新たな疑問が生じることもあるので、その際は再び情報収集を行い、学びを深めていきます。
学術研究に用いる一次データと二次データの違い
学術研究では、一次データ、二次データを扱います。一次データとは、調査目的に合った方法で自分たちが独自に調査した情報のことで、二次データとはすでに公開・販売しているデータのことを指します。
それぞれ特徴が異なるため、用途に合わせて使い分けが重要です。両者の違いを以下の表にまとめています。
一次データ | 二次データ | |
情報発信者 | 自分(自社)が集めた情報 | 他者が集めた情報 |
調査の自由度 | 高い | 低い |
扱える範囲 | 自分(自社)だけが使える | 他社も使える |
情報収集に掛かる労力 | 高い | 低い |
一次データは学術研究の目的に合わせて自由に調査できるため、情報の質も自由度も高くなります。他にはない視点で得られた調査結果は、説得力の大きいものになるでしょう。
ただし、自分たちで自ら仮説を立てて調査をしなければならないため、調査に掛かる手間・時間の負担が大きい点がネックです。
一方、二次データの場合は費用を支払えば誰でも購入できますし、中には無料で公開しているデータもあります。しかし、データによっては調査目的に一致しない可能性もありますので、あくまでも補足的に使う方が望ましいでしょう。
一次データ・二次データの入手方法
一次データや二次データをどのように入手すればよいかわからない方に向けて、ここでは各データの入手方法を解説します。
一次データを入手する方法
一次データを入手する方法は、主に次が挙げられます。
- アンケート
- インタビュー
- スクレイピング
1つずつ解説します。
アンケート
アンケートは、あらかじめ質問項目が書かれたアンケートを作成し、対象者から回答を得る調査方法です。回答結果を収集することで傾向や特徴をつかむことができます。自由項目ではなく10段階評価などにすることで、定量での結果分析が可能です。
アンケートによる調査方法はいくつかの種類があります。たとえば、インターネットアンケート、電話アンケート、街頭アンケートなど回答方法は多岐に渡ります。
Googleフォームなどを用いれば、アンケートをかんたんに作成でき、URLひとつで回答を求めることができます。
インタビュー
インタビューは、対象者と対面による会話形式で行われる調査です。対象者から自由な回答を得ることができるため、より深い部分まで調査ができます。ただし、インタビューは1人に掛かる時間が長くなるため、回答母数を増やすことは難しい手法です。また母数が少ない分回答結果が属人的になりやすく、客観性に乏しい面があります。
Webスクレイピング
Webスクレイピングは、Webサイト・Webページから任意のデータだけを自動で抽出する手法です。Webスクレイパーと呼ばれるスクレイピングボットが、Webページからデータを正確かつ迅速に抽出します。
従来人間が手作業で行っていた抽出作業を自動化するため、データ収集に費やす時間・労力を大幅に削減します。Webスクレイピングは、ニュースポータル、ブログ、フォーラム、Eコマースサイト、ソーシャルメディア、不動産、財務報告、学術研究などさまざまな分野で広く使われています。
Webスクレイピングを自力で行うには、Pythonなどのプログラミングスキルの習得が必要でしたが、近年ではノーコードでWebスクレイピングを実行できる、Webスクレイピングサービスも登場しています。Webスクレイピングツールの中でも、Octoparse(オクトパス)は世界的にユーザーを抱えています。
Octoparseのメリットは、優れたUI/UXデザインにより直感的な操作だけで、Webスクレイピングを実行できるうえ、テンプレートが豊富なので選択して任意のURLをいれるだけでWebスクレイピングを実行できます。
二次データを入手する方法
二次データを入手する方法は、主に次が挙げられます。
- 図書館
- 公的な機関の公開データ
- データ購入
こちらもそれぞれ解説します。
公共図書館
公共図書館は自治体が運営している施設で、誰でも無料で利用できます。図書館には、過去の研究論文や書籍などの文献がたくさん置かれていますので、より多面的・専門的な情報を収集できます。膨大な数の蔵書から、求めるものを効率的に見つけるには、国立情報学研究所が運営する「webcat plus」がおすすめです。
webcat plusではテーマにあった図書・雑誌を見つけることができ、さらに関連キーワードから連想される書籍を探すことも可能です。
公的機関の公開データ
政府機関・国際機関・自治体・研究機関などでは、独自の調査結果を公式サイト上で公開しています。公的機関が調査・公表しているだけあって、情報の網羅性や信頼性が非常に高く、エビデンスとしても十分活用できます。
論文記事を探す際は、CiNii Researchがおすすめです。CiNii Researchは世界中の文献から、期間リポジトリ等の研究データなどさまざまな情報を検索できます。
データ・レポート購入
図書館や公的機関の公開データだけで十分なデータ収集ができなかった場合は、必要に応じて購入する方法もあります。
たとえば、矢野経済研究所では、ビジネス分野の市場規模・企業シェア・将来予測・主要プレイヤーの動向など、マクロ・ミクロの視点から総合的に調査・分析した「マーケットレポート」を販売しています。
また、OctoparseではWebスクレイピングによるデータ取得代行サービスを提供しています。自身でWebスクレイピングツールを使って上手くデータを取得できない場合は、Octoparseに依頼いただくことで、指定のデータを購入することが可能です。
抽出するサイト・データなど自由にカスタマイズも可能で、高品質なデータを短納期で納品します。
データ集めで注意すること
データ収集は重要ですが、注意すべきポイントを押さえないと、信頼性や有効性に欠ける結果を招くことになります。ここでは、データ集めの際に注意すべき点について具体的に解説します。
信頼性のある情報源を選ぶ
データを収集する際には、信頼性のある情報源を選ぶことが不可欠です。学術論文、政府機関のデータベース、信頼できる専門書など、信頼性が確立された情報源からデータを収集するようにしましょう。
例えば、Google ScholarやPubMedなどの学術データベースを活用することで、査読済みの信頼性の高い論文を手に入れることができます。また、政府機関の統計データや白書も信頼性の高い情報源として利用できます。信頼性のある情報源を選ぶことで、研究の信憑性を高め、質の高い結論を導くことができます。
データの偏りを避ける
データが偏っていると、研究結果も偏ったものになります。複数の情報源からデータを集めることで、データの偏りを避けることができます。また、収集したデータの背景や収集方法にも注意を払いましょう。
例えば、特定の年齢層や地域に偏ったデータのみを使用すると、結論が一般化できない場合があります。多様な視点や背景を持つデータを収集し、統計的なバイアスを回避するためには、サンプリング方法やデータの代表性にも細心の注意を払うことが重要です。
最新のデータを使用する
古いデータは、現状を正確に反映していない可能性があります。できるだけ最新のデータを使用することで、現時点での正確な情報を基にした結論を導くことができます。例えば、技術や社会の変化が激しい分野では、数年前のデータが既に陳腐化していることがあります。最新の研究や統計データを利用することで、現在の状況を正確に反映した分析を行うことができます。また、定期的に更新されるデータベースやリソースを利用することも、新しい情報を入手するための有効な方法です。
データの正確性を確認する
データの正確性を確認することも重要です。データが正確であるかを検証するためには、データの出所、収集方法、統計の信頼性などをしっかりとチェックしましょう。
例えば、データが第三者機関によって検証されているか、収集方法が透明で再現可能かを確認することが必要です。データの正確性を確保するためには、複数の情報源からデータをクロスチェックし、一貫性を確認することも効果的です。正確なデータを使用することで、研究の信頼性と信憑性を高めることができます。
まとめ
本記事では、論文作成・レポート作成のデータ収集を効率化したい方に向けて、データ収集の流れから具体的な収集方法まで大まかに解説しました。
学術研究をする際に大切なことは、いきなりデータを集めることから始めるのではなく、「何を知りたいのか」「どういったことを深く追求したいのか」といったように、ゴールを決めることです。狭く深く情報を集め、さらに関連した情報をつなぎ合わせることで、より示唆に富んだ考察が得られるでしょう。
考察に時間を掛けるためにも、情報収集に掛ける時間は効率化・省力化を図るべきです。Webスクレイピングを使えば、より短時間で目的の文献やデータを見つけることができますので、ぜひ活用してください。
WebスクレイピングツールのOctoparseは無料プランから使えるため、学術研究やレポート作成におすすめです。その他、学術研究におすすめのツールを知りたい方は以下の記事もご覧ください。