SEO(Search Engine Optimization)とは、日本語で「検索エンジン最適化」と呼ばれ、特定のキーワードで検索された際に、意図的に特定のWebページを上位表示させる施策のことです。
Googleなどの検索エンジンには独自のアルゴリズムがあり、そのアルゴリズムに合わせて最適化を施すことで、自社のWebページはもちろん、ブランド・商品・サービスの認知獲得に貢献します。
しかし、Googleは定期的にアルゴリズムを見直しており、SEOは年々難易度が高まっています。そうした中、どのように自社WebサイトのSEOを改善していけば良いのでしょうか?ここでは、SEO最適化に役立つ「Webスクレイピング方法」を3つ紹介します。
1、XMLサイトマップの最適化
①XMLサイトマップとは?
XMLサイトマップとは、Webサイト内の各ページのURL、最終更新日、更新頻度などを記述したXML形式のファイルです。Googleアルゴリズムは、XMLサイトマップに記述されているURLを参考にWebサイトをクロールします。したがって、優れたXMLサイトマップは、「最新」、「正確」、「インデックス可能」などの要素を含むことが必要です。
XMLサイトマップを最適化する目的は、Googleクローラー(検索ロボット)に、サイト内を効率的に巡回させるためです。それによって、自分のWebサイトのランキングを改善することが可能です。
特に、中規模のWebサイトを管理する場合は、非常に大きな役割を果たしています。例えば、shopify(ショッピファイ)を使ってECサイトを運営している場合や、worldpress(ワードプレス)で個人ブログを運営している場合は、検索表示順位の向上に役立ちます。
②XMLサイトマップを最適化する方法
ある程度Webスクレイピングの学習経験があれば、Webスクレイピングツールの「Screaming Frog(スクリーミングフロッグ)」を聞いたことがある方も多いでしょう。Screaming Frogの主な特徴は、ドメインの下にあるすべてのWebページから、タイトル、メタディスクリプション、キーワードなどのメタデータを自動的に抽出します。
特にXMLサイトマップを最適化する際は、Screaming FrogのXMLサイトマップジェネレーターを使えば、スクレイピングしたWebサイトのHTML全体をExcelにエクスポートし、最適化に繋げられます。
この他にも、無料で使えるWebスクレイピングツールとしてOctoparse(オクトパス)がありますので、XMLサイトマップ作成にチャレンジしてみてください。
2、Webページの最適化
Webページを最適化する目的としては、GoogleのロボットにWebサイトのコンテンツを素早く読み取らせ、インデックスしてもらうことです。
また、Webサイトを訪れたユーザーの好みに合わせて、最適なコンテンツを表示させるという目的もあります。コンテンツ内容の他に最も重要な要素はH1タグです。GoogleのWebクローラーはH1タグをページのコアとしています。
①H1タグとは
H1タグとは、Webサイトの見出しを示すHTMLタグのことです。SEO対策専門家のNeil Patel(ニール・パテル)も「H1はページ上で最も視覚的に目立つコンテンツであり、最も重要なSEO機能である」と述べています。H1タグは、ページの内容をGoogleに伝え、アルゴリズムがどの用語でランキングを決定するか判断できるようにします。
したがって、Webページの検索順位を向上させる最も簡単な方法は、定期的にタグを見直すことです。小さな改善を積み重ねることで、強力な効果をもたらします。H1タグの作成ルールは次のとおりです。
- H1は1つだけ使用する
- H1はページのトピックを説明する
- H1は20〜70文字に設定する(同じH1タグとタイトルタグを使用する場合は30〜40文字に留める)
- H1タグを目立たせる(視覚的要素、書式設定要素、スタイル要素を使用する)
- 優れたユーザーエクスペリエンスを提供するH1を作成する
- ロングテールキーワードを使用する
- H1でユーザーの意図に答える
②Webスクレイピングを使ったタグデータの取得方法
Webページ上のタイトルタグとメタデータを自動的に取得できます。まずは、最新のOctoparseをダウンロードして、お使いのコンピューターにインストールしてください。
これからOctoparseでどのように必要なタグを抽出する方法を示していきます。
- Windows版をダウンロード:https://www.octoparse.jp/Download/windows
- Mac版をダウンロード:https://www.octoparse.jp/download/mac
ステップ1:Octoparseを起動し、調査したいWebページのURLを入力します。入力したら「抽出開始」をクリックします。ここでは、Octoparseブログ(https://www.octoparse.jp/Blog)を入力します。
ステップ2:Octoparseの内蔵ブラウザで、Webページが開きます。
ステップ3:ワークフローを生成する
「操作ヒント」から「Webページを自動識別する」を選択します。すると、データ表示欄に抽出データ候補が自動的に表示されます。
続いて、再び「操作ヒント」から、ページネーションを設定するにチェックを入れ、「ワークフローを生成」を選択します。すると自動的にスクレイピングのワークフローが作成されます。
ステップ4:抽出するデータおよびワークフローをチェックして問題がなければ、操作ヒントの「保存して実行する」もしくは画面右上の保存・実行ボタンをクリックします。
数分程でデータ抽出が完了します。抽出したデータはExcel、csv、HTMLあるいは、その他のデータベース形式でエクスポートできます。これらのデータを分析をすればWebページの最適化ができます。
例えば、ページごとタイトルタグを一覧化したり、ディスクリプションの抜け漏れをチェックすれば、効率的に改善すべきWebページを見つけることが可能です。
3、ブログコンテンツの最適化
魅力的なコンテンツ発信を続けることで、徐々にWebページにユーザーが集まり、記事を拡散してくれたり、コンバージョン獲得(購入・成約)に繋がります。ユーザーに役立つ良質なコンテンツ配信はSEOの基本であり、Googleはユーザーに最適な検索体験を提供するために検索アルゴリズムを改良し続けています。
つまり特定のキーワードに対して、GoogleがどんなWebページを検索上位に表示させているかを読み解き、その上で自分たちのコンテンツに不足している情報を加えていきます。そのようにして最適化されたブログコンテンツは次第に検索順位が上がり、結果的に集客力向上に貢献するでしょう。
①ブログコンテンツの最適化方法
Webスクレイピングを使って、RSSからタイトルなどの情報を取り出すことができます。
RSSとは「Rich Site Summary」の略で、登録したWebサイトの最新情報や更新情報を自動配信する機能です。
RSSを活用すれば、インターネット上に公開されている複数のWebサイトから、関連したコンテンツを自動的に収集・配信できます。例えば、法律問題をテーマにしたブログを公開している場合、RSSを使えば、法律にまつわる最新情報収集・配信が可能になります。
OctoparseのようなWebスクレイピングツールを使えば、RSSから簡単に情報を抽出できます。
②Octoparseでスクレイピングを行う際の注意点
Octoparseを使用してWebページをスクレイピングする場合、「XPath」は重要な役割を果たします。しかしながら、Webページごとに構造が異なるため、Octoparseが自動識別したXpathではすべてのWebページをスクレイピングできません。
もし必要なデータが抽出できない場合は、Xpathを修正する必要があります。XPathの設定は難しく感じるかもしれませんが、やり方を覚えれば簡単です。XPathの基本や設定方法を詳しく知りたい方は、以下の記事をご覧ください。
まとめ
Webスクレイピングは、Webページ上に存在するデータ収集を効率化するのに非常に役立ちます。特にOctoparseのようなWebスクレイピングツールはプログラミングも不要なので、特別なITスキルを持たない方でも簡単にWeb上のデータ抽出を行えます。
新しいスキルを習得するベストな方法は「まずは実際に体験してみること」です。Octoparseでは初めての方でも安心して操作ができるチュートリアルや、わずか数クリックでスクレイピングを実行できるテンプレートが豊富に備わっています。ほとんどの機能が無料から使えるので、Webスクレイピングに興味がある方は、早速ダウンロードしてみてください。
原作者:Shinz