グローバル旅行の規制緩和などに伴って、Airbnbで宿泊先を探している方は多いでしょう。旅行計画は楽しいものですが、1件ずつクリックして宿情報を確認するのはなかなか骨の折れる作業ですね。そこで注目してほしいのが、Webスクレイピングを使って宿情報を一気に収集する方法です。
Octoparse(オクトパス)を使えばプログラミングは一切不要なので、誰でも簡単に情報収集できます。しかも、Airbnbのテンプレートが用意されているので目的地を入力するだけで、数百の宿情報を自動的に収集してくれます。
それでは、Airbnbテンプレートの使い方を図解付きでご紹介します。
Octoparse(オクトパス)とは?
Octoparseは世界中で利用されているWebスクレイピングツールです。
Webスクレイピングとは、インターネット上にあるさまざまな情報を自動的に収集できる技術です。本来、Webスクレイピングを行うにはプログラムを作る必要があるのですが、Octoparseがあればノンプログラミングで誰でも簡単にWebスクレイピングを行えます。
Airbnbの宿情報を収集する場合、Octoparseにはテンプレートが用意されているのでわずか3回のクリックと、1回のキーワード入力だけでWebスクレイピングを実行できます。
驚くほど簡単にWebスクレイピングを行えるので、プログラミングに触れたことがない方もぜひ実践してみてください。
Airbnbで宿の情報をリスト化する方法
それでは、OctoparseでAirbnbテンプレートを使用し、宿情報の自動収集方法をご紹介します。
今回収集するのは、軽井沢の温泉宿の情報です。ただし、注意点が1つあります。Airbnbテンプレートでは「温泉付きの宿」という条件を指定したWebスクレイピングが行えないため、軽井沢の宿情報をすべて揃えてから、温泉付きの宿があるかどうかをチェックしていきます。
https://www.octoparse.jp/template/airbnb-jp-hotel-details-scraper
ステップ1. Airbnbテンプレートを実行する
Octoparseを起動したら、最初に表示されたページにある検索欄に「airbnb」と入力します。直後にAirbnbテンプレートの候補が表示されるので、その中から「Airbnb宿泊情報」を選択します。
次に表示されたページでテンプレートをクリックします。
このページでは、「サンプルデータ」タブをクリックするとどのような情報を収集するのか事前に確認できます。ちなみにAirbnbテンプレートで収集する情報は次の通りです。
- 宿のタイトル
- 星総合評価
- 宿のレビュー件数
- 宿の住所
- 画像のURL
- 宿の詳細
- 宿の価格
- チェックイン時間
- チェックアウト時間
- 喫煙可否
- ペット同伴の可否
- パーティーの可否
- キャンセルポリシー
- 宿ページのURL
- 返金のポリシー
次に表示されたページでは、情報収集したい旅行先の地名を入力します。「Keyword(1-100)」に地名を入力したら、「実行」をクリックします。
キーワードは同時に100件まで設定できるため、旅行先候補が複数ある場合はすべて入力しておきましょう。
タスクの実行方法を選択するページが表示されるので、ローカル抽出の「通常モード」をクリックします。
これでタスク実行は完了です!本当に簡単ですね。クラウド抽出は有料プランで実行可能になり、収集した情報をすべてクラウド上に保存してくれます。
ステップ2. データをエクスポートして温泉宿を調べる
今回は300件の宿情報を約48分で収集できました。Webスクレイピング実行中はPC画面に張り付いていなくても大丈夫なので、好きなことをして待ちましょう。
Webスクレイピングが終了したら、「実行が完了しました!」と表示されるので「データをエクスポート」をクリックします。
次に任意のファイル形式を選択し、「はい」をクリックします。
そして、保存したデータファイルの体裁を整えたものがこちらです。
セルの幅や高さ、色を調整すると情報が見やすくなります。また、特定の宿情報を検索しやすくするためにフィルタも設定しておきましょう。では、今回収集した軽井沢宿の情報から、温泉付きの宿があるかどうかを確認してみます。
「温泉」のキーワードが含まれるタイトルは27件ヒットしました。このうち、温泉付きの宿は9件でした。
Webスクレイピングの実行時間も含めここまでの所要時間はわずか60分!Airbnbに掲載されている宿情報の中から、温泉付きの宿を探すことができました。
Airbnbで直接検索した方が早いんじゃないの?
Octoparseを使ったWebスクレイピングを見て、「Airbnbで直接検索した方が早いんじゃないの?」と思った方が多いかもしれません。
確かに、軽井沢の宿情報をすべて収集した上で、温泉付きの宿があるかどうかを確認するのは効率が悪いように思えますね。Airbnbにもフィルタ機能はありますから、それを使って調べた方が早いのではないかと考えるのは当然のことでしょう。
しかし、Airbnbで温泉付きの宿を探すには問題点があります。それは、「温泉付きの宿」のフィルタがないことです。実際に確認してみますと、「露天風呂・ジャグジー」のフィルタはあっても「温泉付きの宿」のフィルタはありません。
「それでも宿情報を53件に絞れるのだから、やっぱり早いのでは?」と考えた方も多いでしょう。しかし、もう1つの問題点があります。それは、「露天風呂・ジャグジー」のフィルタでは、表示されない温泉付きの宿があることです。
Airbnbの「露天風呂・ジャグジー」のフィルタで確認できた温泉付きの宿は7件なのに対し、先ほど実行したWebスクレイピングでは9件確認でした。実際に、こんなに好条件で評価も高く、スペシャルオファーまで付いた宿を見逃してしまいます。
Airbnbのフィルタ機能を使えば条件を絞った検索ができますが、温泉付きの宿のように一部対応していないフィルタがあります。限られた時間の中で最高の旅行を計画するためには、宿情報を漏れなく収集し、それらの中から希望する条件に最も近い宿を選ぶことが大切です。
Octoparseを利用すれば、Webスクレイピングを実行して目的の宿情報を漏れなく収集できます。
また、条件を指定しない場合は数百件もの宿情報を簡単にリスト化できるため、やはり宿情報を効率よく収集するにはWebスクレイピングが欠かせませんね。
まとめ
Airbnbなどの予約サービスで1件ずつ確認するのも良いかもしれませんが、Octoparseがあれば大幅な時間短縮になるだけでなく、情報の漏れも防げます。とくにAirbnbのフィルタ機能で正確に指定できない条件で検索したい場合は、Octoparseが大いに役立ちます。
Octoparseは無料から始められるWebスクレイピングツールなので、本記事を読んで気になったという方はぜひご登録してみてください。無料プランでもデータを収集できるため、さまざまな分野でWebスクレイピングを実行できます。