logo
languageJPdown
menu

Airbnbの宿泊データをスクレイピングする方法

約6分で読めます

グローバル旅行の規制緩和などに伴って、Airbnbで宿泊先を探している方は多いでしょう。旅行計画は楽しいものですが、1件ずつクリックして宿情報を確認するのはなかなか骨の折れる作業ですね。そこで注目してほしいのが、Webスクレイピングを使って宿情報を一気に収集する方法です。

Octoparse(オクトパス)を使えばプログラミングは一切不要なので、誰でも簡単に情報収集できます。しかも、Airbnbのテンプレートが用意されているので目的地を入力するだけで、数百の宿情報を自動的に収集してくれます。

それでは、Airbnbテンプレートの使い方を図解付きでご紹介します。

Octoparse(オクトパス)とは?

Octoparseは世界中で利用されているWebスクレイピングツールです。

Webスクレイピングとは、インターネット上にあるさまざまな情報を自動的に収集できる技術です。本来、Webスクレイピングを行うにはプログラムを作る必要があるのですが、Octoparseがあればノンプログラミングで誰でも簡単にWebスクレイピングを行えます。

Airbnbの宿情報を収集する場合、Octoparseにはテンプレートが用意されているのでわずか3回のクリックと、1回のキーワード入力だけでWebスクレイピングを実行できます。

驚くほど簡単にWebスクレイピングを行えるので、プログラミングに触れたことがない方もぜひ実践してみてください。

Airbnbで宿の情報をリスト化する方法

それでは、OctoparseでAirbnbテンプレートを使用し、宿情報の自動収集方法をご紹介します。

今回収集するのは、軽井沢の温泉宿の情報です。ただし、注意点が1つあります。Airbnbテンプレートでは「温泉付きの宿」という条件を指定したWebスクレイピングが行えないため、軽井沢の宿情報をすべて揃えてから、温泉付きの宿があるかどうかをチェックしていきます。

https://www.octoparse.jp/template/airbnb-jp-hotel-details-scraper

ステップ1. Airbnbテンプレートを実行する

Octoparseを起動したら、最初に表示されたページにある検索欄に「airbnb」と入力します。直後にAirbnbテンプレートの候補が表示されるので、その中から「Airbnb宿泊情報」を選択します。

次に表示されたページでテンプレートをクリックします。

このページでは、「サンプルデータ」タブをクリックするとどのような情報を収集するのか事前に確認できます。ちなみにAirbnbテンプレートで収集する情報は次の通りです。

  • 宿のタイトル
  • 星総合評価
  • 宿のレビュー件数
  • 宿の住所
  • 画像のURL
  • 宿の詳細
  • 宿の価格
  • チェックイン時間
  • チェックアウト時間
  • 喫煙可否
  • ペット同伴の可否
  • パーティーの可否
  • キャンセルポリシー
  • 宿ページのURL
  • 返金のポリシー

次に表示されたページでは、情報収集したい旅行先の地名を入力します。「Keyword(1-100)」に地名を入力したら、「実行」をクリックします。

キーワードは同時に100件まで設定できるため、旅行先候補が複数ある場合はすべて入力しておきましょう。

タスクの実行方法を選択するページが表示されるので、ローカル抽出の「通常モード」をクリックします。

これでタスク実行は完了です!本当に簡単ですね。クラウド抽出は有料プランで実行可能になり、収集した情報をすべてクラウド上に保存してくれます。

ステップ2. データをエクスポートして温泉宿を調べる

今回は300件の宿情報を約48分で収集できました。Webスクレイピング実行中はPC画面に張り付いていなくても大丈夫なので、好きなことをして待ちましょう。

Webスクレイピングが終了したら、「実行が完了しました!」と表示されるので「データをエクスポート」をクリックします。

次に任意のファイル形式を選択し、「はい」をクリックします。

そして、保存したデータファイルの体裁を整えたものがこちらです。

セルの幅や高さ、色を調整すると情報が見やすくなります。また、特定の宿情報を検索しやすくするためにフィルタも設定しておきましょう。では、今回収集した軽井沢宿の情報から、温泉付きの宿があるかどうかを確認してみます。

「温泉」のキーワードが含まれるタイトルは27件ヒットしました。このうち、温泉付きの宿は9件でした。

Webスクレイピングの実行時間も含めここまでの所要時間はわずか60分!Airbnbに掲載されている宿情報の中から、温泉付きの宿を探すことができました。

Airbnbで直接検索した方が早いんじゃないの?

Octoparseを使ったWebスクレイピングを見て、「Airbnbで直接検索した方が早いんじゃないの?」と思った方が多いかもしれません。

確かに、軽井沢の宿情報をすべて収集した上で、温泉付きの宿があるかどうかを確認するのは効率が悪いように思えますね。Airbnbにもフィルタ機能はありますから、それを使って調べた方が早いのではないかと考えるのは当然のことでしょう。

しかし、Airbnbで温泉付きの宿を探すには問題点があります。それは、「温泉付きの宿」のフィルタがないことです。実際に確認してみますと、「露天風呂・ジャグジー」のフィルタはあっても「温泉付きの宿」のフィルタはありません。

「それでも宿情報を53件に絞れるのだから、やっぱり早いのでは?」と考えた方も多いでしょう。しかし、もう1つの問題点があります。それは、「露天風呂・ジャグジー」のフィルタでは、表示されない温泉付きの宿があることです。

Airbnbの「露天風呂・ジャグジー」のフィルタで確認できた温泉付きの宿は7件なのに対し、先ほど実行したWebスクレイピングでは9件確認でした。実際に、こんなに好条件で評価も高く、スペシャルオファーまで付いた宿を見逃してしまいます。

Airbnbのフィルタ機能を使えば条件を絞った検索ができますが、温泉付きの宿のように一部対応していないフィルタがあります。限られた時間の中で最高の旅行を計画するためには、宿情報を漏れなく収集し、それらの中から希望する条件に最も近い宿を選ぶことが大切です。

Octoparseを利用すれば、Webスクレイピングを実行して目的の宿情報を漏れなく収集できます。

また、条件を指定しない場合は数百件もの宿情報を簡単にリスト化できるため、やはり宿情報を効率よく収集するにはWebスクレイピングが欠かせませんね。

まとめ

Airbnbなどの予約サービスで1件ずつ確認するのも良いかもしれませんが、Octoparseがあれば大幅な時間短縮になるだけでなく、情報の漏れも防げます。とくにAirbnbのフィルタ機能で正確に指定できない条件で検索したい場合は、Octoparseが大いに役立ちます。

Octoparseは無料から始められるWebスクレイピングツールなので、本記事を読んで気になったという方はぜひご登録してみてください。無料プランでもデータを収集できるため、さまざまな分野でWebスクレイピングを実行できます。

クリックだけでウェブ データを取得
無料ダウンロード

人気記事

トピックを検索する

今すぐOctoparseを始めて、業務効率化を実現しましょう。

ダウンロード

関連記事

  • avatarMiyashita
    京都のような、歴史的建造物と紅葉を同時に楽しめる観光地は世界でも数えるほどしかありません。今回は、そんな京都の紅葉シーズンにおけるホテルリストをBooking.comから取得する方法をご紹介します。WebスクレイピングツールのOctoparse(オクトパス)を使えば誰でも簡単にBooking.comからホテルリストを取得できるので、ぜひ実践してみてください。
    2024-06-25T11:12:02+00:00 · 6 min read
  • avatarTakahashi
    プログラミング経験を持たない方でもかんたんにトリップアドバイザーのホテル情報をスクレイピングする方法を解説します。定期的にデータを更新し、価格の変動やトレンドを把握することが可能です。
    2023-07-17T11:26:45+00:00 · 5 min read
  • avatarTakahashi
    コロナウイルスの拡大により、旅行業が大きくダメージを受けました。旅行業界も自らの変革を求めています。ビックデータとデジタル化が急速に発展している今日に、多くの人が旅行業のDX化に関心を払いました。本記事では、DXの概念とメリットを明らかにした上で、現在日本国内の旅行業DX化のあり方と行き方をめぐって展開します。最後のところに、旅行業DX化の推進に役に立つoctoparseのサービスを紹介させていただきます。
    2023-05-04T17:51:31+00:00 · 7 min read
  • avatarOctoparse
    旅行業の発展に伴い、世界にはBooking.com、TripAdvisor.com、Airbnb.comなど、日本にはJTB、HIS​のオンライン旅行代理店が急速に上場しています。この記事では、Booking.comを例に挙げて、自動スクレイピングツールを使ってホテルのWebクローラーを構築する方法を説明します。
    2021-03-23T00:00:00+00:00 · 5 min read