重要な意思決定を行う際に、データを活用して成功しているケースはたくさんあります。感情や経験則に惑わされず、データに基づいて状況を客観視して合理的な判断を行うことで、さまざまな課題を効率的に解決することができます。
「データの基づく=データドリブン」という言葉も耳にするようになり、データを活用する重要性は増してきています。本記事では、データ活用の事例についてご紹介していきます。業界ごとに事例を紹介していきたいので、ここでは不動産業界に絞って紹介していきます。
データ活用で最も重要になってくるのがデータの収集です。データがないことには活用することはできませんから、ここが最も大事になってきます。データの収集方法としては、自社データを活用する、あるいは外部から収集する、の2パターンが挙げられます。
本記事では、外部からデータを収集する方法として、ノーコードでスクレイピングが可能になるOctoparseと、プログラミング言語の1つであるPythonについてご紹介していきます。
本記事の執筆者:TAT ブログ:気ままなブログ
データ活用とは?
データ活用とは、文字通りデータを活用することです。何かしらの意思決定を行いたいとき、問題解決を図りたいとき、判断がなかなか下せないとき、こういった場面では、データを活用して意思決定に役立てることが重要になってきます。
昨今は、データドリブンという言葉も耳にするようになり、よりデータに基づいた意思決定が重要視されるようになっています。データドリブンな意思決定を行うためには、データ活用が欠かせません。データ活用のメリットはいろいろあります。
データ活用のメリット
- 合理的な意思決定ができる
- 感情や経験則やバイアスに流されない
- データを見ることで新たな視点から状況を俯瞰できる
- イノベーションが生まれる
- 業務効率・意思決定のスピードが上がる など
知らず知らずのうちに、人間の判断はさまざまなバイアスに左右されています。過去の経験に基づいて判断したら、大失敗につながってしまったというケースもよくあります。こうしたバイアスや経験則、感情などに左右されず、データに基づいて合理的に判断できるようになることがデータ活用のメリットと言えます。
また、データを活用することで、これまで考えたことのなかった発見や新しい視点から状況を俯瞰して見ることもできるようになります。常にデータ活用する文化が浸透していれば、業務効率や意思決定のスピードを向上することも可能です。
ビジネスなど、あらゆる状況判断や意思決定の場面でデータ活用はとても役立つのです。
データ収集にはスクレイピングが便利!
データ活用を行うために必ず必要になるのが、データ収集です。活用するデータがないことには何も始まりません。データ活用の流れは次の通りです。
データ活用の流れ
解決したい課題や実現したいビジョンが存在する前提で、
- データの収集・蓄積
- 何でもかんでも収集するのではなく、目的の達成に必要なデータに絞るべし
- 企業で蓄積しているデータや外部から収集したデータを利用する
- データ整形
- 目的達成に利用できるようにするためにデータを整形する
- 大体は、複数のデータを結合したり、不要データを排除したり、データを変換する、などの作業が必要になる
- データ分析、データの可視化、機械学習モデルの開発
- 意思決定を行うためにデータ分析を行い可視化する
- 場合によっては機械学習モデルも必要になってくる
- データに基づいて意思決定を行う
- 結果の検証を行いつつ改善を行う
ここで大事になってくるのは最初のデータの収集・蓄積です。データがないことには活用することはできませんから、ここが最も重要と言えます。
大体の企業は、独自のデータを蓄積しています。売上データや顧客データなどです。そういったデータを活用することは当然として、さらに外部から必要なデータを収集して活用するのも選択肢の1つになります。
外部データの収集にはいろいろな方法があります。効率的にデータを収集するならスクレイピングがおすすめです。スクレイピングとは、Web上のデータをプログラムを使って自動収集する技術のことを言います。
プログラムで収集できるので、人間が手動で集めるより遥かに高速で正確です。スクレイピングを行う方法として、ここでは2つご紹介します。ノーコードでスクレイピングが実現できるOctoparseと、プログラミング言語の1つであるPythonです。
ノーコードならOctoparseがおすすめ!
1つ目の選択肢として、Octoparseをご紹介します。Octoparseはノーコードでスクレイピングができてしまうサービスです。
なんとも便利な時代になったものです。ノーコードで利用できるので、プログラミングの知識は不要で誰でも簡単に利用することができます。とにかく早くデータが欲しい、プログラミングができる人材がいない、という場合には、Octoparseはとても良い選択肢になります。
Octoparseの特徴
- ノーコードでプログラミングの知識不要で利用できる
- 無限スクロール、ログイン、AJAXなど複雑なサイトにも対応できる
- CSVやExcelなどの形式で出力することが可能で、APIに接続すればデータベースにも保存できる
- クラウドで365日24時間自動収集が可能で生産性が向上する
- スケージュール設定が可能で、定期的にデータを収集できる
- IPアドレスを自動巡回でき、アクセス拒否を効果的に避けられる
自力で集めると大変な情報量でも、Octoparseであればノーコードでスクレイピングすることができます。無料で利用できるフリープランもあるので、興味がある方は是非ともお試しください。
自力で収集するならPythonがおすすめ!
2つ目の方法はPythonです。自力でデータ収集を行うのであればPythonがおすすめです。Pythonはデータ収集やデータ分析、データの可視化、機械学習などのAIに強いプログラミング言語です。
前述したデータ活用の流れの、1. データの収集・蓄積から3. データ分析、データの可視化、機械学習モデルの開発まで全て対応することができます。Pythonを使うことができれば、自由にデータを扱うことができるようになるのでかなり便利です。
一方で、デメリットとしては学習コストが挙げられます。プログラミングを習得するにはそれなりの時間と労力を必要とします。数日学んで習得できるみたいなスピードではなかなか厳しいので、コツコツと継続していくことが必要になります。
それでも、Pythonを習得する価値はとても大きいです。仕事で活用することもできますし、転職でも有利です。年収アップも狙えます。日々の業務効率化に利用することもできたり用途がたくさんあるので、習得しておくとかなり重宝します。
そして、社会人になってからでもPythonの習得は可能です。新たなスキルを身につけるために、タイミングが遅すぎるということは決してありません。ソースは僕です。僕は社会人になってからPythonを独学して転職に成功しました。
習得するのに時間は要しますが、得られるリターンを考慮すれば、なおかつ時間が許されるのであればPythonを習得するのは十分に価値があると自信を持って言えます。
関連記事:【これから学ぶ方へ】Pythonのおすすめ勉強法をまとめます!
データ活用の事例【不動産編】
データ活用の説明についてはここまでにして、ここからは本記事のメインである事例をご紹介していきます。冒頭でも触れました通り、本記事では不動産業界におけるデータ活用の事例をご紹介します。ビジネスでも大いに役立つので、是非ともご参考にしていただけたらと思います。
本記事でご紹介するものはほんの一例に過ぎません。データ活用の方法は無限に存在するので、解決したい課題を明確にした上で、どうやったらデータを活用して解決できるのかを考えていくことが重要になります。ここでは3つの例をご紹介します。
データ活用の事例
- 不動産データをスクリーニングして投資対象物件を探す
- 賃貸・不動産価格の時系列推移データから新規投資エリアを発掘する
- 賃貸・不動産価格の予測モデルを開発して、物件の適正価格を算出する
ここでご紹介する事例は、ビジネスでも活用できるものばかりです。すでに活用されているケースもたくさんあると思います。
賃貸・不動産価格推移を調査すれば、需要が上昇している駅や下落しているエリアを炙り出すことができます。これを基準に詳しい調査をかけるエリアや新規で投資するエリアを探し出すこともできます。
家賃や不動産価格を予測できるモデルを利用すれば、物件の適正価格を判断したり、実際の家賃と予測値の乖離率を利用してデータのエラーを検知するシステムを構築することも可能です。
それでは順番に詳しく見ていきましょう。
不動産データをスクリーニングして投資対象物件を探す
1つ目の事例は、不動産データをスクリーニングして投資対象とする物件を探すことです。
個人や企業が不動産の投資対象物件を探すにはいろいろな方法が考えられます。投資対象候補としているエリアに足を運んで探すのもありですし、大規模開発や新規の商業施設が建設予定のエリアなどに狙いを定めて調べてみるのもありです。
データを活用した探し方もその1つです。
過去の記事では、SUUMOのデータを収集して理想の賃貸物件を探してみる、という記事を書きました。こちらの記事では、SUUMOをスクレイピングして東京都の賃貸物件データを収集し、区、駅、沿線ごとの家賃データを可視化したり、賃貸物件の高い駅や安い駅をランキング形式で弾き出したりしています。
関連記事:【Pythonで不動産データ分析!】SUUMOをスクレイピングして情報収集!理想の賃貸物件を探してみた!
上記の記事で紹介しているような不動産データを収集することができると、スクリーニングして条件にマッチした物件を探したりして、個人や企業が新規で投資する物件候補を効率的に探すことができます。
例えば、同じような間取りや土地でも、他の物件よりも割安な物件などを見つけることができるかもしれません。こういった物件はチャンスがあります。さらに詳しい調査は必要と思いますが、投資候補を探すにはとても効率的です。
ここで紹介した記事では、賃貸物件情報しか収集していませんが、さらに土地の売買情報や中古マンションの情報などを収集することができればさらに効率的な探し方が見つかるかもしれません。
賃貸・不動産価格の時系列推移データから新規投資エリアを発掘する
2つ目の事例は、賃貸・不動産価格の時系列推移データから新規投資エリアを発掘することです。
個人や企業が新規で投資すべきエリアを探すにはどうしたらいいでしょうか。新たな開発が進んでいる、あるいはこれから開発が計画されているエリアに先行投資するのもいいですし、ニュースなどで需要が拡大しそうなエリアが報道されていればそこに狙いを定めるのもいいと思います。
地価の上昇率が高いエリアを狙うのもありです。いろいろな方法が考えられますが、データを使うとさらに面白い探し方ができるようになります。
そもそもニュースで報道されるようなエリアはすでに他社によって投資が進められているケースがほとんどなので、気づいた時には時すでに遅しという状況にもなりかねません。誰も気づいていないエリアをいち早く見つけ出すにはデータを活用すると効果的です。
前述したSUUMOのデータを定期的に収集しておけば、時期列データとして扱うことができます。時系列データを分析すれば、販売価格や家賃が上昇している、あるいは下落しているエリアが出てきます。こういった変化があるエリアには何かしらの要因があるはずです。
価格が上昇している地域や駅があれば、そこには新たな需要が発生しているのかもしれません。詳しく調査すれば、新しい商業施設が建設予定であるとか、何かしらの要因があるはずです。反対に、価格が下落していれば、そこには何かしらの背景や要因があるはずです。
データを普段から活用することができていると、こういった変化にいち早く気づくことができるようになります。結果、周りが気づく前に先行して投資することも可能になります。
昨今の例で言うと、コロナの影響でテレワークなどが普及したため、狭くても通勤時間の短い都心の利便性よりも、同じ家賃で家を広くするために郊外に移る需要が伸びつつあります。時期列データを見ていれば、こういった変化にもいち早く気づくことができるかもしれません。
賃貸・不動産価格の予測モデルを開発して、物件の適正価格を算出する
3つ目の事例は、賃貸・不動産価格の予測モデルを開発して、物件の適正価格を算出することです。
不動産データを収集することができると、機械学習モデルなどを開発して家賃や不動産価格の予測を行うことも可能になります。このモデルを活用すれば、例えば不動産物件の適正価格を算出することができるようになります。
実際、AIモデルを活用した不動産査定サービスや物件評価サービス(空室率の予測、販売価格のレコメンド、家賃の適正判断など)などはすでに存在しています。こういったサービスでは、不動産に関連するデータを収集して、適切な値を予測できるAIモデルを開発して活用しています。
過去の記事では、ランダムフォレストで家賃予測を行い、お買い得物件(およびぼったくり物件)を探してみました。こちらの記事では、SUUMOから収集した賃貸物件情報を活用して、家賃を予測するモデルを開発したプロセスをまとめています。
このモデルを活用して、実際の家賃と予測家賃と比較し、予測家賃よりも実際の家賃が安いお買い得物件と、その逆のぼったくり物件を弾き出しています。
関連記事:【Pythonで不動産データ分析!】機械学習(ランダムフォレスト)を用いてSUUMOからお得物件を探してみた!
ここでご紹介しているモデルは、賃貸物件データしか利用していないので、とてもベーシックなものです。それでもそれなりの精度で予測ができました。さらに土地の売買情報や商業施設、交通データなど、あらゆるデータを組み込むことができればさらにモデルの精度を向上させることが可能になります。融資などに影響するため、金利などの金融情報を加えてもいいかもしれません。
このモデルを使えば、例えば対象の物件を入力するだけで、適正な家賃や価格などが予測できるようになります。企業が活用する際には、まずAIモデルを使って、対象物件の販売価格や家賃などを算出します。
そのデータを参考にしつつ、例えばその物件にしかない設備などがあれば少し価格を上げたりして微調整すれば、経験則などによる価格設定よりかは遥かに精度が高い価格設定ができるはずです。
また、こういったAIモデルは、その他にもいろいろな用途で活用することができます。例えば、データのエラー検知です。
実際の家賃が10万円なのに対して、AIモデルで推奨家賃が100万円を示していたら、何かがおかしいということが想像つきますよね。この乖離が大きいと、そもそも表示されているデータに問題があるのではないかと疑うことができます。
実際、上記の記事では、この乖離から部屋の広さの平米数の桁が違っているというエラーを発見することができました。
SUUMOなどの情報サイトで、新たな物件情報を追加する際に、こういったエラー検知システムがあると、入力の時点でエラーに気づいて修正することができます。結果として、サイトの情報の質が向上します。入力エラーは人間がマニュアルで作業している限り不可避です。
ヒューマンエラーを完全に無くすことは不可能なので、こういったシステムを活用して事前に検知できるシステムを導入すると効果的です。AIモデルはデータの予測だけではなく、このようにエラー検知にも利用することができます。
1つのデータでも使い方によってはいろいろな用途に活用することができます。ここでご紹介した事例はほんの一部に過ぎません。データの活用方法は無限に存在します。
解決したい課題や実現したいビジョンなどがある場合、直感や経験則だけに頼るのではなく、こういったデータ活用を選択肢の1つに加えることができると、よりよい判断ができるようになるのではないでしょうか。
まとめ
いかがでしたでしょうか。ここでは、不動産業界におけるデータ活用の事例や、データの収集方法としてPythonやOctoparseについてご紹介しました。
データをうまく活用することができると、感情やバイアスに惑わされることなく、より合理的な判断をすることができるようになります。ビジネスなどの意思決定においてはとても重要になってきます。
本記事では、不動産業界に絞って事例をご紹介しました。今後、他の業界における事例も紹介していこうと思います。
ここまで読んでくださり、ありがとうございました。