SHEIN(シーイン)といえば、全世界で利用者を増やし続ける中国発のオンラインファッション通販サイトです。特に女性向けのアイテムが多く、ドレスからカジュアルウェア、アクセサリーにいたるまで、ファッションに関するあらゆるアイテムを取り扱っています。
SHEINの商品掲載数は非常に多く、その数は日々変動しますが、常に新鮮な商品情報が得られます。スクレイピング技術を使って掲載データを自動収集すれば、ファッションデータベースとしても活用できます。
しかし、「スクレイピングはプログラミング経験がないと難しいのではないか?」と考える方も多いでしょう。そこで役立つのがWebスクレイピングツールです。今回は、プログラミング経験を持たない方でもかんたんにSHEINの商品情報をスクレイピングする方法を解説します。
SHEINの商品情報データを収集するメリット
SHEINには、各種ファッションアイテムの情報が掲載されており、その多様性とボリュームはオンライン通販サイトの中でもトップクラスです。これらの商品情報を収集することで、あらゆる用途に活用できます。
具体的なメリットとしては、次のようなものが挙げられます。
- トレンドの価格相場を把握できる
- 新商品のリサーチに活用できる
- 人気が高まっているアイテムを把握できる
このように、ファッション情報を大量に収集し、いわゆるビッグデータとして活用することで、商品選定や価格設定、またはマーケティング戦略の策定など、あらゆる場面で役立てることが可能です。
ただし、SHIENの掲載情報をコピー&ペーストなどの手作業で収集するのは現実的ではありません。特にファッション業界では、トレンドや商品価格が常に変動するため、なるべく短いサイクルで情報を更新し続ける必要があります。そこで、Webスクレイピングを活用すれば、商品情報を自動収集できるため、取得データを常に最新に保つことが可能です。
SHEINの商品情報を自動収集するWebスクレイピングとは
Webスクレイピングとは、コンピューター技術を使ってインターネットから特定のWebページの情報を集めることです。その仕組みは、「サイトクローラー」という名前のロボットがWebページ内を探索し、あらかじめ決めておいた情報だけを集めてくれます。
近年では、オンラインショッピングサイトが次々に登場しており、インターネット上にはファッションに関する情報があふれています。日々、新しい洋服や魅力的なアイテムが表示され、その情報量は計り知れません。
そうした中、アパレルメーカーやアパレル販売店は必要な情報を効率よく集めて、どんなアイテムを販売すれば良いかだったり商品価格をいくらに設定するかだったりと、販売計画の参考にしています。
そうした商品情報の収集にWebスクレイピングが用いられています。実際、SHEINのようなオンラインショッピングサイトにWebスクレイピングを行うことで、掲載されている洋服やファッションアイテムの情報を自動的に収集することが可能です。
Webスクレイピングについてさらに詳しく知りたい方は、以下の記事もあわせてご覧ください。
参考:Webスクレイピングとは?基本や仕組み、活用事例まで解説
IT初心者でも簡単にスクレイピングが出来るWebスクレイピングツール「Octoparse」
Webスクレイピングは、近年あらゆるビジネスシーンで活用されていますが、一般的にPythonなどのプログラミング言語を使用するため、パソコンの知識や経験がない方にとっては、やや難易度が高いと感じられるでしょう。
しかし、そうした方でも簡単にWebスクレイピングを行えるのが「Webスクレイピングツール」です。このツールを使えば、プログラミングやITの専門的な知識がなくても、ブラウザ上のマウス操作だけでスクレイピングを行えます。
Webスクレイピングツールは数多くのサービスがありますが、その中でも特に多くのユーザーに利用されているのが「Octoparse(オクトパス)」です。
Octoparseは難解なプログラミングコードを書かずに使えるだけでなく、Webスクレイピングに必要な便利な機能が数多く備わっています。そのため、誰でも効率的にWebサイト上から欲しい情報を収集することが可能です。
Octoparseの大きな特徴は、人気のあるWebサイトから情報を収集するための「テンプレート」が用意されていることです。SHEINのテンプレートを使えば、わずかな操作で商品情報を入手できます。

Octoparseを使ってSHEINのドレス情報をリストアップする方法
ここからは、実際にOctoparseを用いてSHEINの商品情報リストを作成する手順を解説します。今回は例として、「ドレス」の商品情報を抽出します。
ステップ1.Octoparseを起動しSHEINのテンプレートを選択する
Octoparseを起動させたら、ホーム画面から「テンプレートタスク」を選択します。

SHEINのテンプレートはいくつかの種類があるため、右上の検索画面で「SHEIN」と入力するとすぐに見つけられます。ここでは、「Product listing by keyword & country_Shein」のテンプレートを選択します。※SHEINのテンプレートは有料プラン会員のみ利用可能です。

テンプレートの概要や使い方が書かれた画面が表示されます。内容を確認して、「今すぐ試す」をクリックします。※英語表記なので、翻訳をしたい方はGoogle翻訳などを使用しながら確認してください。

ステップ2.スクレイピングタスクを実行する
SHEINのテンプレートを開いたら、以下の通りに入力します。
- keyword:dress
- country:Japan
※JapanのJは大文字です。日本語入力は不可となります。
入力が完了したら「保存実行」を押します。

タスク実行モードを、ローカル抽出かクラウド抽出のいずれかから選択できます。クラウド抽出は、ローカル抽出に比べてスクレイピングのスピードが早くなります。

タスクが実行されると、データ抽出が開始されます。画面の数字が動いていれば、問題なくスクレイピングが行えています。完了まで数分待ちましょう。

スクレイピングが完了すると「実行が完了しました!」という案内が表示されます。「データをエクスポート」をクリックすると、データをエクスポート(書き出し)します。エクスポート形式は、Excel、CSV、HTML、JSONから選択できます。

ここでは、「フォーマットの指定」でExcelを選択し、「はい」をクリックします。これで抽出されたデータを自動的にExcelにエクスポートできました。

まとめ
今回は、「Webスクレイピング」の基本から、WebスクレイピングツールのOctoparseを活用したSHEINの洋服情報の抽出方法を解説しました。
Octoparseを使えば、パソコンの知識・経験を持たない方でも簡単に商品情報を収集できます。さらに、あらかじめスケジュールを設定しておけば、任意のタイミングでスクレイピングタスクを実行することが可能です。定期的にデータを更新すれば、ドレスのトレンドや人気商品をよりリアルに把握できるでしょう。
WebスクレイピングツールのOctoparseは、効率的に商品リストを作成したい方に最適なツールです。無料から利用できますので、早速体感してみてください。