JavaScript勉強会

JavaScriptの学習日記

Amazonの商品カテゴリー情報 最上位のブラウズノード

Amazonの商品データを取得する方法をメモ。

 

jsstudy.hatenablog.com

 

今回は、商品カテゴリーを取得する下準備です。

 

用語・予備知識

アソシエイト・セントラル - ヘルプ

ブラウズノード(Browse Node)

Amazonではお客様が商品を簡単に探すことができるよう、各カテゴリの商品を階層別に細分化しており、それぞれに固有のサブカテゴリ名およびIDを設定し、それらを「ブラウズノード」と総称しています。

現在ブラウズノードの一覧は公開しておりません。 

 

f:id:jsstudy:20180924172623p:plain

(via Browse Nodes - Product Advertising API

 

  • 各カテゴリーは、「ブラウズノード」と呼ばれています。
  • 各カテゴリーには、「ブラウズノードID」という背番号が割り振られています。

 

(例)

SearchIndex:Shoes

ブラウズノード名:シューズ&バッグ

ブラウズノードID:2016926051

 

  • カテゴリーのデータ構造は、親ノードに子ノードがぶら下がる形の「階層構造」(木構造)になってます。
  • 1つのノードが複数の親ノードを持つ「重複」もたまにあるようです。(結構適当?)
  • ブラウズノードの情報は、API経由で取得できます。

 

最上位のブラウズノードID一覧

Amazonの商品は、本や家電製品など、たくさんの種類がありますね。

カテゴリーの一番上の親玉(最上位のブラウズノード / top-level browse node)について、押さえておきましょう。

 

(参考)

qiita.com

 

https://images-na.ssl-images-amazon.com/images/G/09/associates/paapi/dg/index.html?BrowseNodeIDs.html

ブラウズノード ID

次の表は、サーチインデックスと国ごとのブラウズノードIDを示しています。

ここに示すのは、最上位のブラウズノードのIDだけです。

これ以外のブラウズノードIDを取得するには、 BrowseNodeLookup リクエストを使用してください。

 

  CA DE FR JP UK US
Apparel   78689031   361245011 83451031 1036682
Automotive   78194031   2017305051 248877031 15690151
Baby   357577011 206617031 344919011 60032031 1036682
Beauty   64257031 197858031 52391051 66280031 11055981
Books 927726 541686 468256 465610 1025612 1000
Classical 962454 542676 537366 701040 505510 301668
DigitalMusic           195208011
DVD 14113311 547664 578608 562002 283926 130
Electronics 677211011 569604 1058082 3210991 560800 493964
ForeignBooks 927726 54071011 69633011 52231011    
GourmetFood           3580501
Grocery       57240051   3760931
HealthPersonalCare   64257031 197861031 161669011 66280031 3760931
Hobbies       133321861    
HomeGarden   10925241     11052591 285080
HomeImprovement       2016930051    
Industrial           228239
Jewelry   327473011 193711031 85896051 193717031 3880591
Kitchen 2206275011 3169011 57686031 3839151 11052591 1063498
Lighting   213083031 213080031   213077031  
Magazines   1198526       599872
Merchants           493964
Miscellaneous           10304191
MP3Downloads   77256031 206442031   77198031 195211011
Music 962454 542676 537366 562032 505510 301668
MusicalInstruments           11965861
OfficeProducts   16291311 192420031   560800 1084128
OutdoorLiving   10925051     11052591 1063498
PCHardware   569604       493964
PetSupplies           1063498
Photo   569604       493964
Shoes     215934031 2016927051    
Software 3234171 542064 548012 637630 1025614 409488
SoftwareVideoGames 3323751 541708 548014   1025616  
SportingGoods   16435121   14315361 319530011 1079730
Tools         11052591 468240
Toys   12950661 548014 13299551 712832 493964
VHS 962072 547082 578610 561972 283926 404272
Video 962454 547664 578608 561972 283926 130
VideoGames 110218011 541708 548014 637872 1025616 493964
Watches   193708031 60937031 331952011 595312 1079730
Wireless           508494
WirelessAccessories           13900851

 

この一覧表で「JP」の列が、日本の最上位ブラウズノードIDです。

ここからたどれば、その下にぶら下がっている子ノードの情報が取得できます。

 

以前、API経由でクロールしたときは、約2万5000件のノードIDがありました。

(最新のデータなら、もっと増えてると思われます。)

 

以上、Amazonの商品カテゴリー情報、「最上位のブラウズノード」(top-level browse node)に関する予備知識でした。

(次回は、API経由でブラウズノード情報を取得する方法をまとめたいと思います。)

  

 

スラスラわかるPHP

スラスラわかるPHP