下面,讓我們開始實踐
首先,我們準備好工具,在excel的文件--選項--自定義功能區--主選項卡,把開發工具打鉤。
然后進入vba編程環境
插入模塊
可以在這些模塊里面寫程式,下圖我一口氣插入了4個模塊,我在其中一個模塊上面寫入代碼即可。
然后寫入代碼(這里是截圖,在文章最后,會附上文本版的代碼)
大家注意到,在第四行,有個很長很長的一串
URL = "http://s.taobao.com/search?q=T%D0%F4&commend=all&ssid=s5-e&search_type=item&sourceId=tb.index&spm=1.6659421.754896237.1&initiative_id=tbindexz_20140301"
大家只要把這個鏈接替換掉就可以了。這個鏈接,是搜索后的結果頁。在淘寶敲入關鍵詞,然后選擇好屬性或者排序方式后,把網址貼過來,然后運行這段代碼就可以了。下圖是運行按鍵的位置。
運行后得到的結果
這段代碼的解釋,我都注釋在代碼里頭了。其實可以把這個過程寫成更加智能。網址的q=后面的T%D0%F4是T恤的uncode碼,其實只要寫多一個轉碼程序,可以直接在excel的工作表或者窗體里面輸入關鍵詞進行搜索。
另外,利用參數sort來指定排名類型,如
sort=default是綜合排名
sort=renqi-desc是人氣排名
sort=sale-desc是銷量排名
s=40是頁碼,公式是40*(頁碼-1),非常明顯,s=40就是第2頁
直接利用代碼組合網址,如http://s.taobao.com/search?q=T%D0%F4&sort=renqi-desc&s=40(復制到淘寶看下結果哦)
這是T恤下的人氣排名第二頁的搜索結果
再做個查詢按鍵,就變成軟件了。
如果用時間來控制,可以讓程序每隔幾分鐘或者幾小時運行一次,達到自動爬抓數據的目的。
這部分我就不詳說了,感興趣的自己研究。