阿里媽媽淘寶聯盟寶貝採集方法

來源:酷知科普網 1.45W

本文介紹使用採集器採集阿里媽媽淘寶聯盟(以衣服為例)的方法
本文僅以阿里媽媽淘寶聯盟衣服搜尋結果頁面舉例說明,大家如果有其他採集淘寶聯盟商品的需求,可以更換搜尋關鍵詞進行採集。
採集內容為:
商品圖片地址,商品標題,店鋪名,銷量,商品價格,佣金,比率,商品連結

阿里媽媽淘寶聯盟寶貝採集方法

操作方法

(01)步驟1:建立採集任務1)進入主介面,選擇“自定義採集”

阿里媽媽淘寶聯盟寶貝採集方法 第2張

(02)2)將要採集的網站URL複製貼上到輸入框中,點選“儲存網址”

阿里媽媽淘寶聯盟寶貝採集方法 第3張

(03)3)儲存網址後,滑鼠點選輸入框,在右側操作提示框中,選擇“輸入文字”

阿里媽媽淘寶聯盟寶貝採集方法 第4張

(04)4)然後輸入採集的商品,點選確定

阿里媽媽淘寶聯盟寶貝採集方法 第5張

(05)5)  網路載入速度比較慢,所以需要設定執行前等待,為防止輸入框沒載入完畢操作失效還需要設定出現元素

阿里媽媽淘寶聯盟寶貝採集方法 第6張

(06)然後點選搜尋,並選擇“點選該按鈕”

阿里媽媽淘寶聯盟寶貝採集方法 第7張

(07)由於網頁涉及Ajax技術。所以需要選中點選元素,開啟“高階選項”,勾選“Ajax載入資料”,設定時間為“5秒”。 因為頁面開啟後需要向下滑動才可以出現更多內容,所以還需要設定頁面滾動,滾動次數選擇30次,每次間隔2秒,選擇向下滾動一屏完成後,點選“確定”。

阿里媽媽淘寶聯盟寶貝採集方法 第8張

(08)步驟2:建立翻頁迴圈1)將頁面下拉到底部,找到下一頁按鈕,滑鼠點選,在右側操作提示框中,選擇“迴圈點選單個連結”

阿里媽媽淘寶聯盟寶貝採集方法 第9張

(09)2)同上,此步驟也需要設定高階選項,開啟“高階選項”,勾選“Ajax載入資料”,設定時間為“3秒”。 因為頁面開啟後需要向下滑動才可以出現更多內容,所以還需要設定頁面滾動,滾動次數選擇30次,每次間隔1秒,選擇向下滾動一屏完成後,點選“確定”

阿里媽媽淘寶聯盟寶貝採集方法 第10張

(10)步驟3:採集阿里媽媽淘寶聯盟商品資訊1)移動滑鼠,選中第一個商品圖片,標題,店鋪名,系統會自動識別出相似的元素,在提示框中選擇“選中全部”,隨後點選採集圖片地址或者採集以下元素文字。

阿里媽媽淘寶聯盟寶貝採集方法 第11張

(11)2)如果要採集商品連結,價格,佣金,比率,銷量的話,則要寫xpath才能實現採集。以採集價格欄位舉例:首先選擇新增特殊欄位

阿里媽媽淘寶聯盟寶貝採集方法 第12張

(12)然後選中該欄位,選擇自定義資料欄位(下圖紅色框中的)

阿里媽媽淘寶聯盟寶貝採集方法 第13張

(13)隨後選擇自定義定位元素方式,並按下圖填入XPah。價格的元素匹配的XPath為//div[1]//div[@class="content-line clearfix mt5"]/span[1]相對Xpath勾上,並填入//div[@class="content-line clearfix mt5"]/span[1]需要注意的事,Xpath會隨著網站結構的改變而改變,所以上面xpath不能確保一直有效。如果要採集這些資料,建議學習一下Xpath:

阿里媽媽淘寶聯盟寶貝採集方法 第14張

(14)填好xpath之後,隨後在自定義資料欄位->自定義抓取方式中選擇抓取文字即可。

阿里媽媽淘寶聯盟寶貝採集方法 第15張

(15)同理,如果要採集佣金,比率,商品連結分別設定為:佣金:元素匹配的XPath為//div[1]//div[@class="content-line clearfix"]/span[2]相對Xpath勾上,並填入//div[@class="content-line clearfix"]/span[2]自定義資料欄位->自定義抓取方式中選擇抓取文字商品連結:元素匹配的XPath為//div/a[@class="search-box-img img-loaded"]相對Xpath勾上,並填入//div/a[@class="search-box-img img-loaded"]自定義資料欄位->自定義抓取方式中選擇抓取超連結(a標籤的href)比率:元素匹配的XPath為//div[1]//div[@class="content-line clearfix"]/span[1]相對Xpath勾上,並填入//div[@class="content-line clearfix"]/span[1]自定義資料欄位->自定義抓取方式中選擇抓取文字銷量:元素匹配的XPath為//div[1]//div[@class="content-line clearfix mt5"]/span[2]相對Xpath勾上,並填入//div[1]//div[@class="content-line clearfix mt5"]/span[2]自定義資料欄位->自定義抓取方式中選擇抓取文字設定完成以後,可以看到資料都在欄位中了:

阿里媽媽淘寶聯盟寶貝採集方法 第16張

(16)3)然後再選擇‘’啟動本地採集”

阿里媽媽淘寶聯盟寶貝採集方法 第17張

(17)步驟4:資料採集及匯出1)採集完成後,會跳出提示,選擇“匯出資料”選擇“合適的匯出方式”,將採集好的資料匯出這裡我們選擇excel作為匯出為格式,一份完好的阿里媽媽淘寶聯盟商品資訊就匯入出來了,資料匯出後如下圖

阿里媽媽淘寶聯盟寶貝採集方法 第18張
熱門標籤