言歸正傳,由于一直搞這些東西,突然想著拿js去寫個(gè)采集玩一玩,就用tampermonkey,畢竟好久沒玩了。

簡(jiǎn)介:針對(duì)一些網(wǎng)站的數(shù)據(jù)列表,定義采集腳本,模擬用戶操作,做列表數(shù)據(jù)提取,生成json數(shù)據(jù)格式化展示。

json采集腳本定義:

萬碼學(xué)堂,電腦培訓(xùn),計(jì)算機(jī)培訓(xùn),Java培訓(xùn),JavaEE開發(fā)培訓(xùn),青島軟件培訓(xùn),軟件工程師培訓(xùn)

 1 { 2     "type": "list", 3     "selector": "",//列表選擇器 4     "max_page": 1,//采集頁數(shù) 5     "page_selector": "",//翻頁選擇器 6     "iframe_selector": "",//iframe 選擇器 7     "datas": [//采集字段定義 8         { 9             "selector": " ",//字段選擇器<此處為針對(duì)列表的子選擇器>10             "column": "title",//字段名稱11             "from": "text",//采集類型12             "iframe_selector": "",//iframe選擇器 防止一些網(wǎng)站怪異 一般不需要13&n
        
		

網(wǎng)友評(píng)論