言歸正傳,由于一直搞這些東西,突然想著拿js去寫個(gè)采集玩一玩,就用tampermonkey,畢竟好久沒玩了。
簡(jiǎn)介:針對(duì)一些網(wǎng)站的數(shù)據(jù)列表,定義采集腳本,模擬用戶操作,做列表數(shù)據(jù)提取,生成json數(shù)據(jù)格式化展示。
json采集腳本定義:
1 { 2 "type": "list", 3 "selector": "",//列表選擇器 4 "max_page": 1,//采集頁數(shù) 5 "page_selector": "",//翻頁選擇器 6 "iframe_selector": "",//iframe 選擇器 7 "datas": [//采集字段定義 8 { 9 "selector": " ",//字段選擇器<此處為針對(duì)列表的子選擇器>10 "column": "title",//字段名稱11 "from": "text",//采集類型12 "iframe_selector": "",//iframe選擇器 防止一些網(wǎng)站怪異 一般不需要13&n