馬上5月份有個(gè)軟件專(zhuān)業(yè)等級(jí)考試,以下簡(jiǎn)稱軟考,為了更好的復(fù)習(xí)備考,我打算抓取www.rkpass.com網(wǎng)上的軟考試題。
以上為背景。
很久沒(méi)有更新博客園的博客了,所以之前的代碼沒(méi)有及時(shí)的貼出來(lái),咱們就從今天開(kāi)始,講述一下我爬取軟考試題的故(keng)事(shi)?,F(xiàn)在我已經(jīng)能自動(dòng)抓取某一個(gè)模塊的所有題目了,如下圖:
目前可以將信息系統(tǒng)監(jiān)理師的30條試題記錄全部抓取下來(lái),結(jié)果如下圖所示:
抓取下來(lái)的內(nèi)容圖片:
雖然可以將部分信息抓取下來(lái),但是代碼的質(zhì)量并不高,以抓取信息系統(tǒng)監(jiān)理師為例,因?yàn)槟繕?biāo)明確,各項(xiàng)參數(shù)清晰,為了追求能在短時(shí)間內(nèi)抓取到試卷信息,所以并沒(méi)有做異常處理,昨天晚上填了很久的坑。
回到主題,今天寫(xiě)這篇博客,是因?yàn)橛钟龅叫驴恿?。從博客?biāo)題我們可以猜出個(gè)大概,肯定是請(qǐng)求次數(shù)過(guò)多,所以ip被網(wǎng)站的反爬蟲(chóng)機(jī)制給封了。
延伸閱讀
- ssh框架 2016-09-30
- 阿里移動(dòng)安全 [無(wú)線安全]玩轉(zhuǎn)無(wú)線電——不安全的藍(lán)牙鎖 2017-07-26
- 消息隊(duì)列NetMQ 原理分析4-Socket、Session、Option和Pipe 2024-03-26
- Selective Search for Object Recognition 論文筆記【圖片目標(biāo)分割】 2017-07-26
- 詞向量-LRWE模型-更好地識(shí)別反義詞同義詞 2017-07-26
- 從棧不平衡問(wèn)題 理解 calling convention 2017-07-26
- php imagemagick 處理 圖片剪切、壓縮、合并、插入文本、背景色透明 2017-07-26
- Swift實(shí)現(xiàn)JSON轉(zhuǎn)Model - HandyJSON使用講解 2017-07-26
- 阿里移動(dòng)安全 Android端惡意鎖屏勒索應(yīng)用分析 2017-07-26
- 集合結(jié)合數(shù)據(jù)結(jié)構(gòu)來(lái)看看(二) 2017-07-26