1 寫(xiě)在前面
最近想要在百度網(wǎng)盤(pán)里面搜索一些pdf資源,打開(kāi)以前保存的一個(gè)專(zhuān)門(mén)搜索百度網(wǎng)盤(pán)資源的頁(yè)面so.baiduyun.me ,頁(yè)面轉(zhuǎn)了好久,終于出來(lái),但是出現(xiàn)的卻是Error 522,鏈接失效了。最后,在網(wǎng)上找到一個(gè)可以用的地址http://pan.java1234.com/,這個(gè)地址確實(shí)可以搜索百度網(wǎng)盤(pán)資源,但是廣告超級(jí)多,稍有不慎,就進(jìn)入了一個(gè)廣告頁(yè)面,神煩。當(dāng)時(shí)就想能不能尋找到這個(gè)網(wǎng)頁(yè)中資源搜索的地址,然后自己根據(jù)這個(gè)地址來(lái)模擬請(qǐng)求,從而獲得查詢結(jié)果。打開(kāi)瀏覽器的調(diào)試工具,隨意輸入一個(gè)關(guān)鍵字進(jìn)行查詢,點(diǎn)擊查詢,然后進(jìn)行分析。分析發(fā)現(xiàn)了一個(gè)url請(qǐng)求返回的正是百度網(wǎng)盤(pán)搜索結(jié)果,數(shù)據(jù)是json格式。找到了這個(gè)獲取搜索結(jié)果url之后就好辦了。我們可以完全自己寫(xiě)一個(gè)Winform界面,然后通過(guò)這個(gè)url去模擬請(qǐng)求,獲取結(jié)果,這樣就沒(méi)有廣告了,想怎么弄就怎么弄,下面介紹一下,如何完成這一系列的過(guò)程。
2 分析
2.1 獲取請(qǐng)求頭信息
實(shí)現(xiàn)這個(gè)程序的關(guān)鍵就是如何獲取http://pan.java1234.com/百度網(wǎng)盤(pán)搜索結(jié)果的url,首先我們打開(kāi)這個(gè)頁(yè)面,啟動(dòng)瀏覽器調(diào)試,然后隨意輸入一個(gè)關(guān)鍵字,點(diǎn)擊查詢。
上圖我們可以看到,有一個(gè)請(qǐng)求url,返回來(lái)的結(jié)果就是頁(yè)面上顯示的搜索結(jié)果。我們可以看看它的請(qǐng)求地址以及請(qǐng)求頭信息。
通過(guò)查看headers面板可以知道請(qǐng)求信息如下:
- 請(qǐng)求地址:http://pan1234.com/server3?jsoncallback=jQuery19109864917922941505_1478436979648&q=win7&start=0&_=1478436979649
- User-Agent:Mozilla/5.0 (Windows NT 10.