1 寫在前面
最近想要在百度網(wǎng)盤里面搜索一些pdf資源,打開以前保存的一個專門搜索百度網(wǎng)盤資源的頁面so.baiduyun.me ,頁面轉(zhuǎn)了好久,終于出來,但是出現(xiàn)的卻是Error 522,鏈接失效了。最后,在網(wǎng)上找到一個可以用的地址http://pan.java1234.com/,這個地址確實可以搜索百度網(wǎng)盤資源,但是廣告超級多,稍有不慎,就進入了一個廣告頁面,神煩。當(dāng)時就想能不能尋找到這個網(wǎng)頁中資源搜索的地址,然后自己根據(jù)這個地址來模擬請求,從而獲得查詢結(jié)果。打開瀏覽器的調(diào)試工具,隨意輸入一個關(guān)鍵字進行查詢,點擊查詢,然后進行分析。分析發(fā)現(xiàn)了一個url請求返回的正是百度網(wǎng)盤搜索結(jié)果,數(shù)據(jù)是json格式。找到了這個獲取搜索結(jié)果url之后就好辦了。我們可以完全自己寫一個Winform界面,然后通過這個url去模擬請求,獲取結(jié)果,這樣就沒有廣告了,想怎么弄就怎么弄,下面介紹一下,如何完成這一系列的過程。
2 分析
2.1 獲取請求頭信息
實現(xiàn)這個程序的關(guān)鍵就是如何獲取http://pan.java1234.com/百度網(wǎng)盤搜索結(jié)果的url,首先我們打開這個頁面,啟動瀏覽器調(diào)試,然后隨意輸入一個關(guān)鍵字,點擊查詢。
上圖我們可以看到,有一個請求url,返回來的結(jié)果就是頁面上顯示的搜索結(jié)果。我們可以看看它的請求地址以及請求頭信息。
通過查看headers面板可以知道請求信息如下:
- 請求地址:http://pan1234.com/server3?jsoncallback=jQuery19109864917922941505_1478436979648&q=win7&start=0&_=1478436979649
- User-Agent:Mozilla/5.0 (Windows NT 10.