做微指數(shù)的爬蟲時,遇到點難題,去網上查些資料,發(fā)現(xiàn)有點錯誤;
特此經過研究,有了正確的采集方法。
1、采集界面,搜索關鍵字后頁面跳轉到指數(shù)界面,顯示搜索的指數(shù)。
2、fiddler抓包定位采集數(shù)據源,加載方式為json
3、獲取json數(shù)據;
分析數(shù)據的加載方式,發(fā)現(xiàn)數(shù)據是在定位請求頭中的referer地址進行返回數(shù)據的,