<wbr id="wsjqy"></wbr>

          <form id="wsjqy"></form>
          <sub id="wsjqy"></sub>
          <nav id="wsjqy"><listing id="wsjqy"></listing></nav>
          更多課程 選擇中心


          Python培訓

          400-111-8989

          用Python語言爬蟲抓取微博評論圖文教程

          • 發布: 羅羅攀
          • 來源:Python中文社區
          • 時間:2017-08-29 16:11

          提交Cookie信息模擬微博登錄

          需要爬取登錄之后的信息,大家都是望而止步,不要擔心,今天呢,給大家提供一個超級簡單的方法,就是提交Cookie信息登錄微博,首先,我們找到某明星的微博網址:http://m.weibo.cn/u/1732927460 這里是登錄的移動端,你會發現,你點擊網址會自動跳轉到登錄微博的界面(沒有跳轉的注銷掉自己的賬號),如下圖所示:

          然后登錄自己的賬號密碼,這時記得打開Fiddler進行抓包,如圖所示,提取Cookie做為請求某明星微博網址的請求頭即可。

          異步加載數據如何爬取

          我在網上看過移動端的微博數據很好爬,沒有異步加載,可是不知道為什么,我的評論數據就是異步加載的,其實異步加載不可怕,找到相應js包即可,如下圖為某明星的一條微博和評論的js包。我們只需請求這個js數據,然后利用json庫即可提取我們所需的評論數據。

          代碼

          爬取的數據導入數據庫后又導出為csv格式進行分析

          詞云制作及分析

          可以說支持的評論更多一些:例如愛你,喜歡,堅強等等;不過也有不少的惡意評論:黑,惡心,討厭等。

          總結

          1、Cookie提交是一個簡單不錯的選擇,但Cookie信息隱藏著隱私,大家千萬別暴露在外面,以防外人所利用。

          2、異步加載不可怕,找包有技巧,有id,vid等字段的嫌疑最大,多練習就行。

          預約申請免費試聽課

          填寫下面表單即可預約申請免費試聽!怕錢不夠?可就業掙錢后再付學費! 怕學不會?助教全程陪讀,隨時解惑!擔心就業?一地學習,可全國推薦就業!

          上一篇:學習 Python 的三種境界
          下一篇:會幫助到99% Python 學習者的簡明語法總結

          2021年Python面試題及答案匯總詳解

          python數據分析,你需要這些工具

          Python培訓講解二叉樹的三種深度

          Python培訓:如何實現窮舉搜索?

          • 掃碼領取資料

            回復關鍵字:視頻資料

            免費領取 達內課程視頻學習資料

          • 視頻學習QQ群

            添加QQ群:1143617948

            免費領取達內課程視頻學習資料

          Copyright ? 2021 Tedu.cn All Rights Reserved 京ICP備08000853號-56 京公網安備 11010802029508號 達內時代科技集團有限公司 版權所有

          選擇城市和中心
          黑龍江省

          吉林省

          河北省

          湖南省

          貴州省

          云南省

          廣西省

          海南省

          网友自拍 偷拍 校园性爱青青草曰逼视屏老鸭窝国产偷自视频区视频 百度 好搜 搜狗
          <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <文本链> <文本链> <文本链> <文本链> <文本链> <文本链>