application->cookie里面找到登錄以后的cookie信息將他寫到你的瀏覽器里面就可以了!importioimportsys#改變標(biāo)準(zhǔn)輸出的默認(rèn)編碼(改變中文輸出的亂碼問題)sys.stdout=io.TextIOWrapper(sys." />

日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

cookie 的尋找和使用以及頁面滾動(dòng)(python+selenium)

系統(tǒng) 2331 0

cookie:

本文以登錄的自己的 知乎 為例,找到當(dāng)前的cookie信息,然后讓瀏覽器帶著自己的cookie信息去訪問 網(wǎng)址:知乎

在goole瀏覽器下面 Ctrl+shift+J? (F12)打開console工作臺(tái)->application->cookie里面找到登錄以后的cookie信息 將他寫到你的瀏覽器里面就可以了!

cookie 的尋找和使用以及頁面滾動(dòng)(python+selenium)_第1張圖片

?

?

            
              import
            
            
               io

            
            
              import
            
            
               sys

            
            
              #
            
            
              改變標(biāo)準(zhǔn)輸出的默認(rèn)編碼(改變中文輸出的亂碼問題)
            
            
sys.stdout=io.TextIOWrapper(sys.stdout.buffer,encoding=
            
              '
            
            
              utf8
            
            
              '
            
            
              )


            
            
              #
            
            
              導(dǎo)入selenium的瀏覽器驅(qū)動(dòng)接口
            
            
              from
            
             selenium 
            
              import
            
            
               webdriver

            
            
              from
            
             time 
            
              import
            
            
               sleep
driver 
            
            = webdriver.Chrome(
            
              "
            
            
              C:\Program Files (x86)\Google\Chrome\Application\chromedriver.exe
            
            
              "
            
            
              )
 
            
            
              #
            
            
               加載知乎主頁,查看快照知此時(shí)處于未登錄狀態(tài)
            
            
driver.get(
            
              "
            
            
              https://www.zhihu.com
            
            
              "
            
            
              )
sleep(
            
            1
            
              )

            
            
              print
            
            (driver.save_screenshot(
            
              "
            
            
              zhihu_nocookies.png
            
            
              "
            
            
              ))

    
            
            
              #
            
            
               操作瀏覽器登錄知乎并抓包c(diǎn)ookies
            
            
zhihu_cookies =
            
               {
        
            
            
              #
            
            
              第一個(gè)cookie信息不要,注釋掉
            
            
              #
            
            
              '_xsrf':'    4Aehy9uAVpUQwh63ft2lgIFMZSwlqGs7',            
            
            
              '
            
            
              _zap
            
            
              '
            
            :    
            
              '
            
            
              047801d6-2a5c-490d-89eb-14c27fed8f63
            
            
              '
            
            
                  ,        
     
            
            
              '
            
            
              capsion_ticket
            
            
              '
            
                :
            
              "
            
            
              2|1:0|10:1568897272|14:capsion_ticket|44:NDA4MmQwZjI1MGVmNGI2OGIwMzdjODViYTdmZDhjMWI=|b491fbdbb7c4a73a344512fabd38111217ff6846d10c831a266fd0a0119856a2
            
            
              "
            
            
                  ,
     
            
            
              '
            
            
              d_c0
            
            
              '
            
            :    
            
              "
            
            
              ANCi2eDKEw-PTp0vSECsR7vX7XcdN1VL5b4=|1551806289
            
            
              "
            
            
                  ,            
     
            
            
              '
            
            
              q_c1
            
            
              '
            
            :    
            
              '
            
            
              ee90e06b16e049d2b6395ae23eb3328d|1551806291000|1551806291000
            
            
              '
            
            
              ,
     
            
            
              '
            
            
              tgw_l7_route
            
            
              '
            
            :    
            
              '
            
            
              060f637cd101836814f6c53316f73463
            
            
              '
            
            
              ,            
     
            
            
              '
            
            
              tgw_l7_route
            
            
              '
            
            :    
            
              '
            
            
              18884ea8e9aef06cacc0556da5cb4bf1
            
            
              '
            
            
              ,                
     
            
            
              '
            
            
              tgw_l7_route
            
            
              '
            
            :    
            
              '
            
            
              060f637cd101836814f6c53316f73463
            
            
              '
            
            
              ,                
     
            
            
              '
            
            
              tst
            
            
              '
            
            :    
            
              '
            
            
              r
            
            
              '
            
            
                  ,                
     
            
            
              '
            
            
              z_c0
            
            
              '
            
            :    
            
              "
            
            
              2|1:0|10:1568897286|4:z_c0|92:Mi4xemNkekNRQUFBQUFBMEtMWjRNb1REeVlBQUFCZ0FsVk5Cc2R3WGdBalhkbVNieHZUY3dLMTA0RlFHVFBiNjh5RjFR|c90ecb48ce8d612f537305315f543bcdf43d0ad588d28618896faacd085f11fd
            
            
              "
            
            
                  ,

    }

    
            
            
              #
            
            
               將用戶登錄產(chǎn)生的cookies全部添加到當(dāng)前會(huì)話
            
            
              for
            
             k, v 
            
              in
            
            
               zhihu_cookies.items():
        driver.add_cookie({
            
            
              '
            
            
              domain
            
            
              '
            
            : 
            
              '
            
            
              .zhihu.com
            
            
              '
            
            , 
            
              '
            
            
              name
            
            
              '
            
            : k, 
            
              '
            
            
              value
            
            
              '
            
            
              : v})

    
            
            
              #
            
            
               再次訪問知乎主頁并拍照,此時(shí)已經(jīng)是登錄狀態(tài)了
            
            
driver.get(
            
              "
            
            
              https://www.zhihu.com
            
            
              "
            
            
              )
sleep(
            
            3
            
              )

            
            
              print
            
            (driver.save_screenshot(
            
              "
            
            
              zhihu_cookies.png
            
            
              "
            
            
              ))
            
          
#模擬滾動(dòng)條的滾動(dòng)(這個(gè)用常規(guī)的爬蟲很難實(shí)現(xiàn))

????#?加載知乎主頁
?#?將頁面滾動(dòng)到最后,執(zhí)行多次
for?i?in?range(3):
????????js?=?"var?q=document.documentElement.scrollTop=10000"
????????driver.execute_script(js)
????????sleep(3)

????#?截圖并退出,頁面?zhèn)冗厺L動(dòng)條已經(jīng)下滑了許多像素
print(driver.save_screenshot("zhihu_scroll.png"))
            
              #
            
            
               退出瀏覽器
            
            
driver.quit()
          

?


更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號(hào)聯(lián)系: 360901061

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長(zhǎng)非常感激您!手機(jī)微信長(zhǎng)按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對(duì)您有幫助就好】

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長(zhǎng)會(huì)非常 感謝您的哦!!!

發(fā)表我的評(píng)論
最新評(píng)論 總共0條評(píng)論
主站蜘蛛池模板: 蓝山县| 星子县| 霸州市| 安丘市| 肇州县| 阿拉尔市| 乌海市| 三明市| 中宁县| 金塔县| 青海省| 潮州市| 舒兰市| 南木林县| 绥中县| 兴安县| 玉门市| 本溪市| 金沙县| 乌兰察布市| 合肥市| 天水市| 崇仁县| 清涧县| 晋城| 南通市| 南召县| 元谋县| 伊吾县| 文化| 昌图县| 建德市| 上虞市| 乌拉特前旗| 大丰市| 布尔津县| 泾川县| 五莲县| 库伦旗| 花垣县| 萍乡市|