日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

python爬蟲--爬取代碼實例(xpath)

系統 2153 0

Python爬取拉勾網實例

            
              
                # -*-.coding: utf-8 -*-
              
              
                # __author__ = 'xiaobai'
              
              
                # Email: 517840374@qq.com
              
              
                import
              
               time

              
                import
              
               re

              
                from
              
               selenium
              
                .
              
              webdriver 
              
                import
              
               Chrome 
              
                # 導入瀏覽器的包
              
              
                from
              
               selenium
              
                .
              
              webdriver
              
                .
              
              common
              
                .
              
              keys 
              
                import
              
               Keys
n 
              
                =
              
              
                1
              
              
                # 創建瀏覽器
              
              
web 
              
                =
              
               Chrome
              
                (
              
              
                )
              
              
                # 打開瀏覽器,請求到拉鉤
              
              
web
              
                .
              
              get
              
                (
              
              
                "https://www.lagou.com"
              
              
                )
              
              
web
              
                .
              
              find_element_by_xpath
              
                (
              
              
                '//*[@id="cboxClose"]'
              
              
                )
              
              
                .
              
              click
              
                (
              
              
                )
              
              

time
              
                .
              
              sleep
              
                (
              
              
                1
              
              
                )
              
              
                # 找到那個文本框,輸入python,然后點查詢
              
              
web
              
                .
              
              find_element_by_xpath
              
                (
              
              
                '//*[@id="search_input"]'
              
              
                )
              
              
                .
              
              send_keys
              
                (
              
              
                'python'
              
              
                ,
              
               Keys
              
                .
              
              ENTER
              
                )
              
              

alst 
              
                =
              
               web
              
                .
              
              find_elements_by_class_name
              
                (
              
              
                "position_link"
              
              
                )
              
              
                for
              
               a 
              
                in
              
               alst
              
                :
              
              
                # 找到H3并點擊
              
              
    a
              
                .
              
              find_element_by_tag_name
              
                (
              
              
                "h3"
              
              
                )
              
              
                .
              
              click
              
                (
              
              
                )
              
              
    web
              
                .
              
              switch_to
              
                .
              
              window
              
                (
              
              web
              
                .
              
              window_handles
              
                [
              
              
                -
              
              
                1
              
              
                ]
              
              
                )
              
              

    text
              
                =
              
               web
              
                .
              
              find_element_by_xpath
              
                (
              
              
                '//*[@id="job_detail"]/dd[2]'
              
              
                )
              
              
                .
              
              text 
              
                # 拿文本
              
              
                # 把招聘信息保存到文件中
              
              
                with
              
              
                open
              
              
                (
              
              f
              
                '需求_{n}.txt'
              
              
                ,
              
               mode 
              
                =
              
              
                'w'
              
              
                ,
              
              encoding
              
                =
              
              
                'utf-8'
              
              
                )
              
              
                as
              
               f
              
                :
              
              
        f
              
                .
              
              write
              
                (
              
              text
              
                )
              
              
        n 
              
                +=
              
              
                1
              
              
                # 關閉窗口
              
              
    web
              
                .
              
              close
              
                (
              
              
                )
              
              
                # 調整窗口到最開始的那個頁面
              
              
    web
              
                .
              
              switch_to
              
                .
              
              window
              
                (
              
              web
              
                .
              
              window_handles
              
                [
              
              
                0
              
              
                ]
              
              
                )
              
              
    time
              
                .
              
              sleep
              
                (
              
              
                1
              
              
                )
              
            
          

更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 赫章县| 怀宁县| 新龙县| 灯塔市| 浦城县| 克山县| 长宁县| 深州市| 西乌| 赫章县| 吴忠市| 阳新县| 天台县| 渭南市| 荆州市| 彰武县| 克山县| 宁晋县| 前郭尔| 塔城市| 怀集县| 湘乡市| 大石桥市| 汉川市| 象州县| 波密县| 滕州市| 沛县| 隆尧县| 重庆市| 浠水县| 通州区| 遂宁市| 辽宁省| 延长县| 保德县| 郴州市| 酒泉市| 临沂市| 巴里| 安国市|