日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

Python爬蟲學習之獲取指定網(wǎng)頁源碼

系統(tǒng) 1957 0

本文實例為大家分享了Python獲取指定網(wǎng)頁源碼的具體代碼,供大家參考,具體內容如下

1、任務簡介

前段時間一直在學習Python基礎知識,故未更新博客,近段時間學習了一些關于爬蟲的知識,我會分為多篇博客對所學知識進行更新,今天分享的是獲取指定網(wǎng)頁源碼的方法,只有將網(wǎng)頁源碼抓取下來才能從中提取我們需要的數(shù)據(jù)。

2、任務代碼

Python獲取指定網(wǎng)頁源碼的方法較為簡單,我在Java中使用了38行代碼才獲取了網(wǎng)頁源碼(大概是學藝不精),而Python中只用了6行就達到了效果。

Python中獲取網(wǎng)頁源碼最簡單的方法就是使用urllib包,具體代碼如下:

            
import urllib.request    #導入urllib.request庫
b = str(input("請輸入:"))  #提示用戶輸入信息,并強制類型轉換為字符串型
a = urllib.request.urlopen(b)#打開指定網(wǎng)址
html = a.read()       #讀取網(wǎng)頁源碼
html = html.decode("utf-8") #解碼為unicode碼
print(html)         #打印網(wǎng)頁源碼
          

我輸入的網(wǎng)址是我博客主頁的網(wǎng)址 https://blog.csdn.net/lsylsy726

運行結果如下:

Python爬蟲學習之獲取指定網(wǎng)頁源碼_第1張圖片

3、總結

這篇博客介紹的方法較為簡單,其實有的網(wǎng)站會“反爬蟲”,這時就需要我們使用User-Agent或者代理,這些東西都會在后面的博客中進行更新,我預計在后面博客中更新“讀取CSDN博客訪問量的小程序”和“有道翻譯小程序”及其他更難一些的知識,由于剛開始學習爬蟲,水平有限,請大家多多包涵。

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。


更多文章、技術交流、商務合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯(lián)系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦?。?!

發(fā)表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 武川县| 方山县| 航空| 邵阳市| 巴青县| 临颍县| 永川市| 平山县| 二连浩特市| 伊宁县| 湟中县| 乐东| 肇州县| 调兵山市| 额尔古纳市| 嘉荫县| 沙湾县| 广水市| 无锡市| 房山区| 腾冲县| 嘉荫县| 蓝田县| 亳州市| 景泰县| 秭归县| 台南县| 潢川县| 玉田县| 临海市| 珠海市| 水城县| 丁青县| 汤原县| 抚松县| 兴和县| 苍南县| 黔东| 饶河县| 翼城县| 确山县|