日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

python爬蟲爬去百度圖片

系統(tǒng) 1779 0

下面程序能夠爬取百度圖片一個(gè)網(wǎng)頁里面的所以圖片,值得關(guān)注的是匹配字段,正則表達(dá)式要寫正確,雖然匹配成功的但是爬取的圖片還是較少,下篇我會(huì)采取get方法來請(qǐng)求更多圖片來爬取。

            
              import urllib.request
import re
import time

def open_url(url):
    req = urllib.request.Request(url)
    req.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36 QIHU 360EE')
    page = urllib.request.urlopen(req)#打開網(wǎng)頁
    html = page.read().decode('utf-8')#網(wǎng)頁解碼
    return html

def get_img(html):
    p = r'"(https:[^"]+\.jpg)'#匹配的字段
    imglist = re.findall(p,html)
    #print(html)
    for each in imglist:
        print(each)
        filename = each.split("/")[-1]
        urllib.request.urlretrieve(each,filename,None)#保存圖片
        #time.sleep(0.01)


if __name__ == '__main__':
	#網(wǎng)址
    url = 'https://image.baidu.com/search/index?tn=baiduimage&ipn=r&ct=201326592&cl=2&lm=-1&st=-1&fm=result&fr=&sf=1&fmq=1559194736650_R&pv=&ic=&nc=1&z=&hd=&latest=&copyright=&se=1&showtab=0&fb=0&width=&height=&face=0&istype=2&ie=utf-8&sid=&word=%E5%8A%A8%E6%BC%AB%E5%B0%91%E5%A5%B3'
    get_img(open_url(url))

            
          

更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號(hào)聯(lián)系: 360901061

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長(zhǎng)非常感激您!手機(jī)微信長(zhǎng)按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對(duì)您有幫助就好】

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長(zhǎng)會(huì)非常 感謝您的哦!!!

發(fā)表我的評(píng)論
最新評(píng)論 總共0條評(píng)論
主站蜘蛛池模板: 鞍山市| 渭源县| 雷波县| 贵港市| 威远县| 福贡县| 麟游县| 西畴县| 凤山县| 巴林右旗| 五峰| 浦江县| 浮梁县| 乌海市| 扶绥县| 池州市| 黄陵县| 卢湾区| 陆川县| 靖州| 吕梁市| 高要市| 浪卡子县| 肇源县| 辽中县| 桐庐县| 昌图县| 崇明县| 宝清县| 黑龙江省| 信丰县| 永兴县| 郓城县| 河池市| 汉寿县| 和顺县| 甘孜县| 安顺市| 洛宁县| 化隆| 开江县|