日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

用python爬取熱門菜譜清單

系統 2019 0

import requests

引用requests庫

from bs4 import BeautifulSoup

引用BeautifulSoup庫

res_foods = requests.get(‘http://www.xiachufang.com/explore/’)

獲取數據

bs_foods = BeautifulSoup(res_foods.text,‘html.parser’)

解析數據

tag_name = bs_foods.find_all(‘p’,class_=‘name’)

查找包含菜名和URL的

標簽

tag_ingredients = bs_foods.find_all(‘p’,class_=‘ing ellipsis’)

查找包含食材的

標簽

list_all = []

創建一個空列表,用于存儲信息

for x in range(len(tag_name)):

啟動一個循環,次數等于菜名的數量

            
              list_food = [tag_name[x].text[18:-14],tag_name[x].find('a')['href'],tag_ingredients[x].text[1:-1]]
# 提取信息,封裝為列表。注意此處[18:-14]切片和之前不同,是因為此處使用的是
              

標簽,而之前是 list_all.append(list_food) # 將信息添加進list_all

print(list_all)

打印

以下是另外一種解法

list_foods = bs_foods.find_all(‘div’,class_=‘info pure-u’)

查找最小父級標簽

list_all = []

創建一個空列表,用于存儲信息

for food in list_foods:

            
              tag_a = food.find('a')
# 提取第0個父級標簽中的
              
                標簽
name = tag_a.text[17:-13]
# 菜名,使用[17:-13]切掉了多余的信息
URL = 'http://www.xiachufang.com'+tag_a['href']
# 獲取URL
tag_p = food.find('p',class_='ing ellipsis')
# 提取第0個父級標簽中的
                

標簽 ingredients = tag_p.text[1:-1] # 食材,使用[1:-1]切掉了多余的信息 list_all.append([name,URL,ingredients]) # 將菜名、URL、食材,封裝為列表,添加進list_all

print(list_all)

打印


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 阳山县| 东乌| 宁南县| 中江县| 青河县| 拜泉县| 旌德县| 南康市| 安泽县| 通州市| 改则县| 梅州市| 襄垣县| 罗田县| 车险| 沂源县| 蕉岭县| 乌鲁木齐县| 灵丘县| 溧阳市| 钟祥市| 建始县| 香格里拉县| 广丰县| 威海市| 北海市| 新兴县| 焦作市| 凤阳县| 伊春市| 邢台县| 库车县| 纳雍县| 禄丰县| 泸西县| 淄博市| 广西| 雅江县| 闵行区| 临夏县| 清新县|