日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

Python使用get_text()方法從大段html中提取文本的實例

系統 2055 0

如下所示:

                      

比如這兒有這么一大段帶html的字串,想要從中提取文本,首先發現這是一個textarea

我們使用beautifulsoup

            
def get_content(url):
 resp = urllib.request.urlopen(url)
 html = resp.read()
 bs = BeautifulSoup(html, "html.parser")
 return bs.textarea.get_text()
          

首先用那段html字符串初始化beautifulsoup對象

然后bs.textarea返回找到的第一個textarea,找到后使用get_text()清空所有html標簽元素

之后就會返回干凈的文字

以上這篇Python使用get_text()方法從大段html中提取文本的實例就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持腳本之家。


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 喀喇沁旗| 广昌县| 岳阳县| 清水县| 福贡县| 河西区| 林口县| 麻城市| 潢川县| 太康县| 肇源县| 读书| 铜梁县| 莱芜市| 桃园市| 涡阳县| 通海县| 天长市| 增城市| 无极县| 桐乡市| 南川市| 渝北区| 浮山县| 望奎县| 荆门市| 江永县| 揭西县| 蓬安县| 高州市| 青田县| 北安市| 迭部县| 蒲城县| 河源市| 肃宁县| 独山县| 钟祥市| 融水| 神农架林区| 弥勒县|