日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

python批量獲取文本中的郵箱,并寫入文件增強版,全匹配版

系統(tǒng) 1975 0

百度貼吧爬蟲之獲取郵箱系列之增強版,應該是 任意郵箱了

  • 功能:獲取文本中的郵箱
  • 上個基礎版支持的不大好,對有些郵箱不支持,還有些其他問題
  1. 讀文本,且獲取文本中的各種電子郵箱
  2. 對獲得的郵箱去重
  3. 每個郵箱獨占一行
  4. 寫入新的文件
            
              # coding:utf-8
"""
Name : email.py
Author  : GS
Contect : 2903344135@qq.com
Time    : 2019/7/8 20:23
Desc:
"""
import  re

f = open('test.txt', 'r',encoding='utf-8')#讀取文件
strings=f.read()#獲取文件內(nèi)容,到內(nèi)存
f.close()#讀關閉
matches = []

emailRegex = re.compile(r'''(
    [a-zA-Z0-9._%+-]+      # username
    @                      # @ symbol
    [a-zA-Z0-9.-]+         # domain name
    (\.[a-zA-Z]{2,4}){1,2} # dot-something
    )''', re.VERBOSE)
for groups in emailRegex.findall(strings):
    matches.append(groups[0])

f1 = open('test1.txt','a',encoding='utf-8')#打開新的文件

list2 = list(set(matches))#去重
# print(list2)
list_nums = len(list2)#列表的數(shù)量,長度

#循環(huán)寫入文件,并換行
for line in range(list_nums):

    f1.writelines(list2[line]+"\n")
#關閉流
f1.close()
            
          

原始文本文件text.txt:

python批量獲取文本中的郵箱,并寫入文件增強版,全匹配版_第1張圖片

?

執(zhí)行完程序之后的樣子:test1.txt

python批量獲取文本中的郵箱,并寫入文件增強版,全匹配版_第2張圖片

?

從實現(xiàn)功能上講,對我所知道的郵箱都是完美提取,完美去重,但是代碼有待進一步優(yōu)化。

覺得有用的話,加我可交流

?


更多文章、技術交流、商務合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯(lián)系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發(fā)表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 阳原县| 谷城县| 肇州县| 根河市| 平昌县| 泰顺县| 洞头县| 洪泽县| 天门市| 嘉定区| 赫章县| 江安县| 镇巴县| 确山县| 龙里县| 延川县| 海南省| 鹿泉市| 赞皇县| 陇南市| 北碚区| 平南县| 南通市| 漯河市| 葫芦岛市| 阿鲁科尔沁旗| 凌云县| 阿勒泰市| 新安县| 海原县| 巧家县| 阿克| 泾川县| 鸡泽县| 新竹县| 商南县| 宜黄县| 长丰县| 陆良县| 大宁县| 宜黄县|