>>text='朝鮮確認金正恩出訪俄羅斯將與普京舉行會談...'>>>keywords=['俄羅斯','朝鮮','普京','金正恩','俄方']在很多時候,我們往往需要更細化的短語描述,來作為文本的關鍵信息展示。這樣的需求在生成詞云、提供摘要閱讀、關鍵信息檢索等任務中都非常重要。例如:>>>phrases=[" />

日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

一個基于python的抽取文章關鍵短語的工具

系統 2069 0

應用場景

  • 在很多關鍵詞提取任務中,使用tfidf等方法提取得到的僅僅是若干零碎詞匯。
  • 這樣的零碎詞匯無法真正的表達文章的原本含義,我們并不想要它。
    例如:
            
              >>> text = '朝鮮確認金正恩出訪俄羅斯 將與普京舉行會談...'
>>> keywords = ['俄羅斯', '朝鮮', '普京', '金正恩', '俄方']

            
          
  • 在很多時候,我們往往需要更細化的短語描述,來作為文本的關鍵信息展示。這樣的需求在生成詞云、提供摘要閱讀、關鍵信息檢索等任務中都非常重要。
    例如:
            
              >>> phrases = ['俄羅斯克里姆林宮', '邀請金正恩訪俄', '最高司令官金正恩', 
               '朝方轉交普京', '舉行會談']

            
          

一個基于python的抽取文章關鍵短語的工具_第1張圖片

功能介紹

為解決以上問題,我基于 jieba 工具,開發了一個關鍵短語抽取器,它可以方便地從文本中找出表達完成意思的關鍵短語。其鏈接為:
https://github.com/dongrixinyu/phrases_extractor

詳細使用方法見其中。如果覺得方便好用,請 follow 我一波:https://github.com/dongrixinyu


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 开远市| 洪江市| 昌乐县| 花莲市| 和田县| 陕西省| 本溪| 元阳县| 永丰县| 湟源县| 湖口县| 溧阳市| 新疆| 阳曲县| 巴青县| 北宁市| 兴业县| 遂昌县| 名山县| 阿鲁科尔沁旗| 女性| 通辽市| 富锦市| 永吉县| 广昌县| 定边县| 周至县| 丰都县| 弥渡县| 合江县| 名山县| 沂源县| 翁牛特旗| 沙田区| 盐津县| 屏南县| 刚察县| 沈丘县| 大埔区| 连城县| 云龙县|