日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

給定一篇文本(新聞),確定其歸屬地(地名)的python工具

系統 1779 0

簡介

有時候需要確定一篇新聞文本的地名,比如

            
              上海市實施了垃圾分類...

            
          

其地名,即歸屬地是上海,本工具就是實現這個功能的。

給定一篇文章,可包含標題和正文(或僅標題,僅正文),確定其 歸屬地 (地名)。

  • 結果標準:
    • 區分國內國外,
    • 國外到國家名一級
    • 國內到省市一級

安裝

  • 使用 python3
            
              $ git clone https://github.com/dongrixinyu/location_detect.git
$ cd location_detect
$ pip install .

            
          

使用方法

樣例1

            
              
                import
              
               loc_reg
title 
              
                =
              
              
                '湖南2018年度企業環境信用評價公示 39家企業擬被評“不良”'
              
              
passage 
              
                =
              
              
                '今天,記者從湖南省生態環境廳獲悉,我省2018年度企業環境信用評價擬定結果正在長沙市進行公示,擬評定環境誠信企業31家、環境合格企業1247家、環境風險企業121家、環境不良企業39家。'
              
              
                print
              
              
                (
              
              loc_reg
              
                .
              
              predict
              
                (
              
              title
              
                ,
              
               passage
              
                )
              
              
                )
              
            
          

結果為:

            
              
                {
              
              
                '國內'
              
              
                :
              
              
                [
              
              
                {
              
              
                '省'
              
              
                :
              
              
                '湖南'
              
              
                ,
              
              
                '市'
              
              
                :
              
              
                '長沙'
              
              
                }
              
              
                ]
              
              
                }
              
            
          

樣例2

            
              passage 
              
                =
              
              
                '近日,布魯塞爾爆發了大規模罷工游行,城市服務、商店、餐飲店均受到影響,原因和歐盟稅收等政策有關。'
              
              
                print
              
              
                (
              
              loc_reg
              
                .
              
              predict
              
                (
              
              passage
              
                )
              
              
                )
              
            
          

結果為:

            
              
                {
              
              
                '國外'
              
              
                :
              
              
                [
              
              
                '比利時'
              
              
                ]
              
              
                }
              
            
          

說明

  • 從輿情新聞數據中隨機抽取 100 篇自測,正確率 93%。其他類型文本未測試,效果待定。

如果覺得好用,請 follow 我一下 https://github.com/dongrixinyu


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 贵州省| 深圳市| 广宗县| 岢岚县| 上虞市| 东海县| 瑞金市| 新民市| 四子王旗| 沧州市| 裕民县| 麻江县| 高淳县| 同心县| 扬州市| 南郑县| 富裕县| 方城县| 鄂托克旗| 栖霞市| 广东省| 潜江市| 临洮县| 陇西县| 文水县| 清徐县| 图木舒克市| 昭平县| 兴和县| 随州市| 金坛市| 新营市| 藁城市| 湟中县| 丹江口市| 乌拉特中旗| 凌源市| 雷山县| 宁安市| 平昌县| 天柱县|