>>s=['\u4e2d\u56fd','\u6e05\u534e\u5927\u5b66']>>>str=s[0].decode('unicode_escape')#.encode("EUC_KR")>>>printstr中國當字符串是:'東亞學團一中'>>>printunichr(19996)東ord()支持uni" />

日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

python中文編碼問題小結(jié)

系統(tǒng) 1682 0

中文編碼問題一直是Python程序設(shè)計中很頭痛的問題,本文對此較為詳細的進行了總結(jié)歸納。具體如下:
?
當字符串是:'\u4e2d\u56fd'?

            
>>>s=['\u4e2d\u56fd','\u6e05\u534e\u5927\u5b66']
>>>str=s[0].decode('unicode_escape') #.encode("EUC_KR")
>>>print str
中國

          

當字符串是:' 東亞學團一中'

            
>>>print unichr(19996)
東

          

ord()支持unicode,可以顯示特定字符的unicode號碼,如:

            
>>>print ord('A')
65

          

只要和Unicode連接,就會產(chǎn)生Unicode字串。如:

            
>>> 'help'
'help'
>>> 'help,' + u'python'   
u'help,python'

          

對于ASCII(7位)兼容的字串,可和內(nèi)置的str()函數(shù)把Unicode字串轉(zhuǎn)換成ASCII字串。如:

            
>>> str(u'hello world')
'hello world'

          

對幾個概念的理解:

ASCII碼 用數(shù)據(jù)字 對應 相應的字符 如下圖所示:

python中文編碼問題小結(jié)_第1張圖片

而中文 就是區(qū)位碼對應漢字。如:“好” 的ASCII碼為: 22909
?
unicode 編碼 每個國家分一塊。它有UTF-8、UTF-16、UTF-32等形式
中文范圍 4E00-9FBF:這個范圍內(nèi)有 gbk,gb2312,
?
utf-8是基于unicode的 國際化的場合適合使用

gb2312和gb2312都是國標碼 出現(xiàn)的較早 主要用于編解碼常用漢字

希望本文所述對大家的Python程序設(shè)計有所幫助。


更多文章、技術(shù)交流、商務合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯(lián)系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發(fā)表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 肥东县| 屏东市| 茂名市| 界首市| 三门县| 汉川市| 赤城县| 舒城县| 偏关县| 黄骅市| 眉山市| 册亨县| 锦州市| 米泉市| 巴彦县| 卢龙县| 乐山市| 延吉市| 项城市| 深圳市| 印江| 高安市| 屯门区| 延吉市| 绥化市| 沅江市| 来凤县| 筠连县| 桃园县| 固镇县| 肇州县| 拜城县| 新民市| 乌审旗| 岳西县| 玛纳斯县| 栾城县| 吴旗县| 济宁市| 哈尔滨市| 瓮安县|