摘要:一提到字符編碼,我身邊的好多朋友都揮手,拜拜字符編碼就像一個烙印深深地印在心底,成為心病。所以當計算機在全球范圍內進行覆蓋時,各國紛紛制定屬于本國的專屬字符編碼方案。知道了每個字符編碼的由來,我們再看中編碼疑問就很好解釋了。
一提到字符編碼,我身邊的好多朋友都揮手,拜拜!字符編碼就像一個烙印深深地印在心底,成為心病。
今天就來啃一啃這老骨頭。
我們遇到過哪些編碼?
ASCII,ANSI,GB2312,GBK,Unicode,UTF-8,MBCS,JIS,KS等等,為什么會出現這么多不同的編碼,他們之間又有什么不同呢?
我們可以看看字符編碼的歷史,就能解決心中的疑惑了
由圖可見,計算機當時從美國誕生,所以美國在設置字符編碼的時候,并未考慮其它國家。所以當計算機在全球范圍內進行覆蓋時,各國紛紛制定屬于本國的專屬字符編碼方案。由于各個方案互相并不兼容,所以便有Unicode一統天下。
知道了每個字符編碼的由來,我們再看python中編碼疑問就很好解釋了。
python3將系統默認編碼設置為utf-8
python3用str表示Unicode所有字符,bytes類型表示二進制數據
兩者之間關系為:
b = "好" print(type(b)) //c = b.encode("utf-8") print(type(c)) // c = b.encode("ASCII") print(type(c)) //報錯,ASCII不支持中文 d = c.decode("utf-8") print(type(d)) // d = c.decode("gb2312") print(type(d)) //報錯,解碼格式和編碼格式不同
注意事項:
一般編碼和解碼格式保持一致,即使用utf-8編碼后,也要用utf-8解碼。否則可能會報錯
含有中文的字符編碼時不能采用ASCII,因為它不支持中文
習慣:雖然python3去除了python2字符編碼的很多詬病,但是一些習慣還是保持下去
譬如頭文件添加編碼注釋
#!/usr/bin/env python3 # -*- coding: utf-8 -*-
如果問python2中怎么辦呢?
棄坑吧!
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/41354.html
摘要:如果傳一個中文,下和下編碼分別是和,可以自己用打印看看文件中寫死,本來理解是跟這個文件本身編碼有關,但文件編碼同樣是的情況下,下打印了的超集,下仍然是。 對編碼問題一直一知半解,之前也是得過且過,正好有個同事要我幫忙寫個腳本,涉及這方面的問題,借這個契機研究了一下. 先貼幾篇比較好的: 1.阮老師的上古文章(07年…),雖然古老但對理解幫助很大,從最基礎講起,邏輯清晰易理解. (ps:...
摘要:紀念我的第一個爬蟲程序,一共寫了三個白天,其中有兩個上午沒有看,中途遇到了各種奇怪的問題,伴隨著他們的解決,對于一些基本的操作也弄清楚了。我這個程序想要獲取的是劍來小說,把各個章節的內容爬去下載存儲到文件里。 紀念我的第一個爬蟲程序,一共寫了三個白天,其中有兩個上午沒有看,中途遇到了各種奇怪的問題,伴隨著他們的解決,對于一些基本的操作也弄清楚了。果然,對于這些東西的最號的學習方式,就是...
摘要:大家好,我是一行之前一行分享過好用的幾種編輯器,測試有沒有下載成功,用來做數據分析,開發的大殺器,等等,小眾猿群使用那在用這個開發大殺器的同時,一行也來分享幾個它很好用的插件,來給你的搬磚提提速可以作為摸魚好助手次下載 ...
摘要:如果你有疑問,或許可以參考創建密鑰使用谷歌將語音轉換為文字。將其取出,得到字典。 在之前發布的使用谷歌Cloud Speech API將語音轉換為文字一文中,我們實現了在控制臺使用curl發送post請求,得到語音轉文字的結果;而在Python中使用谷歌Cloud Speech API將語音轉換為文字一文中,我們實現了安裝Cloud Speech API客戶端庫,通過調用庫函數得到語音...
摘要:一旦建立了虛擬化層,并通過元數據進行數據管理,就可以執行以前無法完成的各種事情。一旦將元數據和數據的管理分開,所有消失了。當您虛擬化數據時,所有這些事情都是可能的,因為與孤立的存儲基礎架構相比,元數據的使用更加靈活。如果您已經在使用Kubernetes了,則可能有一個簡單的原因:它使您的生活更輕松。畢竟,這是基于容器編排的整個前提。它讓基礎設施變得可支配,在需要時將其旋轉,完成后將其丟棄,因...
閱讀 1408·2021-09-23 11:21
閱讀 3105·2019-08-30 14:14
閱讀 3187·2019-08-30 13:56
閱讀 4136·2019-08-30 11:20
閱讀 1949·2019-08-29 17:23
閱讀 2765·2019-08-29 16:14
閱讀 1693·2019-08-28 18:18
閱讀 1490·2019-08-26 12:14