摘要:參考的資料前輩們已經對字符編碼講的很好了,通俗易懂。字符編碼的誕生是人類對科學技術妥協的結果。字符編碼為什么有很多方式。這是從計算機層面總體上對字符編碼的認識。中的一些字符集字符編碼知識
以前在工作中遇到導出中文亂碼時,就google一下,看見把utf-8編碼換成GBK之類的編碼,導出在Excel中打開就不會亂碼了。只是解決了當前問題。對字符編碼沒有很好的認識。這次又遇到了,遂記錄之。
參考的資料:
https://my.oschina.net/leejun...
http://www.ruanyifeng.com/blo...
前輩們已經對字符編碼講的很好了,通俗易懂。我就簡單的整理下用自己的話復述一遍。
1、我們為什么需要字符集和字符編碼?
計算機只認識0和1,不認識其他任何字符。而計算機是為人服務的,是人就有溝通語言,有語言就有語言符號,要實現普通人與計算機溝通,字符編碼就必然出現了,同理,各種語言就會有不同編碼方式的字符編碼。字符編碼的誕生是人類對科學技術妥協的結果。
2、是誰主導字符編碼?
老美,計算機是老美發明的,盡管現在全世界開放共贏,作為先驅者在一定程度上具有話語權(不服?有本事你也搞個革命性的發明來)。后來者也只能依據他來制定,這是歷史包袱,任何時代都無法改變。他根據他們的語言特色,美國國家標準學會(American National Standard Institute , ANSI )制定了 ASCII(American Standard Code for Information Interchange,美國信息交換標準代碼)編碼。我建議:不僅記住縮寫,要記住全稱。
3、字符編碼為什么有很多方式。
全世界都知道計算機好,都要用了。我們知道,語言成為不同國家、民族最鮮明的特征之一。怎么辦,每個國家自己都制定一套類似ASCII碼的編碼,就是我們常說的 GBK、GB2312、BIG5、Unicode等等。原理一樣,只是對應規則不同而已。
4、Unicode 萬國碼(是一種字符集)
顧名思義:就算你有一萬個國家,有一萬種語言字符。我也能裝得下。大家只要生活在地球上,只要使用計算機,突破語言限制,使用此種字符集。
5、在當前實際運用過程中,最普遍用到的是UTF-8方式的編碼。
以上做個簡單的總結。這是從計算機層面總體上對字符編碼的認識。
有時間我會總結一篇關于mysql中一些字符相關知識。
2、mysql中的一些字符集、字符編碼知識
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/31732.html
摘要:場景讀取一個大文本文件,并輸出到控制臺。示例代碼如下至少為,因為最大為字節,阻止讀取跨界數據恢復 場景:讀取一個大文本文件,并輸出到控制臺。 在這里我們選擇使用nio進行讀取文本文件,在輸出的過程中,有些文件中英文都顯示正常,有些則偶爾出現中文亂碼,經思考發現,在 ByteBuffer.allocate 時分配空間,如果中英混合的文件中就會出現中文字符只讀取了一部分的問題,如果文本為等...
摘要:中國大陸幾乎所有的中文系統和國際化的軟件都支持。與相應的國家標準中的其它漢字,以上合計個漢字。,全稱國家標準信息技術中文編碼字符集,是中華人民共和國現時最新的內碼字集,是信息技術信息交換用漢字編碼字符集基本集的擴充的修訂版。 實戰PHP導出Excel-CSV文件 導出后的效果 先給各位看一下導出的效果,而后再進行代碼分析 showImg(https://segmentfault.co...
摘要:中國大陸幾乎所有的中文系統和國際化的軟件都支持。與相應的國家標準中的其它漢字,以上合計個漢字。,全稱國家標準信息技術中文編碼字符集,是中華人民共和國現時最新的內碼字集,是信息技術信息交換用漢字編碼字符集基本集的擴充的修訂版。 實戰PHP導出Excel-CSV文件 導出后的效果 先給各位看一下導出的效果,而后再進行代碼分析 showImg(https://segmentfault.co...
閱讀 3609·2021-11-15 11:37
閱讀 2974·2021-11-12 10:36
閱讀 4403·2021-09-22 15:51
閱讀 2381·2021-08-27 16:18
閱讀 881·2019-08-30 15:44
閱讀 2163·2019-08-30 10:58
閱讀 1769·2019-08-29 17:18
閱讀 3269·2019-08-28 18:25