摘要:前陣子想爬點東西,結果一直提示錯誤,在網上一查,發現是的控制臺的問題。控制臺的編碼是,是,造成了沖突。下面給出三種解決方法第一種方法直接替換出錯的內容第二種方法再解碼先用編碼,加個丟棄錯誤的字符,然后再解碼。
前陣子想爬點東西,結果一直提示錯誤UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘xa0’ in position,在網上一查,發現是 Windows 的控制臺的問題。控制臺的編碼是 GBK,Python 是 UTF-8,造成了沖突。下面給出三種解決方法:
第一種方法:直接替換出錯的內容import requests url = "https://segmentfault.com/a/1190000015617318" print(requests.get(url).text.replace("xa0", " "))第二種方法:再解碼
先用 GBK 編碼,加個 ignore 丟棄錯誤的字符,然后再解碼。
import requests url = "https://segmentfault.com/a/1190000015617318" print(requests.get(url).text.encode("gbk", "ignore").decode("gbk")第三種方法:修改控制臺編碼
新建一個 cmd.reg, 輸入代碼:
Windows Registry Editor Version 5.00 [HKEY_CURRENT_USERConsole\%SystemRoot%_system32_cmd.exe] "CodePage"=dword:0000fde9 "FontFamily"=dword:00000036 "FontWeight"=dword:00000190 "FaceName"="Consolas" "ScreenBufferSize"=dword:232900d2 "WindowSize"=dword:002b00d2
保存后運行。如果 Ctrl+B 無效,用 python.exe 打開.py程序后再試一次。
如果還有問題的話,可以在我的知乎和SF留言。
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/41979.html
摘要:如果統一規定每個字符用個或者個字節來存儲,那么每個英文字符都必然需要額外到個,這對存儲是很大的浪費。因此對于英語字母,編碼和碼是相同的。中文中文輸出這里同樣可以知道,中存放的是文件保存的編碼的碼。 unicode 與 utf-8 的關系 unicode 是 character set character set 是把每個字符對應成數字的集合,比如unicode中 A對應0041,漢字...
摘要:根據有效范圍作用域分為全局變量和局部變量。類型以開頭標識類型以開頭標識類型以進制的字節碼表示,實際上是一個字節串,回應了它的另一個名字。 < 返回索引頁 基本語法 Hello World 代碼注釋 關鍵字 數據類型 變量、常量 變量 變量賦值 變量命名 變量的作用域 常量 字符串與編碼 字符轉義 字符編碼 字符串操作 運算符與表達式 運算符 表達式 ...
摘要:中國人民看到這樣很不錯,于是就把這種漢字方案叫做。結果擴展之后的編碼方案被稱為標準,包括了的所有內容,同時又增加了近個新的漢字包括繁體字和符號。 聲明:文章借鑒自【徹底搞懂 python 中文亂碼問題】 一. 各種編碼的由來 1.1 ASCII編碼 很久很久以前,有一群人,他們決定用8個可以開合的晶體管來組合成不同的狀態,以表示世界上的萬物。他們看到8個開關狀態是好的,于是他們把這稱為...
摘要:常見的字符編碼有編碼,編碼,編碼等。碼只規定了個字符的編碼,這在美國是夠用的。小結是一種針對的可變長度字符編碼,它是的實現方式之一。 字符編碼是計算機編程中不可回避的問題,不管你用 Python2 還是 Python3,亦或是 C++, Java 等,我都覺得非常有必要厘清計算機中的字符編碼概念。本文主要分以下幾個部分介紹: 基本概念 常見字符編碼簡介 Python 的默認編碼 Py...
摘要:關于中文為了處理漢字,程序員設計了用于簡體中文的和用于繁體中文的。年一共收錄了個字符,包括個漢字和個其它符號。年的是取代的正式國家標準。區分中文編碼的方法是高字節的最高位不為。 Python 2和 Python3的區別 3.0有Unicode support ,這代表著可以直接默認寫中文,2是不行的 有一些庫改名了,但表面上變化不大,都是些大寫變小寫,下劃線沒了之類的 Twisted...
閱讀 1229·2021-11-15 11:37
閱讀 2246·2021-09-30 09:55
閱讀 4483·2021-09-22 15:51
閱讀 3741·2021-09-22 15:46
閱讀 2766·2019-08-30 15:52
閱讀 423·2019-08-29 16:20
閱讀 2889·2019-08-29 15:12
閱讀 1130·2019-08-26 18:27