當前位置:菜譜大全網 - 菜譜家常菜做法 - 按重量復制的原因

按重量復制的原因

我們在上網的時候,不用擔心網站采用的編碼格式,但是頁面中時不時出現的亂碼還是會讓我們頭疼。這壹點,火狐的用戶深有體會,用火狐瀏覽網頁的機會比用ie瀏覽器要多得多。亂碼主要與字符編碼系統有關。比如壹個網頁中經常出現亂碼“Google”(百度,Google),出現在新舊編碼體系的轉換中。網友est專門寫了壹篇文章研究問題的來源:

在Unicode和舊編碼體系轉換的過程中,壹定會有壹些詞不能用Unicode表示。Unicode官員用壹個占位符來代表這些單詞,這就是:U+FFFD替換字符。

然後對U+FFFD的UTF-8進行編碼,正好是' '。如果這個''重復多次,比如'',然後在GBK/CP 936/GB 2312/GB 18030的環境下顯示,壹個漢字有2個字節,最後的結果是:發發發(0xEFBF),金。

Python代碼:1。& gt& gt& gtu'\uFFFD '。編碼(' utf-8')*22。' '3.& gt& gt& gt4.& gt& gt& gtPrintu' \ ufffd '。編碼(' UTF-8') * 2輸出結果:“復制”。