鼎稔道學館
☯️ 概念

码点

碼點(Code Point)是 [[Unicode]] 編碼標準中的基本單位,指派給每個字符、符號或表情的唯一數值。Unicode 幾乎涵蓋世界上所有文字,並以「U+」後接十六進制數的方式表示,例如 U+0041 代表大寫字母 A。碼點本身是抽象的標識,僅表示字符的理論編號,與實際的位元組轉換無關。 將碼點轉換為可儲存或傳輸的位元組序列時,需要借助特定的編碼方案,例如 [[UTF-8]]、[[UT

⬇ Markdown / Obsidian🔗 v20260607

碼點(Code Point)是 Unicode 編碼標準中的基本單位,指派給每個字符、符號或表情的唯一數值。Unicode 幾乎涵蓋世界上所有文字,並以「U+」後接十六進制數的方式表示,例如 U+0041 代表大寫字母 A。碼點本身是抽象的標識,僅表示字符的理論編號,與實際的位元組轉換無關。 將碼點轉換為可儲存或傳輸的位元組序列時,需要借助特定的編碼方案,例如 UTF-8UTF-16UTF-32。這些編碼方式把同一個碼點按照不同的位元組順序與長度呈現,因而在記憶體佔用與傳輸效率上各有優勢。 在處理文本時,常會先确定目標的字符集,再選擇合適的 字符編碼 方案,以確保所有碼點都能正確映射。若使用不相容的編碼,可能導致亂碼,即無法還原原始的 Unicode 文字。 舉例來說,若要在網頁中顯示「😀」(笑臉表情),其碼點為 U+1F600。網頁若以 UTF-8 編碼儲存,該碼點會被轉換為 4 位元組的序列(F0 9F 98 80),而若以 UTF-16 編碼,則使用 2 位元組(D83D DE00)即可。 因此,了解碼點的意義與其在不同編碼中的表現,是正確處理多語言文本的關鍵。

法緣留言(

載入中…

ID: forager:concept:f0da4c93119d · 最後更新:2026/6/7· 版本:20260607 · 版本歷史

其他資料:學術論文(個別著作權)、本派傳承(CC0 1.0)。