☯️ 概念✓ 品質審核

OCR

# OCR 光學字符識別（Optical Character Recognition，OCR）是一种将纸本、印刷或手寫的文字影像轉換為機器可讀編碼的技術。透過 [[圖像處理]]、特徵抽取與 [[深度學習]] 等演算法，系統能夠自動偵測並辨識各種字形的筆劃與結構，常見流程包括影像二值化、雜訊去除、文字行分割與字元比對。在過去，`[[模式匹配]]` 是主流的識別方式，對受限字體（如印刷體）效果佳；近

⬇ Markdown / Obsidian 🔗 v20260605

OCR

光學字符識別（Optical Character Recognition，OCR）是一种将纸本、印刷或手寫的文字影像轉換為機器可讀編碼的技術。透過圖像處理、特徵抽取與 深度學習 等演算法，系統能夠自動偵測並辨識各種字形的筆劃與結構，常見流程包括影像二值化、雜訊去除、文字行分割與字元比對。

在過去，[模式匹配](/n/concept/%E6%A8%A1%E5%BC%8F%E5%8C%B9%E9%85%8D) 是主流的識別方式，對受限字體（如印刷體）效果佳；近年來以捲積神經網路為基礎的 深度學習 大幅提升對手寫體、變形字體與雜訊影像的正確率。許多雲端服務提供商的 OCR API 同時結合光學辨識與自然語言處理，實現即時校對與資料結構化。

常見應用涵蓋 文件數位化、發票歸檔、郵件分揀以及 輔助視障人士 的語音朗讀系統，將掃描的內容即時轉換為可朗讀的文字，提升資訊無障礙取得。整體而言，OCR 已成為資訊數位化的關鍵基礎技術，未來在 機器學習 與端裝置上將更趨向低功耗與即時推論。

◇法緣留言（—）

載入中…