☯️ 概念✓ 品質審核
OCR
# OCR 光學字符識別(Optical Character Recognition,OCR)是一种将纸本、印刷或手寫的文字影像轉換為機器可讀編碼的技術。透過 [[圖像處理]]、特徵抽取與 [[深度學習]] 等演算法,系統能夠自動偵測並辨識各種字形的筆劃與結構,常見流程包括影像二值化、雜訊去除、文字行分割與字元比對。 在過去,`[[模式匹配]]` 是主流的識別方式,對受限字體(如印刷體)效果佳;近
OCR
光學字符識別(Optical Character Recognition,OCR)是一种将纸本、印刷或手寫的文字影像轉換為機器可讀編碼的技術。透過 圖像處理、特徵抽取與 深度學習 等演算法,系統能夠自動偵測並辨識各種字形的筆劃與結構,常見流程包括影像二值化、雜訊去除、文字行分割與字元比對。
在過去,[模式匹配](/n/concept/%E6%A8%A1%E5%BC%8F%E5%8C%B9%E9%85%8D) 是主流的識別方式,對受限字體(如印刷體)效果佳;近年來以捲積神經網路為基礎的 深度學習 大幅提升對手寫體、變形字體與雜訊影像的正確率。許多雲端服務提供商的 OCR API 同時結合光學辨識與自然語言處理,實現即時校對與資料結構化。
常見應用涵蓋 文件數位化、發票歸檔、郵件分揀以及 輔助視障人士 的 語音朗讀 系統,將掃描的內容即時轉換為可朗讀的文字,提升資訊無障礙取得。整體而言,OCR 已成為資訊數位化的關鍵基礎技術,未來在 機器學習 與端裝置上將更趨向低功耗與即時推論。
◇法緣留言(—)
載入中…