☯️ 概念
文本分類
文本分類是資訊檢索與自然語言處理領域的基礎技術,利用機器學習或規則方法將文字自動映射至預先定義的類別。在道教文獻研究中,常用於識別[[道教經典]]的性質、區分不同[[道派]]的教義文本,以及篩選與[[道教儀式]]相關的資料。常見的分類演算法包括[[支持向量機]]、[[深度學習]]等。 實作流程大致分為:首先收集並標註[[訓練語料]],接著進行文本預處理如斷詞與去除停用詞,然後選擇合適的[[特徵抽取
文本分類是資訊檢索與自然語言處理領域的基礎技術,利用機器學習或規則方法將文字自動映射至預先定義的類別。在道教文獻研究中,常用於識別道教經典的性質、區分不同道派的教義文本,以及篩選與道教儀式相關的資料。常見的分類演算法包括支持向量機、深度學習等。
實作流程大致分為:首先收集並標註訓練語料,接著進行文本預處理如斷詞與去除停用詞,然後選擇合適的特徵抽取方式,例如詞袋模型或詞向量,最後訓練分類器並評估其精確率與召回率。於道教數位人文專案中,文本分類可幫助建構道藏索引、提升檢索效率,並支援主題建模以發現隱含的教義脈絡。
◇法緣留言(—)
載入中…