鼎稔道學館
☯️ 概念

文本分類

文本分類是資訊檢索與自然語言處理領域的基礎技術,利用機器學習或規則方法將文字自動映射至預先定義的類別。在道教文獻研究中,常用於識別[[道教經典]]的性質、區分不同[[道派]]的教義文本,以及篩選與[[道教儀式]]相關的資料。常見的分類演算法包括[[支持向量機]]、[[深度學習]]等。 實作流程大致分為:首先收集並標註[[訓練語料]],接著進行文本預處理如斷詞與去除停用詞,然後選擇合適的[[特徵抽取

⬇ Markdown / Obsidian🔗 v20260606

文本分類是資訊檢索與自然語言處理領域的基礎技術,利用機器學習或規則方法將文字自動映射至預先定義的類別。在道教文獻研究中,常用於識別道教經典的性質、區分不同道派的教義文本,以及篩選與道教儀式相關的資料。常見的分類演算法包括支持向量機深度學習等。

實作流程大致分為:首先收集並標註訓練語料,接著進行文本預處理如斷詞與去除停用詞,然後選擇合適的特徵抽取方式,例如詞袋模型或詞向量,最後訓練分類器並評估其精確率與召回率。於道教數位人文專案中,文本分類可幫助建構道藏索引、提升檢索效率,並支援主題建模以發現隱含的教義脈絡。

法緣留言(

載入中…

ID: forager:concept:5b7b71c6eaa1 · 最後更新:2026/6/7· 版本:20260606 · 版本歷史

其他資料:學術論文(個別著作權)、本派傳承(CC0 1.0)。

文本分類(概念) · 鼎稔道學館