反向連結 · 資訊檢索
所有透過 [[資訊檢索]] wikilink 或 /n/concept/%E8%B3%87%E8%A8%8A%E6%AA%A2%E7%B4%A2 內部連結 引用此節點的其他條目。
共找到 19 個反向引用。
☯️ 概念19 筆
詞典學
詞典學是[[語言學]]的重要分支,專門研究詞典的編纂理論與實踐。它涵蓋詞典的結構設計、釋義原則、詞目選擇與排序、標注規範以及詞典批評等面向。隨著資訊技術的發展,[[電子詞典]]與[[線上詞庫]]的建構成為新趨勢,並與[[計算語詞典學]]、自然語言處理等領域密切相關。 詞典學的歷史可追溯至古代的《[[說文解字]]》與《[[爾雅]]》,這些早期詞典奠定了編纂的基
更新:2026/6/6
資料模型
# 資料模型 資料模型是一種用來抽象描述資訊結構與關係的模型,廣泛應用於資訊系統設計、資料庫管理等領域。透過概念、屬性及關聯的定義,資料模型能將複雜的資訊以結構化的方式呈現,便於資料的存取與管理。 在道教的數位化過程中,資料模型扮演關鍵角色。透過將經典、人物、宮觀、儀式等實體轉化為模型化的對象,能夠建立統一的[[資訊架構]],並在[[資料庫]]中進行高效檢索
更新:2026/6/6
搜索引擎
搜索引擎是一種 [[資訊檢索]] 系統,主要透過 [[爬蟲]] 自動收集全球網頁並建立 [[索引]],使用者在輸入 [[關鍵字]] 後,系統依據 [[排名演算法]] 計算相關性,將結果依序呈現常見的搜尋引擎如 [[Google]]、[[Bing]]、[[Yahoo]] 都提供免費、快速且精確的檢索服務。這類平台不僅支援文字檢索,還能處理圖片、影片與新聞等多媒
更新:2026/6/5
BM25
BM25(Best Matching 25)是資訊檢索領域中用來衡量文件與查詢相關性的核心排名函數。1990年代中期由 Stephen Robertson 與 Karen Spärck Jones 研發,旨在改進傳統的 [[TF-IDF]] 模型。它在計算相關性分數時同步考量三項要素:詞彙頻率(TF)、逆文檔頻率(IDF)以及文件長度的正規化。透過引入平均文
更新:2026/6/5
語意分析
## 語意分析 語意分析是一種自然語言處理([[自然語言處理]])技術,目的在從文本中擷取詞彙、句子乃至篇章的深層意義。它透過[[語法]]結構與[[語義規則]]的結合,將語言符號轉化為電腦可運算的語義表示,使機器能夠理解作者的意圖與情感。 此項技術在資訊檢索([[資訊檢索]])和機器翻譯([[機器翻譯]])系统中扮演關鍵角色,亦廣泛應用於數位典藏([[數位典
更新:2026/6/5
術語識別
「術語識別」是指在文本中自動偵測與擷取專業術語或領域詞彙的技術。它透過[[自然語言處理]]與[[統計方法]],結合[[機器學習]]或[[深度學習]]模型,從大量原始文句裡篩選出具有特定語意或領域意義的詞語。 常見的識別流程可分為三個主要步驟:預處理、候選詞產生與特徵過濾。預處理階段會進行分詞、詞性標注以及([[語料庫]])清洗;在候選詞產生時,可利用[[語言
更新:2026/6/5
關鍵字抽取
## 關鍵字抽取 關鍵字抽取是一種文字處理與資訊檢索技術,旨在從大量文本中自動識別並擷取出具代表性的重要詞彙或片語。它通常結合[[自然語言處理]]與[[文本挖掘]]方法,透過統計語言模型、語法規則或機器學習排序,將文件中的核心概念篩選出來。此技術在[[資訊檢索]]、自動摘要與[[文本分類]]等領域有廣泛應用,同時也是建構[[知識圖譜]]的前置步驟之一。尤其在
更新:2026/6/5
电子文献
電子文獻是指以電子形式儲存、處理與傳遞的文字、圖像、聲音或多媒體資料,通常呈現於電腦、伺服器或行動裝置等數位載體上。在道教領域,許多傳統經典如《[[道藏]]》已陸續[[數位化]],成為可供網路檢索與下載的電子文獻,方便研究者與信徒查閱與流傳。電子文獻的優勢包括檢索快速、儲存空間小、易於備份與共享,但同時也面臨版本[[真偽]]、版權與[[數位保存]]等問題。
更新:2026/6/5
文本分析
文本分析是指利用電腦輔助或人工手段,對大量文字資料進行系統化的解析,以提取結構化資訊與隱藏模式的一門技術。常見的方法包括詞彙頻率統計、語法樹解析、情感傾向判斷、機率主題模型(如[[主題模型]])以及語義網路建構(可參考[[語義網路]])。在自然語言處理([[自然語言處理]])與資訊檢索([[資訊檢索]])領域,這些技術支撐了關鍵詞抽樣、文章分類與語意搜索等功
更新:2026/6/5
資訊科學
# 資訊科學 資訊科學是研究資訊的組織、儲存、檢索與傳播的跨學科領域,融合了[[圖書館學]]、[[電腦科學]]、[[認知心理學]]與[[通訊技術]]等理論與技術。其核心目標在於建立高效能的資訊管理系統,使資訊能在需要時迅速且精確地被取得與利用。 在實務上,資訊科學涉及[[資訊檢索]]、[[資料庫管理系統]]、[[數據挖掘]]以及[[雲端運算]]等技術,提供從
更新:2026/6/5
數位素養
# 數位素養 數位素養指的是在資訊科技與網路環境中,個人能夠有效 **運用**、**評估**、**理解** 並 **創造** 數位內容的能力。它涵蓋多個核心面向,例如[[資訊檢索]]、 [[媒體識讀]]、 [[網路安全]] 與 [[資訊倫理]] 等。 在資訊處理過程中,使用者需要具備 [[批判性思維]],並以 [[終身學習]] 的態度面對不斷更新的技術。這樣
更新:2026/6/5
詞彙抽取
詞彙抽取是[[自然語言處理]]中的一項核心任務,旨在從大量原始文本中自動識別並擷取具代表性的詞彙或專業術語。整個過程通常包括文本預處理、候選詞生成、重要性評估以及篩選等步驟,常借助統計模型、機器學習或深度學習方法實現。透過[[關鍵詞提取]]技術,可快速獲得文件的核心概念,進一步應用於[[語義分析]]、資訊檢索與[[文本挖掘]]等場景。 在實際應用上,詞彙抽取
更新:2026/6/5
查詢語言
「查詢語言」是一種用於在[[資訊檢索]]系統中依據特定條件從大量資料中挑選出目標記錄的編程語言語法。它不專屬於道教思想體系,而是電腦科學中的通用概念,廣泛應用於[[SQL]]、[[NoSQL]]以及[[SPARQL]]等資料庫檢索環境。 在道教數位典藏的平台上若要實現快速查找文句、出處或人物,通常會借用的關聯式查詢語句,或使用更靈活的圖譜查詢語言如[[Gra
更新:2026/6/5
類書學
類書學是針對古代中國「類書」的系統研究,属於文獻學與比較文化研究的交叉學科。它旨在探討類書的編纂動機、體例結構、資料來源,以及在[[經學]]、[[史學]]與[[道教]]等領域的實際應用。透過《[[四庫全書]]》、《[[永樂大典]]》與《[[古今圖書集成]]》等範例的分析,可揭示傳統知識體系的組織原則與分類邏輯。同時,類書學的方法對[[數位化]]及[[資訊檢索
更新:2026/6/5
文本挖掘
文本挖掘(Text Mining)是一種從大量非結構化或半結構化文字資料中自動萃取出有用資訊與知識的技術。它結合 [[自然語言處理]]、 [[機器學習]] 與 [[統計分析]] 方法,透過詞彙、語法與語義的解析,揭示隱藏的模式與趨勢。常見的工作流程包括文字清洗、分詞、去停用詞、特徵擷取(如 TF‑IDF 或詞嵌入),以及模型訓練與評估。 在實際應用上,文本挖
更新:2026/6/5
餘弦相似度
餘弦相似度是一種在向量空間中衡量方向的度量指標,常用於[[機器學習]]與[[資訊檢索]]等領域。其取值範圍介於[-1, 1],其中 1 表示兩向量指向完全相同的方向,0 表示正交無關,-1 則代表方向完全相反。透過計算向量的[[餘弦定理]]可快速取得相似度數值。 在[[文本處理]]中,常將文件或詞語轉換為高維[[特徵空間]]的向量,再利用餘弦相似度來比較其相
更新:2026/6/5
TF-IDF
TF-IDF(詞頻-逆文檔頻率)是一種常用於[[資訊檢索]]與[[文字探勘]]的統計數值,用以衡量單一詞彙在文件集合中的重要程度。它同時考慮詞在該文件出現的次數(TF)以及該詞在整個[[語料庫]]中出現的稀有程度(IDF),兩者相乘得到的數值越高,表示該詞越具有區分度,常用於[[關鍵字抽取]]與[[搜尋排序]]。計算時,TF 取該詞在文件中的出現頻率,IDF
更新:2026/6/5
圖書學
圖書學是一門研究圖書館事業、圖書館管理及資訊服務的學科領域,常與[[圖書館學]]或[[資訊科學]]交替使用。 它涵蓋圖書館的組織結構、經營策略、館藏發展、分類編目、資訊檢索、讀者服務以及數位典藏與資訊素養等理論與實務。 隨著資訊科技進展,圖書資訊學亦關注[[數位圖書館]]、資訊系統整合與[[知識管理]]的創新模式。 教學與研究常結合[[目錄學]]與[[資訊檢
更新:2026/6/5
情報科學
情報科學是研究資訊從產生到傳遞全過程的學科,主要涵蓋[[圖書館學]]、[[資訊檢索]]、[[資料庫系統]]、[[資訊管理]]與[[資訊科技]]等領域。其核心理念在於有效收集、合理整理、安全儲存、快速檢索及正確傳播資訊,以滿足使用者多樣化的需求近年來,隨著大數據與人工智慧的快速發展,情報科學的範疇進一步擴展至[[數據挖掘]]、[[機器學習]]以及[[雲端運算]
更新:2026/6/5