道教數位典藏方法考:經典標記、神譜資料庫與儀式文本知識圖譜
道教文獻的數位典藏是當代漢學與宗教研究領域中兼具基礎性與前瞻性的重大課題。明《正統道藏》(1445年刊行)與《萬曆續道藏》(1607年刊行)合計收錄典籍凡一千四百八十六種,加上明清以降的《藏外道書》《道藏輯要》以及敦煌遺書中的道教寫本,道教文獻總量龐大、類型繁複、結構獨特,其數位化迫切性早已為學界所共識。然而,相較於佛教大藏經數位化已建立以中華電子佛典協會(CBETA)為代表的成熟標準,道教文本的數位典藏仍長期停留在「影像掃描+全文檢索」的初級階段,結構化語義標記、跨文本知識組織與開放資料生態的建設明顯滯後。 本文主張,推動道教數位典藏的深度發展,需採取結構化標記(TEI/XML)、神譜資料
摘要
道教文獻的數位典藏是當代漢學與宗教研究領域中兼具基礎性與前瞻性的重大課題。明《正統道藏》(1445年刊行)與《萬曆續道藏》(1607年刊行)合計收錄典籍凡一千四百八十六種,加上明清以降的《藏外道書》《道藏輯要》以及敦煌遺書中的道教寫本,道教文獻總量龐大、類型繁複、結構獨特,其數位化迫切性早已為學界所共識。然而,相較於佛教大藏經數位化已建立以中華電子佛典協會(CBETA)為代表的成熟標準,道教文本的數位典藏仍長期停留在「影像掃描+全文檢索」的初級階段,結構化語義標記、跨文本知識組織與開放資料生態的建設明顯滯後。
本文主張,推動道教數位典藏的深度發展,需採取結構化標記(TEI/XML)、神譜資料庫(Ontology)、儀式文本知識圖譜(RDF/OWL)三位一體的方法論框架。此框架的內在邏輯在於:TEI/XML 解決「文本如何被結構化描述」的問題,Ontology 解決「神祇與概念如何被本體化建模」的問題,RDF/OWL 解決「知識如何被關聯化組織與推理」的問題,三者構成由「微觀文本結構」到「中觀知識領域」再到「宏觀語義網絡」的漸進式方法論體系。在經典標記層面,道教經文並非單一文類,而是「經、科、儀、咒、符、訣、法」多重文類混編的複合型文本,TEI P5 的模組化設計(core、textstructure、figures、gaiji、verse 等模組)為其提供了國際標準的標記基礎,但仍需針對道藏特有的三洞四輔十二類分類架構、異體字與缺字問題、符籙圖像與文字的混排現象進行在地化擴展。在神譜資料庫層面,道教神祇體系層級繁複(如玉皇大帝—紫微大帝—北斗七元君—九皇大帝的階層結構),適合以本體論(Ontology)建模,透過 RDF 三元組表達神格之間的從屬、職司與對應關係,並可銜接 Chinese Religious Text Authority(CRTA)等國際權威檔案基礎設施。在儀式文本知識圖譜層面,科儀文獻具有「法」與「儀」的雙重結構,呂鵬志所論的朝、傳、齋、醮、章五大儀式類型,以及謝世維所分析的斗母法術科儀之「法—儀」混編特徵,均可透過知識圖譜的節點(儀式類型、儀節、法器、空間、神祇)與關係(hasRitualStep、usesTalisman、invokesDeity)進行結構化重構。
本文的實證觀察顯示,以 lius.cc 為代表的道教知識平台已積累經典節點二萬四千餘筆、神祇節點一萬三千餘筆、儀式節點一萬一千餘筆,具備推動結構化數位轉型的素材基礎;然而,「知識圖譜」與「TEI/XML 結構化標記」在現有資料庫中仍屬空白領域。本文透過國際比較視野(佛典 CBETA、聖經校勘學、Europeana 語義網架構)與技術規格分析,提出道教數位典藏從「文件中心」邁向「資料中心」的方法論路徑,為下一代道教數位人文基礎建設提供理論與實務參照。
一、引言:問題意識與學術空缺
(一)道教文獻的豐富性與數位化迫切性
道教是中國本土產生的宗教傳統,其文獻積累歷時兩千餘年,涵蓋經典、科儀、符籙、齋醮、方術、仙傳、戒律、注疏等多元類型,構成了中國傳統文化中極為龐大且獨特的知識體系。明代《正統道藏》於正統年間(1445年)刊行,萬曆年間(1607年)又續修《萬曆續道藏》,兩者合計收錄典籍一千四百八十六種,分裝於三洞(洞真、洞玄、洞神)、四輔(太玄、太平、太清、正一)與十二類(本文、神符、玉訣、靈圖、譜錄、戒律、威儀、方法、眾術、記傳、讚頌、奏表)的分類架構之中(Schipper & Verellen 2005, pp. 1-15)。此一分類法雖具道教內部的宗教邏輯,卻與現代學科分類(哲學、歷史、醫學、科技史、文學)呈現複雜的交錯關係,為數位化組織帶來根本性的分類挑戰。
除官方道藏之外,道教文獻的版圖尚包括明清以降大量未收入正續道藏的「藏外」文獻,如《道藏輯要》《道藏精華》,以及二十世紀以來學術界整理出版的《藏外道書》《中華道藏》等。敦煌莫高窟藏經洞出土的道教寫本(法國國家圖書館藏伯希和蒐集本、大英圖書館藏斯坦因蒐集本、中國國家圖書館藏北敦本)更為道教文獻學增添了珍貴的早期版本材料。這些文獻不僅數量龐大,更涉及經文、科儀程序、咒語韻文、符籙圖像、壇場配置圖、法印篆刻等多種媒材形式,其數位保存與結構化組織的迫切性,已成為推動道教研究現代化的關鍵瓶頸。
卿希泰主編之《中國道教史》(成都:四川人民出版社,1996)四卷本,以及卿希泰與唐大潮合著之《道教史》(江蘇人民出版社/文物出版社,1994初版、2006再版),為道教文獻的歷史脈絡提供了權威性的學術導引。李豐楙在論述臺灣道教研究四十年的發展時指出,臺灣道教學的長足進展,得益於《道藏》與《道藏輯要》的多家刊行,而當前則面臨「數位化大趨勢」的新挑戰(李豐楙,〈臺灣道教研究四十年〉,《中國文哲研究通訊》29.4〔2019〕,頁583)。施舟人(Kristofer Schipper, 1934-2021)領導的「道藏工程」耗時二十五年,最終成果為 2005 年芝加哥大學出版的《道藏通考》(The Taoist Canon: A Historical Companion to the Daozang),該書為一千五百餘部道經撰寫學術導讀,不僅是道教文獻學的里程碑,更為後續數位化奠定了堅實的文本學基礎(Schipper & Verellen 2005)。
然而,文獻的豐富性與數位化建設的滯後性之間存在顯著落差。目前主要的道教數位資源——包括中央研究院中國文哲研究所 2026 年推出的「道教經典庫初集」(收錄正統道藏、萬曆續道藏共 1,486 種典籍)、北京愛如生「道教經典庫」(分為道藏編與藏外道書編)、香港中文大學「道教數位博物館」(以道教科儀文獻、道教碑刻文獻、呂祖道書文獻為三大主軸)——雖在影像掃描與全文檢索方面取得可觀成就,但絕大多數仍停留在「影像+錄文」的資料庫模式,尚未進入以語義標記(semantic markup)、校勘編碼與知識圖譜化為特徵的「深度數位化」階段。
(二)現有道教數位典藏的成就與局限
現有道教數位典藏項目的技術光譜,可從「開放程度」與「結構化深度」兩個維度加以評估。在開放程度方面,Kanripo(漢籍リポジトリ)由京都大學 Christian Wittern 教授建置,採用創新的開放資料模式,將所有資料直接存放於 GitHub 公開倉庫,以純文字為主、檔頭記錄 metadata,極易解析與再利用(洪振洲,〈開放資料服務於漢籍數位人文研究資源之發展與應用〉,國家圖書館)。中國哲學書電子化計劃(CTEXT)亦採開放取用(Open Access)原則,收錄大量道教原典文獻。然而,這類開放平台多以「文本呈現」與「全文檢索」為核心功能,缺乏對文本內部結構的語義標記。
在結構化深度方面,中華電子佛典協會(CBETA)自 1998 年起採用 TEI/XML 作為標記語言,為全球宗教文本數位化樹立了標竿。CBETA 的方法論包括:分層作業流程(校對組進行基礎標記,研發組轉為正式 XML/TEI)、在地化擴展(針對漢籍特有的「經」「卷」「品」「會」結構自訂標記),以及 Dublin Core 後設資料的整合(釋惠敏等,〈簡介 Metadata 於佛教電子文獻的應用〉,《中華電子佛典協會新聞電子報》第6期〔1999-10-25〕;Huimin Bhikkhu et al., "Techniques for Collating Multiple Text Versions in the Digitization of Classical Texts," Chung-Hwa Buddhist Journal 18〔2005〕: 299-325)。相較之下,道教文本數位化在結構化標記方面的應用「尚不及佛典成熟」(胡士穎,〈道教數字人文平台建設芻議〉,《中國道教》2019年第6期,頁82-85)。
胡士穎在上述論文中進一步指出,目前道藏類文獻資料庫雖成果較為成熟,但仍普遍存在「圖像掃描不夠精細、文字提取不夠精確」等問題。未來應增強數據類型及應用,提升數據質量,利用雲計算、國際圖像互操作(IIIF)、鏈接開放數據(Linked Open Data)等技術,實現道教文獻資料的擴充與數位化、人機交互與多語言翻譯、協同管理與編輯共享。此一批評準確地揭示了當前道教數位典藏的核心局限:從「數位化」(digitization)到「數位化轉型」(digital transformation)之間,尚隔著一道「結構化語義標記」的技術門檻。
道教文獻的特殊性更加深了這一門檻的高度。與佛典以經、律、論為主體的相對清晰文類結構不同,道教經典常為複合型文本:同一部文獻可能同時包含經文本文(敘述教義)、科儀程序(入壇、淨壇、啓請、獻茶、召將、宣章、焚章、送神)、咒語韻文(步虛詞、讚頌)、符籙圖像(符頭、符腹、符腳)、註釋夾注(雙行小字)等多重層次。呂鵬志將中古道教儀式分為朝(禮敬)、傳(授職)、齋(潔淨)、醮(祭祀)、章(祈禱)五大類型,並指出科儀文獻具有「法」與「儀」的雙重結構(呂鵬志,《中古道教儀式研究》〔北京:中華書局,2021〕;呂鵬志,〈天師道授籙科儀——敦煌寫本 S.203 考論〉,《中央研究院歷史語言研究所集刊》第77本第1分〔2006〕,頁79-166)。謝世維以斗母法術科儀為例,進一步揭示道教科儀在歷史上透過「汲取地方法術傳統」與「鑲嵌民間神祠崇拜」兩種模式發展,法術文本如《道法會元》結合了「法」(主法、師派、符訣)與「儀」(祈禱行持)的混編結構(謝世維,〈道教法術的儀式框架:以斗母法術科儀為例〉,《清華學報》51.1〔2021〕,頁1-42)。這種「經—科—儀—咒—符」邊界模糊、多層混編的文本特質,使通用的數位典藏方案難以直接套用,必須發展專屬的標記策略與知識組織框架。
(三)本文核心問題與三位一體方法論框架
本文的核心問題可表述為:如何以結構化標記(TEI/XML)、神譜資料庫(Ontology)、儀式文本知識圖譜(RDF/OWL)三位一體的方法論框架,推動道教數位典藏從「資料保存」向「知識創造」的範式躍遷?
此一框架的內在邏輯在於:TEI/XML 解決「文本如何被結構化描述」的問題,Ontology 解決「神祇與概念如何被本體化建模」的問題,RDF/OWL 解決「知識如何被關聯化組織與推理」的問題。三者構成一個由「微觀文本結構」到「中觀知識領域」再到「宏觀語義網絡」的漸進式方法論體系。TEI/XML 作為文件中心的樹狀結構,適合精確標記經文的篇章層次、校勘異文、命名實體與圖像嵌入;Ontology 以類別(class)、屬性(property)、實例(instance)的方式定義道教神譜的階層關係與職司屬性;RDF/OWL 則將前兩者的成果轉化為圖狀結構的三元組(subject-predicate-object),使跨文本、跨資料集、跨語言的知識鏈接與自動推理成為可能。
這一框架並非憑空建構,而是基於國際宗教數位人文領域的既有實踐與理論資源。佛教數位典藏已建立成熟的 TEI/XML 標記標準、多語言對照機制與開放資料生態(CBETA、BuddhaNexus、TACL)。聖經數位化則在校勘學方法論與量化文本分析方面最為成熟,其 apparatus 編碼與譜系分析工具可為道教文本版本學提供參照。歐洲數位圖書館(Europeana)的 Europeana Data Model(EDM)基於 RDF 語義網架構,支援 IIIF、SPARQL 與 OAI-PMH,展示了跨國文化遺產聚合平台的技術可能性。道教數位典藏若要在國際數位人文版圖中占有一席之地,必須主動對接這些標準與方法論,同時發展符合道教文獻特質的在地化擴展。
值得強調的是,三位一體框架的各層次之間並非孤立運作,而是形成相互支撐、逐層深化的知識生產鏈。TEI/XML 標記所產生的結構化文本,為命名實體識別與知識提取提供了機器可讀的語料基礎;神譜資料庫的本體論設計,為 TEI 標記中的神名、職司、階層關係提供了規範化的語義參照;儀式知識圖譜則將前兩者的成果整合為可推理、可鏈接、可視化的網絡結構。在此框架下,一位研究者閱讀《道法會元》中的斗母法術科儀時,不僅可以看到經文的 TEI 標記結構,還可以透過神譜資料庫查詢斗母摩利支天的神格譜系,更可以透過儀式知識圖譜比較清微派、神霄派、靈寶派在同類「告斗」儀式上的文本異同與結構變化。這種多維度、跨文本、跨派別的知識呈現方式,正是數位人文相較於傳統文獻學的核心優勢所在。
(四)研究範圍與方法說明
本文的研究範圍聚焦於道教數位典藏的「方法論層面」,而非具體的技術開發或平台建置。具體而言,本文探討:(1)道教經典文本的結構特徵與 TEI/XML 標記策略;(2)道教神譜的本體論設計與資料庫建模方法;(3)儀式文本的知識圖譜建構路徑;(4)上述方法對 lius.cc 等既有道教知識平台的發展啟示。
在研究方法上,本文採取文獻分析法、比較研究法與技術規格設計法。文獻分析方面,系統梳理國際數位人文、宗教文本數位化、道教文獻學等領域的學術成果,重點參考林富士主編《「數位人文學」白皮書》(臺北:中央研究院數位文化中心,2017)、林富士總策畫《遠見與承擔:中央研究院數位人文發展史(1984-2015)》(2017)、項潔主編《從保存到創造:開啟數位人文研究》(臺北:國立臺灣大學出版中心,2011)等臺灣數位人文基礎文獻,以及 Morris & Baker 編輯之 Digital Humanities and Religions in Asia(The Digital Orientalist, 2023)等國際論著。比較研究方面,對佛教(CBETA)、道教(中研院道教經典庫、愛如生道教經典庫)、聖經三大宗教傳統的數位化方法論進行系統比較,辨識道教數位典藏的相對優勢與方法論缺口。技術規格設計方面,以 TEI P5 標準為基礎,結合道教文獻的結構特徵,提出可操作的標記範例與 TEI-to-RDF 轉換路徑。
在實證素材方面,本文參照 lius.cc 資料庫的既有節點結構進行分析。該資料庫現有節點總數達十萬五千餘筆,其中經典(scripture)類型二萬四千餘筆、神祇(deity)類型一萬三千餘筆、儀式(ritual)類型一萬一千餘筆,顯示其在道教文獻收錄上已具備相當規模。然而,「經文標記」與「知識圖譜」在現有資料庫中仍屬空白領域,節點之間的結構化關聯尚待強化。本文以此為參照點,探討既有平台如何透過方法論升級,從「百科條目式」知識庫邁向「結構化數位典藏」的新階段。
二、道教數位典藏的國際發展趨勢與方法論框架
(一)從「數位典藏」到「數位人文」的典範轉移
國際數位人文領域自 2000 年代以來經歷了從「資料保存」(preservation)到「知識創造」(knowledge creation)的深刻轉向。Morris & Baker 於 2023 年編輯的 Digital Humanities and Religions in Asia 一書中指出,亞洲宗教的數位研究已從早期以文本資料庫為核心,擴展至寺廟建築、儀式實踐、社會媒體與數位宗教行為等多元面向。該書強調 best practices for digitization, database creation, text encoding, GIS computation, network analysis, corpus analysis 等技術在宗教研究中的整合應用,並提出一個從「最物質性」到「最數位性」的研究光譜:寺廟與雕像 → 手稿與檔案 → 資料庫與文本版本 → 原生數位材料(如社交媒體互動)(Morris & Baker, Digital Humanities and Religions in Asia: An Introduction, The Digital Orientalist, 2023)。
這一典範轉移在方法論上的核心特徵,是「遠讀」(distant reading)與「近讀」(close reading)的辯證統一。林敬智(2020)在處理臺南府城延陵道壇近一千三百篇開光疏文時,示範了如何以 Python 進行文本探勘(text mining)與正規表示式擷取儀式文書中的結構化資訊(地址、神明、祖廟、日期),再結合 GIS 空間分析與社會網絡分析(Palladio 平台),提出「數位人文的鳥瞰視野(distant reading)應與傳統文獻近讀(close reading)及田野調查相輔相成」的方法論主張(林敬智,〈道教開光儀式疏文之文本探勘與數位人文探索:以府城延陵道壇為例〉,《圖資與檔案學刊》12:2〔2020〕,頁44-75)。林富士(2017)在《數位人文學白皮書》中亦強調:「在數位分析結果的基礎上,進一步進行的人文研究……數位的分析和人文學的探問,常常要來回往覆,不止一次」(林富士主編,《「數位人文學」白皮書》〔臺北:中央研究院數位文化中心,2017〕,頁1-36)。
Michael Stanley-Baker 的 "Drugs Across Asia" 專案進一步展示了數位方法在道教與佛教典藏中的跨領域應用。該專案開發了 DOCUSKY(文本語料庫托管與分析)、MARKUS(文本標記平台)、PALLADIO(網絡視覺化)等工具鏈,並提出「批判性數位文獻學」(critical digital philology)的方法論核心,以模型化早期文本中的知識分布(Stanley-Baker, "Materia Medica in Chinese Religious Sources: Towards A Critical Digital Philology for Modelling Knowledge Distribution in Early Chinese Texts," 2019 Pacific Neighborhood Consortium Annual Conference)。這些工具與理念同樣適用於中國宗教研究,為道教數位典藏的技術選型提供了重要參照。
對於道教數位典藏而言,這一典範轉移意味著:數位化工作不能僅止於將紙本掃描為影像、將錄文建入檢索系統,而必須進一步追問「這些文本中的知識如何被組織、如何被關聯、如何被推理」。道教文獻的複合型特質——同一文本中經文、科儀、咒語、符籙、圖像多層混編——使其尤其適合以結構化標記與知識圖譜技術進行深度組織。例如,一部科儀文獻中的「法」結構(師派、符訣、咒語)與「儀」結構(入壇、淨壇、召將、送神)若僅以全文檢索呈現,研究者難以快速辨識其儀式邏輯;但透過 TEI/XML 的結構化標記與 RDF 知識圖譜的關係建模,儀式的層次、步驟與對應神祇便可被機器自動提取與視覺化呈現。從「數位典藏」到「數位人文」的躍遷,本質上是從「資訊管理」到「知識生產」的躍遷,而這一躍遷的技術基石,正是結構化標記標準、後設資料框架與語義網技術的系統性應用。
(二)TEI/XML 標準在宗教文本數位化中的應用:以 CBETA 佛典數位化為參照
Text Encoding Initiative(TEI)自 1987 年由美國人文計算學會(ACH)、美國計算語言學學會(ACL)與英國文學與語言計算學會(ALLC)三學會發起,2000 年後由 TEI Consortium 維護,已成為人文學領域文本數位化的「事實標準」(de facto standard)。TEI P5(2006年釋出)全面採用 XML 編碼,提供約四百五十個元素,涵蓋文本結構、校勘、語言分析、命名實體等標記需求(TEI Consortium, TEI P5: Guidelines for Electronic Text Encoding and Interchange, https://tei-c.org/)。
TEI 的核心設計原則包括開放性、可擴展性與互用性(interoperability)。作為一開放、集體發展的標記標準,TEI 適用於所有時期、任何語言的文本,透過 XML 允許使用者自訂標記,對於交換資料標準的設計具有互用性。其文件分為兩大核心區塊:<teiHeader> 記載後設資料(文本來源、作者、出版資訊、標記者、編碼方法等),<text> 包含實際文本內容,可細分為 <front>(前置 matter)、<body>(正文)、<back>(後置 matter)。TEI 的模組化設計允許依文本類型選用不同標籤集合(modules),如詩歌(verse)、戲劇(drama)、語料(corpus)、圖表(figures)、缺字(gaiji)等,並可透過 Roma 線上系統自訂符合專案需求的 TEI Schema。
在漢籍與宗教文本的應用上,TEI 面臨前現代漢語的歧義性(無標點)、異文與校勘、專名與歷史實體的標準化等特殊挑戰,均需借助 milestone、segmentation、apparatus criticus、named entity 等機制處理。中華電子佛典協會(CBETA)自 1998 年起採用 TEI/XML(原 SGML)作為標記語言,為全球宗教文本數位化樹立了標竿,其方法論對道教數位化具有直接參考價值。
CBETA 的方法論要點可歸納為三個層次。第一,分層作業流程:校對組先進行基礎標記(經號、卷名、作者行、段落),研發組再轉為正式 XML/TEI。這種「簡單標記 → TEI 標記」的雙層流程,有效平衡了標記效率與標記品質。第二,在地化擴展:TEI 原非針對中文文獻設計,CBETA 在實作中發現漢籍特有的「經」「卷」「品」「會」等結構需自訂新標記,並回饋 TEI 協會參照修訂。這種「標準—實踐—反饋」的循環,正是宗教文本數位化得以持續優化的關鍵機制。第三,Dublin Core 後設資料的整合:在 TEI Header 中嵌入書目資訊、版本說明、出版資訊、來源描述等,確保數位文本的長期保存與國際分享(釋惠敏等,〈簡介 Metadata 於佛教電子文獻的應用〉,《中華電子佛典協會新聞電子報》第6期〔1999-10-25〕;Huimin Bhikkhu et al., "Techniques for Collating Multiple Text Versions in the Digitization of Classical Texts," Chung-Hwa Buddhist Journal 18〔2005〕: 299-325)。
道教文本若欲採用 TEI 標準,必須面對比佛典更為複雜的文本結構挑戰。佛典雖卷帙浩繁,但其文類結構相對清晰(經、律、論、注疏),且經名、卷次、品目的標記規則較為統一。道教經典則常為「經—科—儀—咒—符」混編的複合型文本,如《道法會元》卷八十三至八十七同時包含主法與師派(法)、祈禱行持(儀)、咒法集結(咒)等異質內容。此外,道教經典中的符籙圖像、壇場配置圖、法印篆刻等圖文混排現象,以及異體字、壇字、符咒專用字等文字處理難題,均要求 TEI 標記策略進行專門化的在地化擴展。
(三)都柏林核心集與後設資料標準
Dublin Core Metadata Element Set(DCMES)是國際上最廣泛使用的資源描述標準之一,最初由十五個核心元素(title, creator, subject, description, publisher, contributor, date, type, format, identifier, source, language, relation, coverage, rights)構成,後擴展為五十五項 DCMI Metadata Terms(Dublin Core Metadata Initiative, DCMI Metadata Terms, https://dublincore.org/documents/dces/)。在宗教數位典藏中,Dublin Core 的應用重點包括生命週期管理(揭示資訊資源從構思、草案、修訂、出版到數位化移轉的發展與使用事件)、跨領域可見度(由於使用成本低廉、語意簡明,DC 可提升資源在跨領域、跨主題的發現率),以及與 TEI 的協作(TEI Header 中的 fileDesc、sourceDesc 可與 Dublin Core 欄位映射,達成書目資訊的互通)。
教育部於 2000 年發布《詮釋資料格式(Metadata)規範》,為臺灣的數位典藏後設資料標準化奠定了政策基礎(教育部,《詮釋資料格式(Metadata)規範》〔2000-07-11〕,https://edu.law.moe.gov.tw/LawContent.aspx?id=GL000029)。EUDAT 的《資料基礎設施要義:後設資料、語義與本體論》(Fundamentals of Data Infrastructures: Metadata, Semantics, Ontologies)進一步闡明了後設資料在科學資料基礎設施中的核心地位。對於道教數位典藏而言,Dublin Core 的價值不僅在於描述單一數位資源,更在於建立跨平台、跨機構的資源發現機制。當道教經典的數位版本分散於中研院道教經典庫、愛如生道教經典庫、香港中文大學道教數位博物館、CTEXT、Kanripo 等不同平台時,統一的後設資料標準是實現跨庫檢索與資源整合的前提條件。
值得強調的是,後設資料標準與文本標記標準並非互斥,而是互補。TEI Header 可嵌入 Dublin Core 元素,實現「文本內部結構描述」與「文本外部書目描述」的統一。例如,一部道教科儀文獻的 TEI Header 可同時包含:fileDesc(文件描述,對應 DC 的 title、creator、publisher)、sourceDesc(來源描述,對應 DC 的 source、identifier)、encodingDesc(編碼描述,記錄標記規則與版本),以及 profileDesc(文本特徵描述,記錄語言、文本類別等)。這種多層次的描述架構,使單一數位文本同時具備「機器可讀的結構資訊」與「人類可理解的書目脈絡」,是數位典藏品質保證的關鍵。
(四)宗教文本數位化的方法論比較:佛典、道藏、聖經
從比較視角審視佛教大藏經、道教《道藏》與西方聖經的數位化方法論,可辨識出各傳統的相對優勢與道教數位典藏的發展空間。
佛教大藏經的數位化發展最早且規模最大。CBETA 完成《大正新脩大藏經》全文數位化,並持續擴展至其他藏經版本。日本東京大學 SAT 大藏經數據庫、韓國高麗大藏經數位化、法鼓文理學院的 TACL(Textual Alignments for Classical Tibetan and Chinese)與 BuddhaNexus 等專案,形成了「版本比對—文本重合度分析—多語言對照」的方法論鏈條(Bingenheimer, "Digitization of Buddhism," Oxford Bibliographies〔2020〕)。其方法論特色在於強調多語言(梵、漢、藏、英)版本對照、異譯本比對、註釋文獻隨原文連結。2025 年博鰲亞洲論壇宗教分論壇更提出「全球佛典數位化工程」的跨國合作願景,顯示佛教數位典藏已進入國際協作的新階段。
道教《道藏》的數位化起步較晚,但近年有顯著進展。施舟人領導的「道藏工程」耗時二十五年,最終成果為 2005 年出版的《道藏通考》,主編為施舟人與傅飛嵐(Franciscus Verellen)。此計畫不僅提供一千五百餘部道經的學術導讀,也為後續數位化奠定文本學基礎(Schipper & Verellen, The Taoist Canon: A Historical Companion to the Daozang〔Chicago: University of Chicago Press, 2005〕)。目前主要的道藏數位資源包括中研院道教經典庫初集(收錄正統道藏、萬曆續道藏共 1,486 種典籍,2026 年試用版)、北京愛如生「道教經典庫」(分為道藏編與藏外道書編)、香港中文大學道教數位博物館(以道教科儀文獻、道教碑刻文獻、呂祖道書文獻為三大主軸)。道教文本數位化目前偏重「影像+錄文」的資料庫模式,結構化標記(如 TEI)的應用尚不及佛典成熟;但科儀文書的「模組化」特徵(套路化欄位)使其特別適合文本探勘與資訊擷取。
西方聖經數位化深受文本校勘學(textual criticism)與譜系學(stemmatology)影響。TEI 最早即為古典文獻與聖經研究而設計,其 apparatus criticus 機制(lem、rdg、wit 等元素)能精確記錄異文與 Witness 來源。近年更結合計量方法進行「電腦輔助譜系分析」(computer-assisted stemmatic analysis),如 Kennicott 希伯來文聖經異文資料庫的 TEI 編碼與量化研究(De Gruyter, "Using TEI for Quantitative Inquiry and Computer-Assisted Stemma Analysis in Biblical Studies," 2021)。道教文本數位化可借鏡聖經研究的嚴謹校勘標記傳統,特別是處理《道藏》中同一經典的多版本問題(如正統道藏、萬曆續道藏、藏外道書、敦煌道經等)。
從三教比較可觀察到明確的方法論梯度:佛教已建立成熟的 TEI/XML 標記標準、多語言對照機制、開放資料生態;道教擁有豐富的影像資料庫與全文檢索系統,但在語義標記、校勘編碼、知識圖譜化方面仍有很大發展空間;聖經研究在校勘學方法論與量化文本分析方面最為成熟,其 apparatus 編碼與譜系分析工具可為道教文本版本學提供參照。道教數位典藏的未來發展,應在保持自身文獻特質的前提下,積極吸收佛教與聖經數位化的成熟經驗。
(五)數位文獻學的理論框架:OAIS、DOI 與長期保存
數位文獻學(digital philology)強調:數位化不僅是「將紙本轉為電子檔」,而是「以數位形式建模類比文本的表徵」。這一理念涉及三個核心理論問題:語義編碼(semantic encoding)優於視覺呈現編碼、開放檔案資訊系統(OAIS)與數位物件識別碼(DOI)的長期保存架構,以及受信賴的數位倉儲(trusted digital repositories)的建設。
語義編碼優於視覺呈現編碼,意味著數位文本的標記應揭示文本的「意義結構」而非僅記錄其「視覺外觀」。例如,以 <p> 標記段落而非以 <br/> 模擬換行,以 <name type="deity"> 標記神名而非以 <b> 或 <font> 模擬粗體,這種「語義化」的標記策略使機器能夠「理解」文本的內容結構,從而支援更精確的檢索、分析與轉換。對於道教經典而言,語義編碼的挑戰尤為艱鉅:如何標記一個既是「文字」又是「圖像」的符籙?如何區分「經文本文」與「科儀程序」的文本層次?如何標記壇場配置圖中的空間關係?這些問題要求標記者同時具備文獻學知識、宗教學素養與技術規格設計能力。
在長期保存架構方面,OAIS(Open Archival Information System)參考模型為數位典藏系統的設計提供了功能框架,包括攝取(ingest)、存檔存儲(archival storage)、資料管理(data management)、管理(administration)、保存規劃(preservation planning)與取用(access)六大功能實體。DOI(Digital Object Identifier)則為數位資源提供持久性的唯一識別碼,確保引用與鏈接的長期穩定。佛教數位文本雖已普遍開放,但仍存在「難以評估與引用」的問題——即便最先進的數位版本(如 CBETA),學界通常仍引用其紙本原始出處。如何建立「被認可為獨立批判性版本」的數位版本,是宗教文本數位化的核心理論挑戰(Bingenheimer, "Digitization of Buddhism," Oxford Bibliographies〔2020〕)。道教數位典藏若要在學術體系中獲得正當性,必須從建置之初便納入 OAIS 框架與 DOI 識別機制,確保數位文本的學術可信度與長期可及性。
此外,受信賴的數位倉儲(trusted digital repositories)如 Zenodo、Dryad 等,為學術數位資源的長期保存提供了機構性保障。這些倉儲不僅提供穩定的存儲空間,更透過標準化的後設資料、版本控制與授權機制,確保數位資源的可發現性、可取得性、可互用性與可重用性(FAIR 原則)。道教數位典藏專案若能將 TEI/XML 標記成果、神譜本體檔案與儀式知識圖譜定期封存於此類受信賴倉儲,將可有效避免因平台關閉或技術過時而導致的數位資產損失。歐洲數位圖書館 Europeana 的經驗表明,跨國文化遺產聚合平台的成功,不僅依賴於個別機構的數位化成果,更依賴於統一的資料模型(EDM)與開放的 API 介面。道教數位典藏的未來發展,亦應朝著「標準化標記+開放資料釋出+語義網鏈接」的方向邁進。
知識圖譜與本體論的興起,為宗教文本的語義組織開闢了新方向。國際上已有若干重要嘗試:KG-Buddhism(2017)運用語義技術整合佛教概念、人物、經典關係;SemanticTafsir 基於古蘭經注釋建構文化遺產本體與知識圖譜;SemanticHadith(2023)建立聖訓語料庫的本體驅動知識圖譜;Greek Mythology as a Knowledge Graph 將希臘神話系統化為知識圖譜,展示從 Chaos 到 Zeus 的神譜關係(Wu et al., "KG-Buddhism," JIST 2017 Proceedings〔Springer, 2017〕, pp. 259-267; Pastor-Sanchez et al., "Greek mythology as a knowledge graph," Semantic Web Journal〔2021〕; Kannran et al., "SemanticHadith," Journal of Web Semantics 78〔2023〕: 100797)。這些專案顯示:宗教文本的知識組織不能僅止於「文件級」後設資料,而需深入「概念級」與「關係級」的語義建模,包括神明譜系、儀式結構、經典引用關係、地理空間分布等面向。
三、道教經典標記技術:TEI/XML 與文本結構化
(一)道藏經文的結構特徵:三洞四輔十二類與複合文本層次
道教經典的數位標記必須首先正視其獨特的結構特徵。明代《正統道藏》與《萬曆續道藏》採用道教傳統的分類法:三洞(洞真/上清經、洞玄/靈寶經、洞神/三皇經)、四輔(太玄、太平、太清、正一,輔佐三洞)與十二類(本文、神符、玉訣、靈圖、譜錄、戒律、威儀、方法、眾術、記傳、讚頌、奏表)。此分類法雖具宗教內部邏輯,但現代學科分類與之不完全對應。數位資料庫需建立「多維分類」或「主題標籤(Tagging)」系統,以支援跨類型檢索。例如,《度人經》在道藏中歸入洞真部本文類,但其內容涉及宇宙論、儀式、咒語、神譜等多個現代學科主題,單一的分類架構難以完整呈現其知識內涵。
更為根本的挑戰在於,道教文獻並非單一文類,而是混合多種文體的複合型文本。呂鵬志將中古道教儀式分為五大類型——朝(禮敬)、傳(授職)、齋(潔淨)、醮(祭祀)、章(祈禱)——並指出科儀文獻具有「法」與「儀」的雙重結構:「法」包含師派、符訣、咒語、內煉;「儀」則是儀式程序(如入壇、淨壇、召將、宣章、焚符、送神)(呂鵬志,《中古道教儀式研究》〔北京:中華書局,2021〕;呂鵬志,〈天師道授籙科儀——敦煌寫本 S.203 考論〉,《中央研究院歷史語言研究所集刊》第77本第1分〔2006〕,頁79-166)。謝世維以斗母法術科儀為例,進一步揭示《道法會元》卷八十三至八十七結合了「法」(卷八十三:主法、師派、符訣)與「儀」(卷八十六:祈禱行持),卷八十七則為咒法集結,此種混編結構對標記的「模組化」設計提出挑戰(謝世維,〈道教法術的儀式框架:以斗母法術科儀為例〉,《清華學報》51.1〔2021〕,頁1-42)。張超然研究靈寶經派度亡經典,指出從《元始五老赤書玉篇真文天書經》到《洞玄無量度人上品妙經》的文本演化,涉及經文結構的重組與儀式功能的轉化(張超然,〈道教靈寶經派度亡經典的形成〉,《輔仁宗教研究》22〔2011〕,頁29-)。
具體而言,道教文獻的數位標記需處理以下層次:經文本文(Scripture),如《度人經》《清靜經》的本文,屬敘事或論理散文,需標記經名、品名、說法場景、問答結構;科儀程序(Rubric),如「入壇—淨壇—啓請—獻茶—召將—宣章—焚章—送神」等儀節,需以結構化標記呈現順序與層級;咒語(Incantation),如〈都天雷公咒〉〈步罡變神咒〉,多為韻文,需標記語言、節奏、反覆結構;符籙(Talisman),文字與圖像混排,符頭、符腹、符腳具不同語義功能,需以 <figure> + <figDesc> 或自訂標籤處理;圖像(Iconography),靈圖、真形圖、星圖、壇場配置圖,需標記圖版位置、尺寸、對應文字段落;註釋與夾注(Annotation),道藏中常見雙行夾注小字、校勘記,需以 <note> 或 <app>(校勘記)標記。
這種多層混編的文本特質,使道教經典的數位標記無法簡單套用任何單一文類的 TEI 模組,而必須綜合運用 core、textstructure、figures、gaiji、verse、msdescription 等多個模組,並發展專屬的自訂標籤集。以下逐一分析各模組在道教經典中的適用性與擴展策略。
(二)TEI P5 在道教經典中的適用模組與標記策略
TEI P5 的模組化設計為道教經典標記提供了靈活的基礎架構。針對道教文獻的複合型特徵,以下模組具有直接適用性或需要在地化擴展:
core 模組提供基本元素,包括段落 <p>、詩行 <l>、名稱 <name>、日期 <date> 等。在道教經典中,<name> 元素可擴展為區分神名(<name type="deity">)、地名(<name type="place">)、經名(<name type="scripture">)、儀節名(<name type="ritual">)等多種命名實體類型。這種類型化標記是後續知識圖譜自動提取的基礎。
header 模組負責經典書目資訊的標記,包括道藏編號、版本、收藏處、數位化日期等。道教經典的書目資訊較一般文獻更為複雜:同一部經典可能同時具有道藏編號(DZ number,由施舟人建立)、CRTA 規範 URI、中研院漢籍資料庫編號、愛如生資料庫編號等多重識別碼。TEI Header 的 <idno> 元素可透過 type 屬性區分這些不同來源的識別碼,並以 <altIdentifier> 建立它們之間的對應關係。
textstructure 模組是道教經典標記的核心,負責經文層級結構(經、科、儀、咒、符等分部)的標記。此模組提供的 <div> 元素可透過 type 與 n 屬性進行精細的層級劃分。例如,一部科儀文獻可標記為:
<div type="ritual" n="1">
<head>清微玄樞奏告儀</head>
<div type="dharma" n="1.1">
<head>主法</head>
<p>以<name type="deity" ref="crta:DouMu">斗母摩利支天</name>為主神。</p>
</div>
<div type="procedure" n="1.2">
<head>祈禱行持</head>
<stage type="action">入壇</stage>
<stage type="action">淨壇</stage>
<sp>
<speaker>高功</speaker>
<p>焚香啓請<name type="deity">三清大帝</name>。</p>
</sp>
</div>
</div>
此處 <div type="dharma"> 對應呂鵬志所論的「法」結構,<div type="procedure"> 對應「儀」結構,<stage> 標記儀式動作,<sp>(speech)標記誦讀內容,使科儀文獻的雙重結構在數位層面得以清晰呈現。
figures 模組處理符籙圖像、壇場圖、北斗星圖、印章圖版的嵌入與描述。道教文獻中的圖像並非單純的「插圖」,而是具有宗教功能的儀式物件。以符籙為例,其由符頭(召神之標誌)、符腹(核心咒語或神名)、符腳(「急急如律令」等結尾)組成,不同部位具有不同語義功能。figures 模組的 <figure>、<graphic>、<figDesc> 元素可嵌入圖像並進行結構化描述:
<figure>
<graphic target="/images/fu_001.png"/>
<figDesc>北帝酆都召鬼神印,微型籙結構,多層線條,含「酆都」符號</figDesc>
<head>圖一:北帝酆都印</head>
</figure>
然而,對於符籙這種兼具「文字」與「圖像」雙重性質的物件,單純的圖像嵌入尚不足夠,尚需結合 IIIF(International Image Interoperability Framework)的區域標記(zone annotation)或 stand-off markup,在圖像上標記區域並連結至對應咒語、訣要或儀節。
gaiji 模組是處理道教經典異體字、缺字問題的關鍵工具。道教經典含有大量異體字、俗字、壇字、符咒專用字,遠超一般漢字編碼範圍。TEI P5 的 <g>(gaiji)元素與 <char> 描述機制,允許以 Unicode 標準化、組字式(descriptive composition)、缺字圖檔等多種策略處理這些特殊字符。CBETA 發展出的組字式規則(以 * 表橫向連接、/ 表縱向連接、@ 表包含等)可直接移用於道教經典(莊德明,〈漢字缺字處理與梵巴藏字母的輸入〉,《佛教圖書館館訊》14〔1998.06〕,頁6-13)。
verse 模組適用於咒語、讚頌、步虛詞等韻文段落。道教咒語多具有反覆結構與特定的語言特徵(如梵漢混合),verse 模組的 <lg>(line group)與 <l>(line)元素可標記其韻律結構,並透過 @met 或 @rhyme 屬性記錄格律資訊。
msdescription 模組用於描述敦煌寫本、明代道藏雕版等手稿與古籍的物理特徵。對於道教數位典藏而言,此模組的價值在於記錄文獻的物質性資訊——紙張材質、書法風格、版式特徵、藏書印記——這些資訊對於版本鑑定與文本傳播史研究具有重要意義。
(三)層級標記與內容標記的分工
道教經典的數位標記工作量大、專業性強,必須建立合理的工作流程以確保效率與品質。參照 CBETA 的分層作業經驗,道教經典標記可採取「層級標記」與「內容標記」兩階段分工模式。
層級標記(Structural Markup) 由一般輸入人員或初級標記員處理,標記篇章、段落、行句、頁碼等制式結構。此階段的工作相對機械化,標記規則明確,可透過培訓快速上手。具體任務包括:標記經名、卷名、品名;標記段落邊界(<p>);標記頁碼與行號(<pb>、<lb>);標記基本的文本分區(<div>)。層級標記的目標是建立文本的「骨架」,使後續的內容標記有清晰的結構依附。
內容標記(Content Markup) 則需由專業學者或經過專門訓練的高級標記員判讀,標記缺字、異體字、訛字、特殊註釋、神名、地名、儀節名稱等語義內容。此階段的工作需要深厚的文獻學與宗教學素養,因為標記者必須判斷一個名稱是神名還是人名、一個術語是儀節名還是法器名、一個字是異體字還是訛字。例如:
<name type="deity">元始天尊</name>
<stage type="ritual">高功登壇,手持五雷符令</stage>
<app>
<lem>太上</lem>
<rdg wit="#DZ">太尚</rdg>
<note>形近而訛</note>
</app>
這種兩階段分工模式的優勢在於:層級標記可快速推進,建立大規模文本庫的基礎結構;內容標記則在層級標記的基礎上進行精細化語義標註,兩者互不干擾卻又相互支撐。CBETA 的經驗表明,這種分層流程不僅提升了標記效率,更保證了標記品質的可控性(Huimin Bhikkhu et al., "Techniques for Collating Multiple Text Versions," Chung-Hwa Buddhist Journal 18〔2005〕: 299-325)。
對於道教經典而言,內容標記還需特別注意「命名實體」的規範化問題。道教神名系統極為複雜:同一神祇可能有尊號、諱名、簡稱、梵名等多種稱謂(如「摩利支天」又稱「斗母」「紫光金尊」),不同道派對同一神祇的階層定位也可能不同。內容標記應透過 @ref 屬性建立神名與規範權威檔(如 CRTA)的鏈接,而非僅記錄其表面文字。這種規範化標記是後續知識圖譜自動生成的前提。
(四)標記挑戰:異體字/缺字、版本差異、圖文混排
道教經典的數位標記面臨三項突出的技術挑戰:異體字與缺字處理、多版本校勘、以及圖文混排問題。
異體字與缺字處理 是漢籍數位化的共通難題,在道教文獻中尤為嚴重。道教經典不僅包含大量古籍通用的異體字、俗字,更有專屬的壇字、符咒專用字,乃至於超越傳統漢字構形規則的「複文」(多字疊合)、天書式文字、鳥蟲篆式線條。目前國際上與臺灣的主要處理策略包括:第一,Unicode 標準化,優先查詢 Unicode/Unihan 資料庫,確認缺字是否已編碼,近年 Unicode CJK 擴展區(Ext-B 至 Ext-H)已收錄大量古籍用字。第二,組字式(Descriptive Composition),以部件組合描述缺字字形,無需造字檔即可顯示;CBETA 發展出的成熟規則(* 表橫向連接、/ 表縱向連接、@ 表包含、- 表去掉某部分、+ 表替換)已在佛教文獻中得到充分驗證,可直接移用於道教經典。第三,缺字圖檔,對於 Unicode 與《異體字字典》皆未收之字,截取原卷字圖,以 <graphic> 嵌入或製成透明背景 PNG 插入。第四,異體字資料庫,如法鼓山「敦煌寫本異體字資料庫」,以《異體字字典》正字為字頭,建立「數位文字摹本」與「標準字體化版」雙版本對照,並標記來源位置(莊德明,〈漢字缺字處理與梵巴藏字母的輸入〉,《佛教圖書館館訊》14〔1998.06〕,頁6-13)。
道教文獻的特殊性在於,符籙中的「複文」與天書式文字已超出傳統漢字構形規則,可能需以向量圖(SVG)或區域標記(Zone-based annotation)處理,而非單純字符編碼。這要求標記策略從「字符中心」轉向「圖像中心」,發展混合式的標記標準。
版本差異與校勘 是道教文獻數位化的另一核心挑戰。道藏經典存在明《正統道藏》、清《道藏輯要》、民國《道藏精華》、現代《中華道藏》及敦煌寫本等多種版本,同一經典在不同版本中可能存在文字異同、篇章增刪、乃至結構重組。TEI 的 <app>(apparatus)與 <rdg>(reading)元素為標記異文提供了精密工具:
<app n="1">
<lem wit="#DZ">太上</lem>
<rdg wit="#P">太尚</rdg>
<note>形近而訛</note>
</app>
此處 <lem> 標記底本讀法,<rdg> 標記異文讀法,wit 屬性引用版本識別碼,<note> 記錄校勘說明。CBETA 在比對不同版本時,若發現底本錯誤,以紅色顯示經文,並結合電子辭典輔助閱讀的模式,可移用於道藏版本比對(Huimin Bhikkhu et al., "Techniques for Collating Multiple Text Versions," Chung-Hwa Buddhist Journal 18〔2005〕: 299-325)。
對於道教經典而言,版本校勘還需特別注意「儀式功能變異」的問題。張超然的研究顯示,從《元始五老赤書玉篇真文天書經》到《洞玄無量度人上品妙經》的文本演化,不僅涉及文字層面的異同,更涉及儀式功能的轉化(張超然,〈道教靈寶經派度亡經典的形成〉,《輔仁宗教研究》22〔2011〕,頁29-)。這種「功能性異文」無法單純以傳統校勘學的「形近而訛」「音近而訛」解釋,而需在數位標記中增加「功能描述」維度,記錄同一文本在不同版本中儀式用途的變遷。
圖文混排與符籙圖像 是道教文獻最為獨特的標記挑戰。道教文獻中,文字與圖像界線模糊:符籙由符頭、符腹、符腳組成,兼具「文字」與「圖像」雙重性質;壇場圖與星圖(如《道法會元》中的「星壇」「燈壇」排列圖)需標記空間位置與象徵意義;法印分為篆書印、天書印、符籙印、圖案印,文字與圖像混排。數位標記可採取兩種策略:整體圖像標記,以 <figure><graphic/></figure> 嵌入全符掃描圖,並以 <figDesc> 描述結構與功能;區域標記(Zone Annotation),運用 IIIF 或 stand-off markup,在圖像上標記區域(zone),連結至對應咒語、訣要或儀節。
壇場圖的空間標記尤具挑戰性。以北斗七星燈儀為例,其壇場配置涉及九皇燈座對應北斗九星的空間關係、燈位與神位的對應、以及儀式進行中燈火的點燃順序。這種三維空間與時間序列交織的儀式結構,遠超傳統文本標記的二維線性模型,可能需要結合 SVG 向量圖、動態時間軸標記、甚至三維場景建模等多元技術手段。
(五)語義網橋接:TEI-to-RDF 轉換路徑
TEI-XML 是「文件中心」(document-centric)的樹狀結構,而語義網是「資料中心」(data-centric)的圖狀結構。將 TEI 標記轉換為 RDF(Resource Description Framework)三元組(subject-predicate-object),可實現跨資料集的鏈接與推理,這是道教數位典藏從「文件庫」邁向「知識庫」的關鍵技術橋樑。
TEI-to-RDF 轉換的技術路徑可分為三個步驟。第一步,實體識別(Named Entity Recognition):從經文中提取神祇、地名、儀式、經典名稱,賦予唯一 URI。CRTA(Chinese Religious Text Authority)已為道教經典、神祇、儀式建立規範 URI,可直接作為知識圖譜的節點基礎設施(https://crta.info)。第二步,本體論建構(Ontology Design):參照現有本體(CIDOC CRM、FRBRoo、PROV-O、Schema.org)定義道教領域類別與屬性。第三步,TEI-to-RDF 轉換:運用 XPath 提取 TEI 元素,透過 Python 腳本轉為 RDF。例如:
<name type="deity" ref="crta:yuanshi">元始天尊</name>
轉換為:
# RDF
<http://example.org/text/001> schema:mentions <http://crta.info/deity/yuanshi> .
<http://crta.info/deity/yuanshi> rdf:type :Deity ;
rdfs:label "元始天尊"@zh .
國際上已有若干成功的 TEI-to-RDF 橋接案例可供參照。SemanticTafsir 將 TEI 格式的經注手稿自動轉為 RDF 知識圖譜,支援 SPARQL 查詢,銜接 Quranic 本體。Syriaca.org 以 TEI XML 原生儲存權威檔(人、地、作品),透過 Srophé App 提供 API,可序列化為 RDF。Paolo Bufalini's Notebook 專案將 TEI 與語義表示共存,轉換為八千餘個 triples 的主知識圖譜,採用 Open Annotation、FaBiO、CiTO 本體。LIFT(A Teaching Tool for TEI to Linked Data Transformation)專為 TEI-to-LOD 轉換設計教學框架,強調從樹狀結構到圖狀結構的方法論反思(Digital Humanities Quarterly 16.2〔2022〕)。Networking Editions(TEI2023)則進一步探討 TEI-as-RDF 與 TAG(Text-as-Graph)的可能性,主張 TEI 可獨立於 XML 作為形式本體(Kuczera, "TEI Beyond XML - Digital Scholarly Editions as Provenance Knowledge Graphs," Proceedings of the TEI Conference〔2020〕)。
對於道教數位典藏而言,TEI-to-RDF 轉換的價值在於實現三種知識組織目標。其一,神譜資料庫(Pantheon Database):道教神譜層級繁複,適合以 RDF 表達階層與從屬關係(skos:broader、schema:parentOrganization)。其二,儀式知識圖譜(Ritual Knowledge Graph):節點包括儀式類型(告斗、傳度、齋醮)、儀節(淨壇、召將、宣章)、法器(劍、印、令)、空間(壇場、星壇);關係包括 hasRitualStep(有儀式步驟)、usesTalisman(使用符籙)、invokesDeity(召請神祇)、hasScripturalSource(經典來源)。其三,鏈接開放數據(Linked Open Data):將道教經典與 Wikidata、GeoNames、China Historical GIS 等外部資料集鏈接,實現跨領域查詢(如「某科儀在清代臺灣哪些廟宇舉行過」)。
以實際應用為例,當研究者標記《北斗七星燈儀》的 TEI 文本時,其中提及的「北極紫微大帝」「北斗七元君」「南斗六司」等神名,可透過 @ref 屬性鏈接至神譜資料庫中的規範 URI。這些神祇節點在 RDF 中不僅標示其名稱與階層位置,更可標示其職司屬性(如「掌錄人生命籍」「延壽增算」)、對應星宿(如北斗七星對應天樞、天璇、天璣、天權、玉衡、開陽、搖光),以及相關經典來源。進一步地,儀式知識圖譜可記錄「北斗七星燈儀」這一儀式類型包含「設壇」「淨壇」「燃燈」「禮斗」「誦經」「送神」等儀節步驟,使用「九皇燈座」「斗幡」等法器,在「斗壇」空間中進行,並引用《北斗經》《度人經》等經典為其文本來源。當這些知識被表達為 RDF 三元組後,機器便可自動回答諸如「哪些科儀同時召請了北斗七元君與北極紫微大帝」「哪些法器同時出現在告斗儀式與傳度儀式中」「某一經典被哪些不同道派的科儀所引用」等複雜查詢,這是傳統文本檢索系統難以實現的知識發現能力。
以 lius.cc 資料庫為例,其現有二萬四千餘筆經典節點、一萬三千餘筆神祇節點、一萬一千餘筆儀式節點,已具備建構知識圖譜的素材基礎。若能將現有節點的結構從「百科條目式」擴展為「RDF 三元組式」,建立「經典—神祇—科儀」的三元關聯,並透過 CRTA 規範 URI 實現與國際資料集的鏈接,將可大幅提升其知識組織的深度與廣度。這種從「文件中心」到「資料中心」的轉型,不僅是技術架構的升級,更是知識生產範式的躍遷——從「人可以閱讀的文本庫」邁向「機器可以推理的知識庫」,從而為道教研究的數位人文轉型奠定堅實的方法論基礎。
四、神譜資料庫建構方法與本體論設計
道教是典型的多神教,神仙譜系紛繁複雜,既包含先天尊神之宇宙論層級,亦涵蓋後天仙真之修煉譜系,更與民間俗神、歷史人物神化交織融合。建構一套結構化、機器可讀、可擴展的神譜資料庫,是道教數位典藏從「文獻保存」邁向「知識重組」的關鍵步驟。本章從歷史基礎、欄位設計、語義網技術棧、關係建模、異名處理、文化遺產本體及國際案例七個面向,系統闡述神譜資料庫的建構方法與本體論設計。
(一)道教神仙譜系的歷史基礎
道教神譜的系統化整理,最早可追溯至南朝梁代陶弘景(456–536)所纂《洞玄靈寶真靈位業圖》。此書為中國道教史上第一部具備完整體系的神仙譜系文獻,約收錄近七百位神靈,以七個等級(神階)排列,每一等級皆有一位居中的主神,其餘分別列於左位、右位、散仙位、女仙位。前四位主神已初步具備後世道教所尊奉「三清尊神」的神格雛形,而元始天尊被正式定為道教最高神。陶弘景自述其編纂宗旨為「搜訪人綱,究朝班之品序;研綜天經,測真靈之階業」,實質是以人間朝廷之綱紀品秩為藍本,構造神仙世界之等級秩序。王家葵校理《真靈位業圖校理》(北京:中華書局,2013年)對此書進行了詳盡的文獻學整理,為今日建構數位神譜提供了權威的文本基礎。
卿希泰、詹石窗主編《中國道教通史》(五卷本,北京:人民出版社,2020年)則系統梳理了從先秦至當代的道教神系演變。該書特別指出,陶弘景的譜系建構邏輯並非憑空創造,而是對漢魏以來道教神仙觀念、方士傳統與民間信仰長期互動之總結。道教神譜在歷史進程中經歷了多次重大重組:魏晉南北朝時期上清派、靈寶派各自發展出不同的天界想像;隋唐時期三清、四御格局逐漸定型;宋元以降,雷法興盛促使神譜中新增雷部、瘟部等職能性神系;明清時期民間信仰的湧入,更使媽祖、關帝、保生大帝等俗神被編納入道教法統。呂鵬志指出,道教神譜體系在宋元時期因「新法競出」而大為周備,從土府到土部發展成部,如同星部、瘟部一樣獨立成部,反映了道教儀式實踐對神譜結構的反向塑造作用。這種歷史動態性意味著神譜資料庫必須具備「時間維度」,能夠記錄同一神祇在不同歷史時期的神格變遷與譜系位置。蕭登福在《正統道藏總目提要》與《玄天上帝信仰研究》等專著中,對道教神祇的經典來源與信仰流變進行了系統性考證,其方法論強調「經文—儀式—信仰」三者的互證,這正是數位神譜資料庫應當內建的交叉驗證邏輯。康豹在研究溫元帥、張巡等神祇如何被編納入道教法統時,亦揭示出神譜變動背後的社會動力與地方政治因素,提醒資料庫設計者必須保留「神譜爭議」與「學術異見」的註記欄位,避免將複雜的歷史過程簡化為單一確定的結構。
(二)神譜資料庫的核心欄位設計
參照現有道教數位典藏項目與數位人文領域的最佳實踐,神譜資料庫至少應包含以下結構化欄位:
神名欄位:包括正式神號、簡稱、別名、方言音譯等。例如「媽祖」又稱「天上聖母」「天妃」「天后」「湄洲娘媽」等。此欄位需支援多值與多語言標註,並為每一異名標註來源文獻與使用脈絡(官方封號/道教封號/民間俗稱/方言音譯)。
神格欄位:區分先天尊神、後天仙真、民間俗神、歷史人物神化等類型。道教傳統中「神」指先天自然化生之聖,「仙」指後天修煉得道之人,二者在譜系中的地位與功能迥異。此欄位可採用受控詞彙表(controlled vocabulary),並保留「未定/爭議」選項以容納學術分歧。
神階欄位:參照《真靈位業圖》七階與後世演變,建立三清、四御、諸星曜神、瓊台女神、忠武戰神、財富之神、醫藥之神等分類層級。此欄位應支援多層級樹狀結構,允許同一神祇在不同傳統中擁有不同神階定位。
職能欄位:記錄神祇的宗教功能,如賜福、赦罪、解厄、鎮煞、醫藥、財富、科舉、護國等。可細分為「本職」與「兼職」,以反映神祇職能在歷史傳播中的擴展現象。李豐楙在考察臺灣民間信仰時指出,許多神祇的「兼職」功能實際上比「本職」更為信眾所熟知,這種「功能漂移」現象必須在資料庫中予以保留。
廟宇分布欄位:記錄主祀廟宇、配祀廟宇與分靈系統,並結合GIS座標實現空間查詢。康豹(Paul Katz)在研究溫元帥、張巡等神祇如何被編納入道教法統時,特別強調廟宇網絡在神譜傳播中的關鍵作用。廟宇分布欄位需與外部地理資料庫(如GeoNames)連結,以標準化地名與座標。
文獻來源欄位:每一筆神譜資料需標註其文獻依據,包括道藏經典、方志、碑刻、科儀本、田野記錄等。此欄位是確保資料庫學術可信度之基石,亦為後續的版本對照與考證追蹤提供基礎。謝聰輝在《追尋道法:從臺灣到福建道壇調查與研究》(新文豐,2018年)中展現了從田野調查到文獻考證的完整方法論,其對閩臺道壇神譜的比較研究顯示,同一法派在不同地域的神譜細節可能有所差異,資料庫必須支援「同一法派/不同地域」的多版本神譜並列。
神祇關係欄位:以關係型資料庫或圖資料庫建模,記錄神祇之間的師承、父子、從屬、配祀、主從、分靈、化身、對應等關係類型。此為神譜資料庫區別於一般百科全書之核心特徵,亦是本章後文重點討論之內容。
(三)本體論(Ontology)在宗教神譜中的應用:RDF/RDFS/OWL/SPARQL 技術棧
本體論(Ontology)用以定義說明某一特定領域的知識或主題,其內容包含物件(Object)/概念(Concept)/類別(Class)、物件特徵(Property),以及物件間關係(Relation)。在神譜資料庫中,本體論可將「神祇」「廟宇」「儀式」「經典」等實體及其關係形式化,使機器能夠理解並進行推理。
語義網技術棧在神譜資料庫中的應用可分四個層級:
RDF(Resource Description Framework) 為資源描述框架,以三元組(Subject-Predicate-Object)表示知識。例如「玄天上帝—isA—道教戰神」即為一組RDF三元組。RDF提供了一種通用的圖形資料模型,使不同來源的神譜資料能夠以統一格式交換與整合。
RDFS(RDF Schema) 為模式語言,可定義類別、屬性與繼承關係。例如可定義「戰神」為「道教神祇」的子類,「主祀」為「配祀」的超類關係。RDFS的語義表達能力雖有限,但足以支撐神譜資料庫的核心分類架構。
OWL(Web Ontology Language) 為W3C推薦的本體語言家族,可表示豐富且複雜的實體、屬性與關係知識,支援邏輯推理。OWL 2為最新標準,包含OWL 2 DL(描述邏輯)與OWL 2 Full等子語言。在神譜資料庫中,OWL的以下特性尤為關鍵:
- 對稱性(owl:SymmetricProperty):如「配祀」——若A廟配祀B神,則B神被配祀於A廟。
- 傳遞性(owl:TransitiveProperty):如「從屬於」——若A神從屬於B神,B神從屬於C神,則A神從屬於C神。
- 函數性(owl:FunctionalProperty):如「主神」——一座廟宇的主神通常唯一。
- 反向關係(owl:inverseOf):如「主祀」與「被主祀於」互為反向。
- 等價映射(owl:sameAs / equivalentClass):用於處理同一神祇的不同名稱,如「媽祖」sameAs「天上聖母」。
SPARQL 為W3C標準化的RDF查詢語言,語法類似SQL但專為圖形資料設計。透過SPARQL,研究者可查詢「所有主祀關聖帝君的廟宇」「某神祇的師承鏈」「兩神祇間的最短路徑」等複雜問題。SPARQL原生支援透過URI查詢網路化資料來源,使神譜資料庫具備開放連結資料(Linked Open Data)的潛力。在實務應用上,研究者可透過Federated SPARQL查詢同時檢索本地神譜資料庫與外部開放資料源(如Wikidata、DILA、CBDB),實現跨典藏的神譜比較與補全。例如,查詢某歷史人物神化的傳記資料時,可同時調用CBDB的人物傳記資料與本地神譜資料庫的神格資訊,透過owl:sameAs或schema:sameAs進行實體對齊,從而建立「歷史人物—神化過程—道教神祇」的完整知識鏈。
(四)神祇關係建模:八種關係類型
道教神譜中的神祇關係複雜多元,遠超一般人物傳記資料庫中的親屬關係或社會關係。資料庫需至少支援以下八種關係類型:
師徒關係:記錄道法傳承譜系,如張道陵師承太上老君。此關係具有方向性與傳遞性,可用OWL的TransitiveProperty建模,以支援「查詢某神祇的道法源流」之類的推理查詢。
父子關係:記錄血緣或神話譜系,如托塔李天王與哪吒。此關係雖看似簡單,但在道教神譜中常與「化身關係」交織——哪吒既為李天王之子,又為靈珠子轉世,資料庫需能表達這種多重身份。
從屬關係:記錄部將、屬神之隸屬關係,如關羽從屬於玉皇大帝。此關係在雷部、瘟部等職能性神系中尤為密集,形成嚴密的官僚式等級結構。
配祀關係:記錄同壇共祀之神祇組合,如文昌帝君配祀於孔廟。此關係具有對稱性,可用owl:SymmetricProperty建模。配祀關係的歷史變遷(如某神祇從主祀降為配祀)需以時間戳記錄。
主從關係:記錄主神與陪祀之間的等級關係,如三清為主、四御為輔。此關係與「從屬關係」不同,後者強調官僚隸屬,前者強調儀式場合中的主次安排。
分靈關係:記錄祖廟與分香子廟之間的傳承關係,如湄洲祖廟分靈至大甲鎮瀾宮。此關係在臺灣民間信仰研究中極為重要,謝聰輝在《追尋道法:從臺灣到福建道壇調查與研究》(新文豐,2018年)中詳細記錄了閩臺地區的分靈網絡。李豐楙在考察臺灣民間信仰時指出,分靈關係不僅是宗教傳播的地理軌跡,更是社會網絡與經濟網絡的交叉體現——子廟向祖廟的進香、割香、交陪等活動,構成了臺灣宗教社會學研究的核心議題。數位神譜資料庫若能有效建模分靈關係,將為宗教地理學與社會網絡分析提供前所未有的資料基礎。分靈關係可用樹狀結構建模,但實際信仰網絡中常出現「多祖廟」與「跨系統分靈」現象,需以圖結構而非純樹結構表達。
化身關係:記錄同一神格的不同顯化形態,如老子化身為太上老君。此關係涉及道教神學中「道」與「化身」的形上學問題,資料庫需保留「同一性」與「差異性」的辯證空間。
對應關係:記錄跨宗教或跨系統的神格對應,如太乙救苦天尊對應地藏菩薩。此關係在道教與民間信仰、道教與佛教交涉的研究中尤為重要,張超然在考察靈寶度亡經典時,即揭示了道教神譜如何透過「對應」機制吸納佛教元素。
相較於傳統關係型資料庫,圖資料庫(如Neo4j)更適合表達神譜中的多對多、多層級關係。節點(Node)表示神祇、廟宇、經典等實體;邊(Edge)表示實體間的關係,可帶有方向性與屬性;路徑查詢可實現「某神祇的師承鏈」或「兩神祇間的最短路徑」等複雜探索。
(五)多語言與異名問題處理
同一神祇在不同歷史時期、不同地域、不同宗教傳統中往往擁有多個名稱,這是神譜資料庫必須正視的核心挑戰。異名類型至少包括六種:官方封號(如媽祖由天妃晉升天后再晉升天上聖母)、道教封號(如保生大帝由「吳真人」陞為「昊天金闕御史」)、民間俗稱(如玄天上帝又稱真武大帝、北極玄武)、方言音譯(閩南語、粵語、客家話對同一神名的發音變異)、性別對應(如東王公對應西王母)、職能別稱(如天官紫微大帝又稱賜福天官、福星)。
針對異名問題,資料庫應採取四重策略:其一,建立「神祇規範檔」(Authority File),為每一神祇分配唯一識別碼(URI),所有異名以owl:sameAs或skos:altLabel連結至主檔。其二,多語言支援,以RDF的@lang標註語言標籤,如:
<http://example.org/deity/mazu> skos:prefLabel "媽祖"@zh-Hant ;
skos:altLabel "天上聖母"@zh-Hant ,
"Tianhou"@pinyin ,
"天后"@zh-Hans .
其三,來源標註,每一個異名需標註文獻來源與使用脈絡(官方/道教/民間/方言)。高振宏在〈朝封、道封與民封:從三個例子談敕封對神祇信仰的形塑與影響〉(《華人宗教研究》9〔2017〕,頁39–72)中,細緻區分了官方敕封(朝封)、道教內部陞奏(道封)與民間信眾的口頭尊崇(民封)三種神名變動機制,這種三分法應內建於神譜資料庫的異名來源標註系統中。其四,參考現成規範資料庫,如DILA(Digitalis Intelligentiā Linguae Asiaticae)規範資料庫、CBDB(中國歷代人物傳記資料庫)的人名規範機制,以確保異名處理的學術嚴謹性與跨資料庫互操作性。
(六)CIDOC CRM 與文化遺產本體在神譜資料庫中的應用
CIDOC CRM(CIDOC Conceptual Reference Model)是國際博物館協會(ICOM)下屬CIDOC委員會開發的物件導向概念參考模型,目的在於提供一個通用、可擴展的語意框架,促進文化遺產資訊的共用與互操作。CIDOC CRM的核心實體包括E1 CRM Entity、E2 Temporal Entity(事件)、E39 Actor(行為者)、E53 Place(地點)、E70 Thing(事物)等;屬性關係以P開頭,如P14(carried out by)、P67(is documented in)、P89(contains)。
在神譜資料庫中,CIDOC CRM可進行如下映射:神祇映射為E21 Person或E39 Actor;神名與異名映射為E82 Actor Appellation;廟宇映射為E22 Man-Made Object與E53 Place之複合實體;儀式映射為E7 Activity;經典映射為E31 Document;神格晉升事件(如媽祖由斗中玉女轉身為天妃)映射為E5 Event搭配P17 motivated;師承傳授映射為E7 Activity搭配P14 carried out by與P16 used specific object;分靈關係映射為E7 Activity(分香儀式)搭配P25 moved與P27 moved to。
CIDOC CRM已被成功應用於非物質文化遺產(ICH)的本體設計,如「盤王節」領域本體建構。其方法可類推至道教儀式與神譜:以活動(Activity)為核心,串連時間(Time-Span)、地點(Place)、行為者(Actor)、事物(Thing);透過E2 Temporal Entity描述神話事件與歷史事實的交織;透過E31 Document連結經文、方志、碑刻等不同文獻類型。這種以「事件」為中心的建模方式,恰好契合道教神譜的動態性特徵——神祇並非靜態存在的抽象符號,而是在儀式實踐、信仰傳播與神話敘述中不斷被建構與重構的歷史行為者。CIDOC CRM的擴展模型CRMba(Bibliographic Agency)與CRMinf(Influence)進一步提供了文獻傳播與知識影響的建模框架,可用於描述《真靈位業圖》對後世道藏神譜的深遠影響,或《道法會元》等雷法文獻對宋元神譜重組的推動作用。將CIDOC CRM及其擴展模型應用於道教數位典藏,不僅是技術層面的標準化,更是方法論層面的創新——它要求研究者將道教神譜視為「文化遺產事件」的集合,而非固定不變的教條體系。
(七)現有神譜資料庫案例
香港中文大學「道教數位博物館」(Daoist Digital Museum) 由黎志添教授主持,2015年第一期上線,2020年推出第二期「道教經典文獻數位化資料庫」。該館收錄廣州及其周邊十三個州縣共一百五十座道教廟宇、二百九十八通歷代道教廟宇碑刻、一千多張神壇神像照片(部分為三維全景),以及三十多部流行於廣州地區的道教科儀本。技術架構採用Web-GIS平台,以廟宇為核心整合歷史文獻、建築、神像、碑文、地方志與科儀文本。該館為全球首個專門用於道教研究的GIS資料庫,標誌著道教研究從傳統歷史文獻方法轉向基於視覺化的時空維度(https://www.daodigitalmuseum.net/)。
法國遠東學院「湖南神像資料庫」 由范華(Patrice Fava)主持,收錄三千五百餘尊明清以來湖南地區道教神像(其中新化縣道士與法師神像一百三十三餘尊),每尊神像均有編號、照片及開光意旨。建置邏輯以神像為中心,透過「意旨」(神像臟箱內開光文書)考證每尊神像的身份、地址、開光時間與雕刻人(http://www.efeo.fr/statuettes_hunan/)。
中央研究院臺灣寺廟資料庫 由中研院地理資訊科學研究專題中心建置,將內政部宗教登記資料與中研院研究資料交叉整合,含王爺信仰GIS等專題。該資料庫雖非專屬道教,但其空間分析框架與宗教登記資料結構,為臺灣地區道教廟宇與神譜研究提供了重要的基礎設施。此外,中研院民族學研究所「宗教調查資料庫」收錄林美容主持的民間信仰田野調查資料,「臺灣民間信仰書目資料庫」則收錄相關研究文獻目錄,二者共同構成臺灣宗教數位典藏的學術網絡。
這些案例顯示,現有神譜相關資料庫多以「廟宇」或「神像」為中心,而非以「神祇關係網絡」為核心。道教專用神譜本體的建置仍屬學術空白,這正是未來道教數位典藏亟待突破的方向。
五、儀式文本知識圖譜:從結構分析到語義建模
道教科儀文本是道教數位典藏中最具挑戰性亦最具價值的材料之一。其挑戰性在於:科儀文本並非單一類型的文獻,而是融合了韻文、散文、咒語、符籙、圖式等多種文體的複合文本;其價值在於:科儀文本是連結神譜、經典、法器、空間、時間與參與者的樞紐性文獻,透過語義建模可揭示道教宗教實踐的深層結構。本章從科儀文本的結構特徵、雙重結構、語義網技術、圖譜化方法、圖資料庫應用、事件抽取技術、多維關聯建模及本體設計八個面向,系統闡述儀式文本知識圖譜的建構方法。
(一)科儀文本的結構特徵:八大程序
根據呂鵬志、謝世維等學者的研究,道教科儀(尤其靈寶科儀)的儀式結構可歸納為八大核心程序:
啟請(請神):儀式開端,召請三清、玉帝、斗母、官將等神靈降臨壇場,建立人神溝通通道。啟請程序決定了整場儀式的神譜框架,不同科儀因目的不同而請降的神靈組合各異。
誦經:誦唸《度人經》《北斗經》《三官經》等經典。經懺與科儀並行,具備韻文演唱特徵。誦經程序是科儀文本中文學性最強的段落,也是文本探勘技術最易識別的結構單元。
步罡(步虛/禹步):法師按特定罡圖行走,象徵登天、巡遊九宮。此程序結合空間神聖化與身體實踐,是科儀文本中「文—聲—行」合一的典型體現。李豐楙指出,步罡不僅是空間移動,更是一種宇宙論的身體再現——法師的每一步都對應著天界的特定方位與神靈。
存思:法師閉目冥思,存想神靈形象、壇場宇宙化。此程序體現了內煉與外儀的結合,是道教儀式區別於其他宗教儀式的重要特徵。存思的內容雖多為口述或心傳,但科儀文本中常以「存想云云」等提示語標記其存在。
焚化(化表/焚符):焚燒疏文、符籙、紙錢,象徵文書上達天界。此程序為儀式的高潮與完結標誌,在時間軸上具有明確的節點性。施舟人(Kristofer Schipper)在〈The Written Memorial in Taoist Ceremonies〉中深入分析了焚化程序如何將物質性的文本轉化為精神性的溝通行為。
獻供(三獻):向神靈獻茶、酒、果等供品,表達敬意與祈求。獻供程序涉及大量物質文化細節,是連結儀式文本與宗教物質文化研究的關鍵節點。
發遣:派遣官將、符使執行任務,常見於告斗、雷法儀式。此程序體現了道教儀式中「命令—執行」的官僚式邏輯,與神譜中的從屬關係密切對應。
回向/圓滿:將儀式功德回向齋主或亡靈,標誌法事結束。回向文是科儀文本中最具「個人化」特徵的段落,常包含齋主姓名、祈願內容等可結構化資訊。
(二)科儀文本的雙重結構
謝世維提出道教儀式的「雙重模式動態結構」理論,認為科儀文本同時存在縱軸與橫軸兩重結構。縱軸結構(儀式框架)指古典道教科儀的縱向階層結構,如靈寶齋的「宿啟—正齋—散壇」三段式結構,或告斗法的「燃燈—請降—獻供—宣章—焚章」核心結構。此縱軸結構具有高度的穩定性與規範性,是道教「正統性」的儀式表達。橫軸結構(法術框架)則指地方法術傳統的橫向平面結構,涉及區域邪煞驅除、個人醫療、空間環境改變等具體法術操作。此橫軸結構具有強烈的地方變異性與適應性,是道教「民間性」的儀式表達。
兩者在實際儀式中混合運用,形成「法術道教化」與「道教法術化」的動態聯繫。謝世維以斗母法術科儀為例,指出地方道壇在演法時,表面上遵循靈寶齋的縱軸結構,實際上在每一個儀式環節中嵌入了橫軸的法術操作——如「步罡」環節中可能穿插「過火」或「斬煞」等民間法術。這種雙重結構對知識圖譜建模提出了特殊要求:儀式流程不能僅以線性時間軸表示,而需以「多層次嵌套」的結構表達,使縱軸的規範性框架與橫軸的變異性操作得以並存。
(三)RDF/OWL/SPARQL 在儀式文本結構化中的技術細節
RDF以三元組為基本單位,可將科儀文本中的實體(神明、法器、儀式程序)表示為RDF資源並建立語義關係。例如:
@prefix ritual: <http://example.org/ritual/> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
ritual:QingJiao a ritual:RitualType ;
rdfs:label "清醮" ;
ritual:hasPurpose ritual:PrayForBlessing ;
ritual:hasProcedure ritual:SuQi, ritual:FenDeng, ritual:BaiBiao .
OWL 2在本體建構中支援更複雜的類別定義與屬性限制。儀式本體可定義RitualProcedure為頂層類別,Invocation、ScriptureRecitation、SteppingRitual、Visualization、Burning、Offering等為其子類;hasNextProcedure為連接RitualProcedure與RitualProcedure的物件屬性,invokesDeity為連接Invocation與Deity的物件屬性。
SPARQL查詢語言支援SELECT、CONSTRUCT、DESCRIBE、ASK等查詢形式,可透過OPTIONAL處理可能不存在的關係,透過FILTER進行條件限制。例如,查詢所有包含「步罡」程序的科儀及其後續程序:
PREFIX ritual: <http://example.org/ritual/>
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
SELECT ?ritual ?procedure ?nextProcedure
WHERE {
?ritual ritual:hasProcedure ?procedure .
?procedure rdfs:label ?procLabel .
FILTER(CONTAINS(?procLabel, "步罡"))
OPTIONAL {
?procedure ritual:hasNextProcedure ?nextProcedure .
}
}
OWL-Time本體為W3C推薦用於描述時間屬性的本體,可透過xsd:dateTime或OWL-Time描述儀式事件的時間區間,支援「在誦經期間同時進行的程序」等時間重疊查詢。
(四)儀式流程的圖譜化方法:時間軸、空間軸、參與者關係
儀式知識圖譜的核心在於建立儀式與經文、神祇、法器、空間、時間、參與者之間的多維關聯。
時間軸圖譜化:將科儀程序表示為時間序列事件(Temporal Sequence),利用prov:Activity與prov:startedAtTime、prov:endedAtTime屬性建立儀式事件鏈。此種建模支援時間重疊查詢,對於分析科儀中「並行程序」(如誦經與步罡同時進行)尤為重要。Cox與Little所設計的OWL-Time本體提供了intervalEquals、intervalBefore、intervalMeets、intervalOverlaps等十三種區間關係,可精確描述科儀程序之間的時序邏輯。例如,「宿啟」intervalMeets「分燈捲簾」表示宿啟結束之際即是分燈捲簾開始之時,中間無間隔;「誦經」intervalOverlaps「步罡」表示誦經與步罡在時間上有重疊,但二者開始與結束的時間點並不完全一致。這種精細的時間建模,對於還原當代道壇實際儀式的時間結構具有重要價值。林敬智在處理臺南府城延陵道壇近一千三百篇開光疏文時,示範了如何以時間戳記結構化儀式文書中的日期資訊,再進行統計分析與視覺化呈現。
空間軸圖譜化:科儀壇場具有明確的空間方位結構(乾南坤北、青龍白虎、五方五帝),可透過GeoSPARQL或自定義本體建模。林敬智的研究展示了如何利用TGOS(Taiwan Geospatial One-Stop)將開光疏文中的信徒地址轉換為經緯度座標,並在數位地圖上視覺化呈現開光儀式的地理空間分布。這種GIS整合方法,對於理解科儀文本背後的空間意義與宗教地理學價值具有開創性意義。
參與者關係圖譜化:道教儀式的參與者包含神靈層級(三清四御、監壇神將、值日功曹、地方土地)、法師層級(高功、都講、表白、侍經、侍香)與信眾層級(齋主、醮首、信徒家族)。這種多層級參與者模型可透過FOAF(Friend of a Friend)本體與Schema.org的擴展進行建模,亦可自訂道教專用的參與者本體。社會網絡分析(SNA)將神明、信徒與宮廟之間的關係建置為網絡圖,可探索開光地點與神像之間的網絡關係、齋主家族與道壇之間的長期互動模式等議題。將這些多層級參與者及其互動關係建置為網絡圖,可進行社會網絡分析(SNA),探索儀式中的權力結構與溝通模式。Stanford Palladio等社會網絡分析平台可用於探索儀式文本中神明與宮廟的網絡關係。
(五)圖資料庫應用:Neo4j 與 ArangoDB
圖資料庫是儲存與查詢儀式知識圖譜的核心基礎設施。
Neo4j 為原生圖形儲存資料庫,使用Cypher查詢語言,ACID兼容,支援屬性圖模型(Property Graph Model)。在儀式知識圖譜中,Neo4j可將儀式事件(Event)、實體(Entity)、關係(Relationship)儲存為節點與邊,事件實例可聚合為事件類型節點,因果關係實例可聚合為因果關係類型。Neo4j亦支援向量索引(Vector Index)與圖嵌入(Graph Embedding),如FastRP、GraphSAGE、Node2Vec,可進行基於機器學習的儀式模式發現。Cypher查詢範例如下:
// 建立儀式程序節點
CREATE (r:Ritual {name: "清醮", type: "醮儀"})
CREATE (p1:Procedure {name: "宿啟", order: 1})
CREATE (p2:Procedure {name: "分燈捲簾", order: 2})
CREATE (p1)-[:NEXT_PROCEDURE]->(p2)
CREATE (r)-[:INCLUDES]->(p1)
// 查詢某科儀的所有程序序列
MATCH (r:Ritual {name: "清醮"})-[:INCLUDES]->(p:Procedure)
MATCH path = (p)-[:NEXT_PROCEDURE*]->(next)
RETURN p, path
ArangoDB 為原生多模型(Native Multi-Model)資料庫,同時支援鍵值(Key-Value)、文件(Document)與圖形(Graph)資料模型,使用AQL(ArangoDB Query Language)。其優勢在於可減少將非圖形資料強行轉換為圖形的ETL成本;SmartGraph與SmartJoin功能支援分散式環境下的高效圖遍歷與連接查詢;內建圖形機器學習工具,支援GraphSAGE、Metapath2Vec、GAT等圖嵌入方法。對於同時需要儲存大量文本內容(文件模型)與複雜關係網絡(圖模型)的儀式知識圖譜而言,ArangoDB的多模型特性具有顯著優勢。以科儀文本為例,同一部科儀本的完整文本內容可以文件形式儲存於ArangoDB的Document Collection中,而其儀式程序、神祇召請、法器使用等結構化關係則以圖形式儲存於Graph Collection中,二者透過共同鍵值(如科儀本ID)進行關聯查詢,無需昂貴的ETL轉換過程。這種「文件+圖形」的混合儲存策略,對於道教數位典藏中常見的「非結構化文本+結構化關係」資料形態尤為適切。
此外,Virtuoso作為混合資料庫可儲存RDF三元組並提供SPARQL Endpoint;AllegroGraph為多模型資料庫,支援RDF與屬性圖,適合需要複雜推理的儀式本體應用場景。
(六)語義標記與事件抽取:CEAN、ZED、DAEE
事件抽取(Event Extraction, EE)是從非結構化文本中識別預定義的事件觸發詞(Trigger)與論元(Argument)的NLP關鍵任務。道教儀式文本的事件抽取面臨特殊挑戰:中文儀式文本的古漢語與宗教術語需要專門的領域適應(Domain Adaptation);資料標注成本高,屬於低資源(Low-Resource)場景。
近年來的深度學習技術為儀式文本事件抽取提供了新工具。CEAN(Contrastive Event Aggregation Network) 結合LLM資料增強與對比學習,減少資料雜訊,在ACE2005與ERE-EN資料集上達到最先進水準。ZED(Zero-shot Event extraction with Definition) 透過事件類型定義的語義嵌入,實現零樣本事件抽取,對於缺乏大規模標注資料的道教儀式文本尤具參考價值。DAEE(Denoised Structure-to-Text Augmentation for Event Extraction) 基於知識的結構到文本生成模型,透過深度強化學習篩選有效增強資料。
儀式文本的語義標記方案可設計如下事件類型:Invocation(啟請)、ScriptureRecitation(誦經)、SteppingRitual(步罡)、Visualization(存思)、Burning(焚化)、Offering(獻供)等。論元角色標記包括:Agent(執行者:高功/法師)、Instrument(法器:劍/鈴/水盂)、Location(地點:壇場/靈堂)、Time(時間:子時/午時)、Deity(對象神靈)、Beneficiary(受益者:齋主/亡靈)。
半自動標記工具方面,臺灣大學數位人文研究中心開發的DocuSky數位人文學術研究平臺提供文本標記、建庫、探勘與視覺化工具,已介接MARKUS古籍半自動標記平臺與CBETA、CTEXT等大型線上資料庫,是道教儀式文本語義標記的重要基礎設施。胡其瑞在〈數位人文視野下的華人宗教研究:以DocuSky數位人文學術研究平臺為例〉(《華人宗教研究》16〔2021〕)中,具體展示了如何運用DocuSky進行道教文獻的詞彙統計分析、GIS整合與視覺化呈現,其方法論可直接移植至儀式文本的語義標記工作。
(七)儀式與經文、神祇、法器之間的關聯建模
儀式知識圖譜的核心價值在於揭示儀式與經文、神祇、法器之間的結構化關聯。
儀式—經文關聯:科儀中「誦經」程序與經懺文本緊密結合。如《太上洞玄靈寶滅度五煉生屍妙經》記載的度亡儀式,融攝了佛教陀羅尼密咒、天師道章文和方士傳統的五行觀念。科儀文本中常引用特定經典的章句,可建模為citesScripture關係。呂鵬志在研究中古道教儀式時,特別強調經文引用模式對於理解科儀文本「互文性」的關鍵作用。
儀式—神祇關聯:道教儀式中的神譜具有嚴格的階層性,可透過subordinateTo或hasHigherDeity建立神譜樹狀結構。如斗母法術以「斗母摩利支天」為主神,副將包括官將、功曹等。謝世維指出,道教儀式中的神祇召請順序本身就是一種「神譜的儀式化展演」,高功在啟請時從三清一直請到地方土地,這個降序過程即是道教宇宙論的聲音重現。
儀式—法器關聯:法器可依儀式功能分為溝通類(龍角、法鐘、淨板)、驅邪類(桃木劍、法索、符籙)、供養類(手爐、水盂、供盤)、空間類(靈幡、黃道圖、闕圖)。勞格文(John Lagerwey)在道教儀式田野調查中特別關注法器的象徵意義,如龍角作弓、師刀作弦,象徵性射出扇子代表文狀上天。這種「法器—動作—象徵」的三重結構,可透過本體屬性與事件建模完整表達。
(八)完整 OWL 本體類別/屬性設計與 RDF Turtle 資料模型範例
以下展示一套簡化的道教儀式本體設計與RDF Turtle資料模型:
@prefix ritual: <http://lius.cc/ontology/ritual/> .
@prefix dao: <http://lius.cc/ontology/taoist/> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix owl: <http://www.w3.org/2002/07/owl#> .
@prefix xsd: <http://www.w3.org/2001/XMLSchema#> .
# 類別定義
ritual:Ritual a owl:Class ;
rdfs:label "儀式"@zh-Hant .
ritual:DaoistRitual a owl:Class ;
rdfs:label "道教儀式"@zh-Hant ;
rdfs:subClassOf ritual:Ritual .
ritual:RitualProcedure a owl:Class ;
rdfs:label "儀式程序"@zh-Hant .
ritual:Scripture a owl:Class ;
rdfs:label "經文"@zh-Hant .
ritual:Instrument a owl:Class ;
rdfs:label "法器"@zh-Hant .
ritual:RitualSpace a owl:Class ;
rdfs:label "儀式空間"@zh-Hant .
ritual:Participant a owl:Class ;
rdfs:label "參與者"@zh-Hant .
# 物件屬性
ritual:hasProcedure a owl:ObjectProperty ;
rdfs:domain ritual:Ritual ;
rdfs:range ritual:RitualProcedure ;
rdfs:label "包含程序"@zh-Hant .
ritual:usesScripture a owl:ObjectProperty ;
rdfs:domain ritual:RitualProcedure ;
rdfs:range ritual:Scripture ;
rdfs:label "使用經文"@zh-Hant .
ritual:invokesDeity a owl:ObjectProperty ;
rdfs:domain ritual:RitualProcedure ;
rdfs:range dao:Deity ;
rdfs:label "召請神祇"@zh-Hant .
ritual:usesInstrument a owl:ObjectProperty ;
rdfs:domain ritual:RitualProcedure ;
rdfs:range ritual:Instrument ;
rdfs:label "使用法器"@zh-Hant .
ritual:nextProcedure a owl:ObjectProperty , owl:TransitiveProperty ;
rdfs:domain ritual:RitualProcedure ;
rdfs:range ritual:RitualProcedure ;
rdfs:label "後續程序"@zh-Hant .
ritual:performedBy a owl:ObjectProperty ;
rdfs:domain ritual:RitualProcedure ;
rdfs:range ritual:Participant ;
rdfs:label "由...執行"@zh-Hant .
# 資料屬性
ritual:startTime a owl:DatatypeProperty ;
rdfs:domain ritual:RitualProcedure ;
rdfs:range xsd:dateTime ;
rdfs:label "開始時間"@zh-Hant .
ritual:order a owl:DatatypeProperty ;
rdfs:domain ritual:RitualProcedure ;
rdfs:range xsd:integer ;
rdfs:label "順序"@zh-Hant .
# 實例:清醮儀式
ritual:QingJiao a ritual:DaoistRitual ;
rdfs:label "清醮"@zh-Hant ;
ritual:hasPurpose "祈福禳災"@zh-Hant ;
ritual:hasProcedure ritual:SuQi, ritual:FenDeng, ritual:JinBiao .
ritual:SuQi a ritual:RitualProcedure ;
rdfs:label "宿啟"@zh-Hant ;
ritual:order "1"^^xsd:integer ;
ritual:performedBy ritual:Gaogong ;
ritual:invokesDeity dao:Sanqing, dao:Yuhuang ;
ritual:usesInstrument ritual:Shoulu, ritual:Jian ;
ritual:nextProcedure ritual:FenDeng .
ritual:FenDeng a ritual:RitualProcedure ;
rdfs:label "分燈捲簾"@zh-Hant ;
ritual:order "2"^^xsd:integer ;
ritual:usesInstrument ritual:Lazhu, ritual:Jinzhong ;
ritual:symbolizes "宇宙生成"@zh-Hant ;
ritual:nextProcedure ritual:JinBiao .
此本體設計採用模組化策略,儀式本體(ritual:)與神譜本體(dao:)分離但可互相引用,便於未來擴展與維護。ritual:nextProcedure定義為TransitiveProperty,使推理引擎可自動推導間接的先後關係(如宿啟在進表之前)。此外,本體中可進一步加入owl:Restriction限制條件,例如規定每一個RitualProcedure必須至少有一個performedBy屬性(即每一程序必須有執行者),或規定DaoistRitual必須包含至少一個invokesDeity的程序(即道教儀式必須召請神祇)。這些限制條件可透過OWL推理引擎(如HermiT、Pellet)進行一致性檢查,確保資料庫中的儀式描述符合道教儀式的基本邏輯。未來擴展時,可進一步引入SKOS(Simple Knowledge Organization System)建立儀式類型的受控詞彙表,或引入PROV-O(PROV Ontology)記錄資料的來源與修訂歷史,從而提升儀式知識圖譜的互操作性與可追溯性。
六、現有道教數位典藏項目評析
道教數位典藏經歷了三十餘年的發展,已形成橫跨臺灣、中國大陸、日本、美國與歐洲的國際性學術基礎設施網絡。本章選取各區域具代表性的道教數位典藏項目,從計畫名稱、主辦單位、網址、典藏內容與規模、技術架構與標準、開放授權與API六個維度進行評析,並在末節進行綜合比較與技術趨勢分析。
(一)臺灣地區
中央研究院「漢籍全文資料庫計畫」(含《正統道藏》)
中央研究院民族學研究所「道教文物特藏」
法鼓山/中華電子佛典協會(CBETA)——技術參照
CBETA由財團法人佛教電子佛典基金會主辦,網址為https://cbetaonline.dila.edu.tw/zh/,原始資料存放於GitHub(https://github.com/cbeta-git/xml-p5a)。雖屬佛教,然其數位化流程與TEI標記規範為東亞宗教文獻數位化之標竿。典藏內容以《大正新脩大藏經》與《卍新續藏》為底本,合計逾一點五億字漢文佛典。技術架構採用TEI P5 XML國際標準標記語言,Java跨平台讀經介面(jCBReader),Client-Server架構使介面與資料分離,支援Unicode與OPDS電子書發布。開放授權採Creative Commons釋出,完整XML原始資料可於GitHub公開下載,提供HTML格式、純文字格式、EPUB電子書,具線上API與手機版介面。CBETA的經驗對道教數位典藏具有直接參考價值:其TEI P5標記框架、版本對照機制、開源釋出模式與多格式輸出,均可移植至《正統道藏》《道藏輯要》等道教文獻的數位化工程。
(二)中國大陸
中國國家圖書館「中華古籍資源庫」與法藏敦煌遺書數位回歸
《中華道藏》與愛如生《道教經典庫》
《中華道藏》由中國道教協會主持,張繼禹主編(北京:華夏出版社,2004年),為明《正統道藏》標點整理本,並收入敦煌遺書等重要文獻,共四十九冊,後發行線裝本與數位版。愛如生《道教經典庫》由北京愛如生數位化技術研究中心主辦,網址為http://er07.com/(籍合網)。典藏內容整合「道藏編」與「藏外道書編」:道藏編收明《正統道藏》《萬曆續道藏》;藏外道書編收明清以降道書凡二千餘部,採用明清及民國善本,以「數位再造技術」製作,左圖右文,逐頁對照。技術架構採用自家「數位再造技術」與還原式頁面設計,支援全文檢索、版本對照、繁簡轉換、圈點批注、語音字典等功能。開放授權方面,《中華道藏》需購買或透過機構授權使用;愛如生為商業資料庫,需付費訂閱,未提供公開API。
中國哲學書電子化計劃(CTEXT)
CTEXT由Donald Sturgeon個人主持,與香港中文大學等合作,網址為https://ctext.org/zh。典藏內容收錄先秦兩漢至明清大量原典文獻,含《正統道藏》多部經典(如《雲笈七籤》《道樞》《歷世真仙體道通鑑》《黃庭內景玉經》等)以及《太平經》《真誥》等早期道教文獻,另有維基式「中國歷代書目」與「線上圖書館」功能,總計收錄超過五十一億個中文字。技術架構以Unicode編碼為基礎,採用結構化文本與版本對照,具備全文檢索、字典連結、簡繁轉換,後端採用開源技術堆疊。開放授權採開放取用(Open Access),提供部分文本下載,設有API供學術研究使用(需申請),原始資料以開放授權釋出。CTEXT的N-gram切割、Regex搜尋、文字相似性比對、網絡圖與文字雲視覺化功能,以及RDF格式輸出支援,為道教文獻的數位人文分析提供了重要工具。
(三)日本
東洋文庫所藏漢籍數據庫檢索系統
京都大學人文科學研究所「道氣社」
由京都大學人文科學研究所(日本道教学會)主辦,網址為http://www.zinbun.kyoto-u.ac.jp/~dokisha/,電子版工具書為http://tianzun.zinbun.kyoto-u.ac.jp/~dokisha/sakuin.html。典藏內容收錄約二十餘部道教文獻的可搜索索引(老子各家注等),提供「道教文獻檢索」與「電子版漢籍文庫」,以道教文獻為主。技術架構早期採用日文編碼(ISO)建置,提供全文檢索與索引功能,屬學術研究用之專門工具。開放授權為免費線上使用,未提供API。
早稻田大學道教研究所「道藏數據庫」
由早稻田大學文學部東洋哲學研究室(道教研究所)主辦,網址為http://www.littera.waseda.ac.jp/appendix/Daoism/。提供道藏相關文獻的數位檔案與研究資源,為日本學界重要的道教研究入口網站之一。技術架構為網頁式資料庫,提供目錄與部分電子檔案下載。開放授權為學術研究免費使用,未提供公開API。
東京大學東洋文化研究所藏漢籍善本全文影像資料庫
由東京大學東洋文化研究所主辦,網址為http://shanben.ioc.u-tokyo.ac.jp/。收錄東洋文化研究所所藏漢籍善本的全文影像,包括部分道教古籍,與「漢籍リポ(Kanseki Repository)」合作,提供開放取用之古籍影像。技術架構採用全文影像掃描,IIIF國際圖像互操作框架逐步導入,元資料採用國際標準。開放授權採開放取用(Open Access),影像免費瀏覽下載,部分支援IIIF API。
(四)美國
哈佛燕京圖書館中文善本數位化項目
由哈佛大學哈佛燕京圖書館主辦,網址為https://library.harvard.edu/libraries/harvard-yenching-library。2010年與中國國家圖書館簽署六年合作協議(2010–2015),將哈佛燕京圖書館所藏全部中文古籍善本(約四千一百種、五萬二千卷)進行數位化。館藏包含道教文獻如《道藏子目引得》(翁獨健編,1935年哈佛燕京學社出版)、明清道教寫本、善本等。2018年左右已有四千二百部、五萬三千卷古籍善本實現數位化並開放上線。技術架構與Harvard College Library Digital Imaging Group合作電子影像製作,採用國際圖書館metadata標準(MARC, MODS, Dublin Core),支援線上閱覽與下載。開放授權為全球學者免費使用(free of charge),影像與書目記錄開放查詢,部分資料透過Harvard Library數位平台提供API與IIIF服務。
(五)歐洲
歐洲數位圖書館(Europeana)
由Europeana Foundation主辦(歐盟支持),網址為https://www.europeana.eu/,API入口為https://api.europeana.eu/。典藏內容彙集歐洲各國博物館、圖書館、檔案館之數位文化資產,總計數千萬筆。直接以「Taoism」「Daoism」檢索可獲得少量道教相關藝術品、文物與文獻紀錄,但非專門道教平台。其價值在於技術架構與開放資料標準可供參照。技術架構採用歐洲文化遺產語意網架構:EDM(Europeana Data Model)基於RDF;支援IIIF Presentation API與Image API;提供SPARQL端點、OAI-PMH收割協定、Entity API、Annotation API、Recommendation API等。開放授權提供開放API(需申請API Key),Search API與Record API免費使用,資料授權依各內容提供者,可篩選Public Domain/CC0/CC BY等開放授權素材,支援JSON-LD、RDF/XML格式。
法國遠東學院(EFEO)
École française d'Extrême-Orient為國際道教研究重鎮,網址為https://www.efeo.fr/。施舟人(Kristofer Schipper)於1975年編纂《道藏通檢》(Concordance du Tao-tsang),為早期道藏文獻索引之里程碑。勞格文(John Lagerwey)長期主持中國地方道教儀式田野調查,出版《道教儀式叢書》計畫(預計十五冊),結合科儀抄本之校勘版與儀式研究。另主編Cahiers d'Extrême-Asie道教專號(1989–1990, 2002)與Religion and Chinese Society(EFEO & CUHK, 2004)。技術架構以傳統文獻學校勘與索引為主,近年逐步導入數位工具,與法國國家圖書館(Gallica)、國際敦煌學項目(IDP)有合作。開放授權方面,出版品多為學術專書與期刊,需購買或透過機構授權,未設專屬道教文獻數位平台或API。
法國國家圖書館(Gallica)
法國國家圖書館藏敦煌遺書數位回歸計畫為其與中國國家圖書館、敦煌研究院、北京大學之合作項目,Gallica平台網址為https://gallica.bnf.fr/。伯希和(Paul Pelliot)1908年獲取之敦煌文獻共約七千餘號,2015年法國國家圖書館向中國國家圖書館贈送五千三百餘號高清數位資源,2018年線上發布。內容含道教佚書《老子化胡經》《度仙靈籙儀》寫本等。技術架構採用高清彩色影像(全彩版),元資料採用國際古籍描述標準,支援多語種(漢、藏、梵、回鶻、于闐、粟特等)文獻檢索。開放授權為國圖線上發布資源免費檢索瀏覽(需註冊),法國Gallica平台部分開放,IIIF影像標準逐步導入。榮新江主持《法國國家圖書館藏敦煌文獻》(全彩版,上海古籍出版社,2023年起出版)為此計畫之配套學術出版。
(六)綜合比較與技術趨勢
資料格式與標準比較
從技術標準的角度觀察,現有道教數位典藏項目呈現明顯的層級分化。TEI P5 XML作為國際人文文獻標記標準,目前僅在CBETA(佛教,技術參照)中得到完整應用,道教文獻領域尚未有大規模TEI標記項目。Unicode與XML編碼已成為基礎門檻,絕大多數項目均已採用。IIIF國際圖像互操作框架在東京大學東洋文化研究所、Europeana、國際敦煌項目等機構逐步導入,為跨平台影像比對與多層級調用提供了技術可能,但道教專屬項目對IIIF的採用仍屬起步階段。RDF與Linked Open Data在Europeana(EDM模型)中有成熟應用,道教領域則僅見於CTEXT的部分輸出支援與個別研究計畫的實驗性建置。GIS技術在香港中文大學道教數位博物館與中研院數位方輿中有示範性應用,但尚未與神譜資料庫深度整合。
開放程度光譜
現有項目可依開放程度排列為連續光譜:完全開放端包括CTEXT(免費檢索、下載、API調用)、東京大學東洋文化研究所善本影像(Open Access)、Europeana部分素材(Public Domain/CC0);開放資料端以CBETA為代表(Creative Commons釋出、GitHub公開原始檔);註冊後免費使用端包括中國國家圖書館中華古籍資源庫、法藏敦煌遺書數據庫;機構授權/付費端包括愛如生《道教經典庫》、漢籍全文資料庫授權版;瀏覽免費但下載受限端包括中研院道教文物特藏、白雲深處人家等民間網站。
此光譜顯示,道教數位典藏在開放性方面仍有巨大提升空間。相較於CBETA以Creative Commons釋出完整XML原始檔之開源模式,道教文獻數位化項目多停留在「線上閱覽」層面,未能充分釋放資料的再分析與再創造潛力。具體而言,愛如生《道教經典庫》與《中華道藏》數位版雖提供全文檢索,但封閉的商業授權模式限制了學術社群對其資料進行語義標記、知識圖譜建構與跨資料庫整合的可能性;中國國家圖書館中華古籍資源庫雖已釋出大量高清影像,但未提供結構化metadata API,研究者難以批次擷取書目資訊與影像連結進行系統性分析。Europeana的SPARQL端點與IIIF服務、CBETA的GitHub開源釋出模式,為未來道教知識圖譜與跨典藏串連提供了重要技術參照。
技術趨勢與對道教數位典藏的啟示
綜合評析上述項目,可歸納出四項技術趨勢與啟示。其一,文本層面之道藏全文數位化已有愛如生、白雲深處人家、CTEXT等基礎,但結構化標記(TEI/XML)與機器可讀語意標註仍屬起步階段。其二,儀式文本層面,勞格文主持的EFEO道教儀式叢書提供大量科儀抄本校勘版,但尚未有系統性數位平台與全文檢索;臺灣中研院民族所道教文物特藏雖有影像,但缺乏OCR與標記。其三,神譜與空間層面,目前缺乏專門的道教神譜知識圖譜資料庫;香港中文大學道教數位博物館與中研院數位方輿示範了GIS在宗教空間研究中的應用,但神祇關係網絡的語義建模尚屬空白。其四,開放資料層面,Europeana的RDF/SPARQL/IIIF架構、CBETA的GitHub開源釋出模式,為未來道教知識圖譜與跨典藏串連提供了可資借鑑的技術路徑。
對於lius.cc而言,現有資料庫已具備紮實基礎:二十四,032筆scripture節點涵蓋道藏經典、科儀文本與地方志書;十三,587筆deity節點涵蓋星辰神、護法神、地方神等;十一,935筆ritual節點加上scripture中大量科儀文獻,構成儀式研究的文獻基礎。然而,與國際先進項目相比,lius.cc在結構化標記、知識圖譜技術與開放資料標準方面尚處於起步階段。現有條目多以「單一節點」為單位進行百科式描述,節點與節點之間的結構化關聯(如「經典—神祇—科儀」三元關係)尚未以數位化方式呈現;「知識圖譜」僅有一筆命中,顯示RDF、本體論、語意網路等技術方法尚未進入資料庫的知識架構。然而,結構化標記空白、知識圖譜技術尚未導入、跨節點關聯待強化等缺口依然存在。未來可參照本章所闡述之RDF/OWL本體設計、圖資料庫架構與事件抽取技術,以《雲笈七籤》《靈寶五符序》等已有旗艦報告的經典為試點,探索TEI標記框架在道教經典中的應用;以北帝信仰、北斗信仰為試點,建構「神格—經典—科儀」三元知識圖譜原型,從而推動道教數位典藏從「資料堆積」邁向「知識生產」的新階段。
道教數位典藏方法考:經典標記、神譜資料庫與儀式文本知識圖譜
七、數位人文方法論在道教研究中的應用
1. 道教研究的數位轉向:從文獻整理到輿情分析
數位人文(Digital Humanities, DH)作為將計算工具與方法應用於人文學科研究問題的跨學科領域,自二十一世紀以來已深刻改變了漢學與宗教研究的方法論格局。在中國古典文獻學領域,傳統依賴精細手動校勘與詮釋的研究方式,如今透過文本探勘、網絡分析與數位地圖等技術,得以分析大型文獻語料庫、識別隱藏模式並視覺化文本間的複雜關係。道教研究作為漢學的重要分支,同樣經歷了顯著的「數位轉向」。
張陽(中國社會科學院世界宗教研究所)指出,互聯網宗教問題已成為宗教學研究不可忽視的面向,道教學研究已離不開數位人文技術與理論的應用。這一轉向可大致劃分為三個階段:第一階段為「文獻數位化」,即利用掃描、OCR 與全文檢索技術將《道藏》、科儀抄本、碑刻拓片等轉為可檢索的電子文本,以中研院漢籍電子文獻、北京愛如生「道教經典庫」、香港中文大學道教數位博物館為代表;第二階段為「資料庫建設與結構化標記」,學者開始以 TEI/XML、Dublin Core 等標準對文本進行語義層級的編碼,並建構專題資料庫;第三階段則是「分析與詮釋導向的數位人文」,運用文本探勘、GIS、社會網絡分析等技術,從大規模數據中發現傳統閱讀難以察覺的模式,並將數位分析結果與田野調查、文獻考證相結合。
在這一轉向過程中,若干關鍵學者與機構發揮了奠基作用。李豐楙長期致力於道教儀式研究與道藏典籍解讀,曾主持「陳榮盛道長道教科儀影像及音樂藝術數位典藏計畫」,展示了田野與數位結合的典範。卿希泰(1927-2017)主編《中國道教史》(四卷本)、《中國道教通史》(五卷本),建立了道教歷史研究的學科體系,為後續數位典藏提供了基礎文獻框架。黎志添主持的香港中文大學道教數位博物館,則是華語世界最具規模的道教數位典藏平台之一。呂鵬志專精唐前道教儀式史,其對敦煌寫本《度仙靈籙儀》、古靈寶經等文獻的精密考證,為儀式文本的結構化標記提供了學術典範。這些先驅工作共同構成了道教數位典藏的方法論基礎。
數位人文方法論在道教研究中的應用,目前主要涵蓋文本探勘、地理資訊系統(GIS)、社會網絡分析(SNA)、數量史學與大數據方法,以及可視化技術等五大領域。以下分述之。
2. 文本探勘在道教經典與儀式疏文中的應用
2.1 府城延陵道壇開光疏文文本探勘案例
道教經典文本的數位人文處理,早期多以《道藏》經文作為分析對象。然而,儀式文本——尤其是具有高度模式化特徵的疏文、榜文、符命等——的數位人文處理相對較少。林敬智(國立政治大學宗教研究所)於 2020 年發表的〈道教開光儀式疏文之文本探勘與數位人文探索:以府城延陵道壇為例〉,開創性地將文本探勘技術應用於道教儀式疏文,為後續研究提供了重要方法論參照。
該研究以台南府城延陵道壇吳政憲道長 2014 至 2018 年間近 1,300 篇開光疏文為分析對象。林敬智指出:「道士開光疏文具有高度模式化的傾向,正好適合以資訊技術擷取其中之關鍵內容,包括開光神像、分靈祖廟或子廟、信徒等方面的資訊。由於開光疏文有基本之套路,道士撰寫時填入幾項基本的欄位,相對於一般文獻更為單純,可以利用 Python 程式語言來擷取其中的內容。」
具體而言,該研究運用 Python 撰寫正規表示式(Regular Expression),自動擷取以下結構化資訊:信徒地址、分靈祖廟、開光信徒姓名、開光之神明、新宮壇與神明尊稱、開光儀式之年月日。這種「遠讀」(distant reading)方法結合傳統「近讀」(close reading)研究進路,提出了若干傳統閱讀難以發現的洞見:其一,農曆七月(鬼月)幾乎不舉行開光儀式;其二,每月農曆十五日亦很少開光;其三,吳道長的開光儀式從南部為主逐漸向中北部、東部開拓,並於丙申年(2016)開始向海外(日本東京、南京、新加坡)擴展。這些發現展示了數位方法在揭示儀式實踐的時空模式上的獨特價值。
2.2 主題模型(LDA)在宗教文本分析中的應用
主題模型(Topic Modeling)是一類無監督機器學習技術,其中最廣泛使用的演算法為隱含狄利克雷分配(Latent Dirichlet Allocation, LDA)。LDA 可檢視大型文本集合的主題結構,在宗教文本分析中尤其適用於確定不同宗教傳統中的主題模式。Blei、Ng 與 Jordan 於 2003 年提出的 LDA 模型,假設每份文件由若干主題混合而成,每個主題則是一組詞彙的機率分布,從而能在無需預先標記的情況下自動發現文本集合中的潛在主題。
在宗教文本分析領域,主題模型已被用於檢測神學語言、敘事結構和神學發展的模式。自然語言處理(NLP)技術可大規模處理宗教語料庫,識別特定時期或宗派文本中的核心概念群集。以道教研究而言,LDA 可用於分析《道藏》中不同部類(洞真、洞玄、洞神、太玄、太平、太清、正一)的文本主題分布,識別各類經文的話語特徵;也可用於比較不同時期科儀文本的主題演變,追蹤特定神祇或儀式元素在歷時層面上的出現頻率與語義變遷。Althage(2023)在《計算神學概論》中系統整理了主題模型在神學研究中的應用框架,指出該方法對於理解大型宗教文本集合的概念結構具有不可替代的價值。
工具層面,開源軟體 Gensim 提供了高效的 LDA 實作,Voyant Tools 則為非程式設計背景的研究者提供了友善的文本分析與視覺化介面,AntConc 作為語料庫分析工具亦廣泛應用於宗教文本的詞頻與搭配分析。
3. GIS 在道教聖地、廟宇分布、儀式空間研究中的應用
地理資訊系統(Geographic Information System, GIS)技術允許整合多層空間資料(人口統計、環境、文化資料),為宗教遺產提供全面的空間模式理解。對於與地理資料密切相關的數位典藏而言,GIS 可以使用更直覺化的方式呈現資料內容。盧雲峰、黃星堯、陳朗(北京大學社會學系)在〈數字人文視野中的中國民間信仰〉中指出:「田野調查是民間宗教研究的主要方法,但由於田野地點的空間限制,傳統路徑難以獲得全面和整體的理解。隨著數位人文技術的興起,可以利用資料庫和 GIS 技術探索民間宗教調查研究的新路徑。」
3.1 香港中文大學道教數位博物館 Web-GIS
香港中文大學道教數位博物館(Dao Digital Museum)是華語世界道教 GIS 應用的標竿項目,由黎志添主持,道教研究小組與地理資訊技術小組協作完成。2015 年第一階段成果收集廣州及其周邊十三個州縣共 150 座道教廟宇資料,整合歷史文獻、建築、神像、碑文、地方志、檔案資料、歷史地圖及科儀文本,利用 Web-GIS 系統建立展現平台與管理系統,用於維護、整理、展現和分析相關廟宇的空間和歷史特徵。該平台以廟宇為中心,將多源資料整合,方便用戶進行空間定位與歷史縱深探索。第二期「道教經典文獻數位化資料庫」更進一步收錄道教科儀文獻、道教碑刻文獻、呂祖道書文獻,形成「空間—文獻—圖像」三位一體的數位典藏架構。
3.2 Kenneth Dean 東南亞華人廟宇 GIS
Kenneth Dean(丁荷生,新加坡國立大學)與合作者建構的東南亞華人廟宇網絡 Web-GIS 數位人文平台,是跨國宗教空間研究的典範。該平台系統性整合、保存並開放東南亞及相關地區華人宗教與社會文化史跡的空間信息數據,覆蓋台灣、新加坡、泰國、印尼、老撾、馬來西亞等地。其數據集規模龐大:台灣佛教寺廟 5,059 筆、2017 年台灣東北金山與石門地區宗教場所調查 147 筆、曼谷華人廟宇調查 199 筆、新加坡華人廟宇 834 筆(2005-2017 年收集)、新加坡華人社團 358 筆。Dean 等人於 2020 年在《Religions》期刊發表的論文詳細闡述了這一平台的技術架構與學術價值,展示了 GIS 在華人離散社群宗教研究中的應用潛力。
此外,Dean 主持的馬來西亞歷史 GIS(Malaysian Historical GIS, MHGIS)聚焦柔佛州(Johor)華人廟宇的空間分布與歷史變遷,於 2022 年與 2023 年分別發表相關研究成果,為東南亞華人宗教數位人文研究建立了長期追蹤的方法論基礎。
3.3 Marcus Bingenheimer 台灣佛教寺廟 GIS 時空平台
Marcus Bingenheimer(馬德偉,法鼓文理學院)與洪健榮合作開發的台灣佛教寺廟 GIS 時空平台,收錄 5,059 座 2010 年仍然存在並運作的佛教寺廟,另有約 500 座已廢止或遷移的歷史寺廟。該平台整合時間軸、寺廟發展歷程和 Google Map 的地理空間,創造包含人與時空互動關係的數字研究平台。用戶可按地址、縣市、名稱、主祀、宗派、地圖等內容查詢,時間軸功能更能顯示特定年代的寺廟地理分布,從而觀察宗教空間的歷史擴張與收縮模式。雖然該平台以佛教寺廟為主,但其「時間軸 + 地理空間 + 宗派分類」的三維分析框架,對道教廟宇分布研究具有直接的借鑑價值。
值得注意的是,林敬智在開光疏文研究中也運用了 GIS 技術進行空間分析。他利用內政部國家地理資訊圖資雲服務平台(TGOS)「全國門牌地址定位服務」進行批次門牌地址比對,再使用 QGIS、DocuGIS、TGOS 地圖協作平台等繪製開光地圖,成功呈現開光儀式空間分布的整體趨勢與區域特徵。
4. 社會網絡分析(SNA)在神祇-宮廟關係、宗派傳承中的應用
社會網絡分析(Social Network Analysis, SNA)可為各種社會關係提供精確的量化分析,從而為構建理論模型和驗證命題提供社會化例證,挖掘出更多隱含的社會關係和變化趨勢。在數位人文領域,網絡分析採用的方式和方法從概念上有別於傳統的統計分析和數據處理方法,是探索數位化文史材料上人文問題的新工具。隨著 SNA 在數位人文研究中的逐步開展,人物不再是網絡中的唯一節點,由文本、詞語等元素構成的網絡開始被學者關注並在研究中使用。宗教傳統往往包含跨越制度和地理邊界的複雜權力與概念網絡,SNA 可幫助研究者繪製這些關係,並理解數位技術如何重塑傳統宗教網絡。
林敬智在開光疏文研究中,利用 Stanford 大學開發的 Palladio 平台進行神明-宮廟網絡分析,將開光之神明與開光地點進行關係網絡視覺化。研究發現:甲午年吳政憲道長所開光之神尊,以中壇元帥、天上聖母、廣澤尊王、天官武財神為大宗;中壇元帥以新營太子宮為主要地點,但也包括在台南的其他太子宮廟及自宅;天上聖母分散於不同的天上聖母宮廟,顯示出不一樣的型態;廣澤尊王分別在台南兩大信仰中心——開基永華宮與西羅殿。這些發現展示了 SNA 在揭示儀式實踐中的神祇-空間關係模式上的分析力。
在更大尺度上,Kenneth Dean 與鄭振滿合著的《Ritual Alliances of the Putian Plains》(2010,Brill,二卷本)透過 GIS 將莆田地區的文化地理加以標記,透過一層一層的地圖顯示這個地區文化的堆疊與相互關係,結合 GIS 與社會網絡分析,呈現多層次的空間與歷史交互圖像。Dean 等人 2020 年發表的東南亞華人廟宇網絡研究,更進一步建構了跨國 Web-GIS 數位人文平台,用於協作研究中國海外移民的宗教網絡。
工具層面,開源軟體 Gephi 是最廣泛使用的網絡分析與視覺化工具,Cytoscape 適合複雜網絡分析,NetworkX 為 Python 網絡分析庫,NodeXL 則是 Excel 插件式網絡分析工具,Palladio 平台尤其適合人文學者進行初步的網絡與地圖探索。
5. 數量史學與大數據方法
數位人文的量化分析方法可進行至少兩個層次的分析:宏觀的量化分析與微觀的質化分析。利用數位典藏資料庫進行量化分析,可以呈現和解釋在前數位人文時代中難以處理和了解的人文現象。張陽指出,數位人文平台對道教輿情的分析和研究,可以助力新時代道教治理。當代道教的各種問題已開始呈現多樣化趨勢,單一的文字記敘、單向的傳播方式已不再是主流,數位技術平台下道教相關問題開始立體式呈現。
具體案例方面,中國人民大學 2006-2017 年「中國綜合社會調查」(CGSS)數據顯示:道教普通信徒人數在被調查總人數中的比例,從 2006 年的 0.20% 增長至 2017 年的 0.25%;道教普通信徒在各類信仰人群中的比例,從 2006 年的 1.48% 增長至 2017 年的 2.30%。這類宏觀數據為理解當代道教發展趨勢提供了量化基礎。四川大學 Chen Zhang 於 SSCE 2022 會議發表的研究則運用統計分析與比較方法,分析宗教數位人文的複雜網絡,發現佛教與道教在中國宗教教學中的發展較好,文本分類準確率和召回率均達 0.8 以上。
在歷史文獻的量化分析方面,佛典註釋研究已發展出較為成熟的模式:利用引用型式、引用頻率、引用字數等量化分析方法,具體化闡述傳統建構的階段性和社群性。石井公成運用 NGSM(N-gram Based System for Multiple Document Comparison and Analysis)方法考察《起信論》用語與菩提流支、勒那摩提譯本的相似性;伊吹敦透過特定用語的遵循、重塑、替代或遺漏考察,重構《金剛經解義》版本。這些佛教數位人文的量化方法,對道教經典的互文性分析與版本學研究具有直接的啟發意義。
6. 可視化技術:時空地圖、網絡圖、神譜圖像化
可視化技術在宗教資料呈現中具有關鍵作用,主要包括三個維度:地理空間視覺化將宗教場所的分布、朝聖路線和文化景觀以地圖形式呈現;網絡關係視覺化呈現神祇、廟宇、宗派之間的關係網絡;時間軸視覺化展示宗教場所的歷史變遷與發展。數位人文的探索往往能夠協助研究者掌握資料整體的趨勢與圖像,避免「見樹不見林」之弊病。
在道教研究領域,葛思康(Lennert Gesterkamp)曾探討「道教神譜的圖像」,為神譜資料庫的視覺化呈現提供學術基礎。結合前述的 GIS 與 SNA 技術,研究者可以將道教神譜轉化為多維度的可視化成果:以力導向網絡圖(force-directed graph)呈現神祇間的階層與從屬關係;以地理熱力圖展示特定信仰的空間擴散模式;以時間軸串連神格化的歷史過程。工具層面,D3.js 與 ECharts 是開源網頁可視化的主流選擇,Kepler.gl(Uber 開源)適合大規模地理空間分析,TimelineJS 與 StoryMapJS 則為敘事型時空可視化提供了便捷的解決方案。
7. 優勢與局限:量化 vs 質化、技術決定論批判
數位人文方法論在道教研究中的應用,既展現了顯著優勢,也面臨深刻的理論與方法論挑戰。
優勢方面,首先體現在規模與效率:數位人文技術可快速而大量處理具有模式化的文獻,大量節省整理時間。如林敬智研究所示,五年近 1,300 篇開光疏文若透過人工逐一判讀,將耗費相當多的人力與時間,且難以避免人為錯誤。其次,計算方法可識別傳統閱讀難以察覺的模式,如文本分類、主題聚類、空間分布趨勢等。第三,數位人文的「遠讀」能協助研究者掌握資料整體趨勢,避免見樹不見林。第四,GIS、SNA、文本探勘等技術的整合應用,可從多維度分析宗教現象,形成立體化的研究視角。
局限與批判方面,首要議題是量化與質化的張力。Stephen Mahey 在〈Literature Is not Data: Against Digital Humanities〉中主張「文學不是資料。文學是資料的對立面」,認為將文學轉化為資料的過程消除了區分本身、品味、批評的精緻性,以及作品接受的歷史。謝立中(北京大學社會學系)挑戰這種二元思維,指出實證主義不等同於量化研究,人文主義也不專屬於質性研究;量化與質性研究代表不同的模式,而非僵化的典範。
技術決定論的危險同樣值得警惕。過度依賴算法可能導致「技術迷戀」(technophilia),忽視人文研究所需的深度詮釋。Nan Z. Da 在〈The Computational Case against Computational Literary Studies〉中指出計算文學研究在技術、邏輯和概念層面的缺陷,認為文學的複雜性超越了統計工具的能力。後結構主義、解構主義與後現代主義學派批評結構主義忽視人文現象的歷史、多樣性與不確定性;數位人文研究被指責將人文知識量化為可計算、可操作和可比較的實體,未能捕捉人文學科固有的複雜性和特殊性。
此外,資料品質問題不容忽視。OCR(光學字元識別)和分段問題導致數位來源的固有局限性;資料選擇、處理、分析和呈現的缺陷可能導致結果不可靠、不準確、不充分或不相關。Roller(2023)指出數位人文面臨多重假設檢驗的問題:研究者不斷檢驗假設直到找到期望的模式,這容易將隨機模式誤認為真實模式,建議以理論驅動統計學(theory-driven statistics)來減少假設檢驗數量。
宋芬芬(西北民族大學)提出數位人文研究應整合量化與質性研究方法,結合資料分析與人文詮釋;承認數位人文的局限性,避免過度依賴算法,引入多樣化的資料來源、分析方法和表達形式;將資訊處理與知識創造相結合,防止產生無效的研究成果;嚴格評估和管理資料品質,識別和糾正錯誤與偏見。Armand(2023)的主張可作為本節的總結:「未來不是取代,而是將這些方法論必要地整合到人文學者的工具箱中。」傳統詮釋學對於奠定計算分析的基礎是必要的,提供詮釋深度和質性豐富性。
八、技術架構與開源工具鏈
道教數位典藏的技術實現,涉及資料儲存、語義建模、圖像管理、文本處理與知識圖譜建構等多個層面。本章從鏈結開放資料、語義網技術、圖資料庫、圖像標準、典藏平台、自然語言處理到人工智慧應用,系統梳理當前可用的技術方案與工具鏈,並提出道教數位典藏的五層技術架構建議。
1. Linked Open Data(LOD)在文化遺產與宗教資料中的應用
鏈結開放資料(Linked Open Data, LOD)是語義網(Semantic Web)理念的核心實踐,旨在透過標準化的資料格式(RDF)與詞彙(Schema.org、Dublin Core、CIDOC-CRM 等),使分散於不同機構的數位資源能夠相互連結、發現與查詢。知識表達(Knowledge Representation, KR)是運用邏輯語言描述特定領域的科學,使資訊可同時被人類與電腦理解。本體論(Ontology)定義了領域中的「類別」(Classes)與「屬性」(Properties),為知識圖譜提供結構基礎。知識圖譜將資料組織為三元組(主詞-謂詞-受詞),而本體論則以 OWL(Ontology Web Language)撰寫,具備開源、可互操作與可重複使用的特性。
過去二十年間,語義網技術已成為數位人文的核心。核心標準如 RDF、OWL、SKOS 與 SPARQL 被廣泛運用於結構化、連結與查詢跨學科、多語言、多機構的人文資料。在宗教文本領域,以伊斯蘭經注學(Tafsir)為例,SemanticTafsir 專案展示了如何運用鏈結資料原則,將古典文本的詮釋結構(經文、注釋、聖訓、主題標記)進行形式化,並透過 Schema.org、Dublin Core 等既有詞彙確保語義互操作性。該知識圖譜支援 SPARQL 查詢與主題導航,為宗教詮釋傳統的數位保存提供了可複製的管線。
跨機構資料聚合方面,Europeana 專案聚合了歐洲各國文化機構的中繼資料,提供超過 5,000 萬筆歐洲文化與遺產數位化項目;Pelagios 則將古典文本中的地理實體與歷史資訊對齊;芬蘭的 Sampo 框架展示了 OWL 本體論與 RDF 資料在互動式知識平台中的應用。這些專案為道教數位典藏的 LOD 化提供了可資借鑑的範例。
在道教文獻的 LOD 實踐方面,施舟人(Kristofer Schipper)領導的「道藏工程」(Daoist Canon Project)為道教經典的系統性整理與數位化奠定基礎。其與傅飛嵐(Franciscus Verellen)合編的《道藏通考》(The Taoist Canon: A Historical Companion to the Daozang,芝加哥大學出版社,2004,三卷本)系統編目和描述道藏中所有現存文本,按年代排列,附主題分類、傳記索引和參考書目,為後續 LOD 化提供了權威的書目學框架。Chinese Religious Text Authority(CRTA, https://crta.info)則提供道教文獻標準索引,包括道藏等宗教書籍規範索引,是宗教文本 LOD 生態的重要基礎設施。
2. SPARQL 查詢語言與語義網技術
SPARQL(SPARQL Protocol and RDF Query Language)是 W3C 推薦的 RDF 資料查詢語言,可對三元組進行 SELECT、CONSTRUCT、ASK、DESCRIBE 等操作,並支援 OPTIONAL、UNION、MINUS、GRAPH、BIND 等進階模式。在文化遺產領域,SPARQL Endpoint 已成為開放知識圖譜的標準查詢介面,如 Zeri Photo Archive SPARQL Endpoint(https://w3id.org/zericatalog/sparql)。
然而,直接使用 SPARQL Endpoint 查詢人文資料存在若干困難:某些對人文研究特別有用的資料結構(如文本標記、獨立於曆法的歷史日期)在 RDF 標準中缺乏支援;缺乏標準的權限控制與版本管理;大量結果回傳時的可擴展性問題。Gravsearch(Knora API 的一部分)透過在 SPARQL 之上建立抽象層,將虛擬查詢轉譯為底層 Triplestore 的 SPARQL,同時支援權限過濾、結果分頁與版本控制,為人文研究提供更易用的查詢介面。
本體論設計方法論方面,ArCo 知識圖譜(義大利文化遺產領域)採用「極限設計」(eXtreme Design, XD)方法論,從 1.725 億個三元組中提煉出 EDM(Europeana Data Model)與 CIDOC-CRM 對齊的本體論網絡,展示了模式導向(pattern-based)設計在文化遺產本體論建構中的優勢。對於道教數位典藏而言,CIDOC-CRM(ISO 21127)可作為核心本體論框架,結合道教專屬的類別與屬性(如神祇、經典、科儀、法器、壇場等),建構領域本體論。
核心技術標準的對照如下:RDF(資源描述框架)提供三元組資料模型,用於資料交換與知識圖譜建構;OWL(網頁本體語言)支援複雜語義推理,用於本體論設計與類別屬性定義;SKOS(簡單知識組織系統)用於多語言詞彙控制與階層關係表達;SPARQL 用於圖模式查詢與聯合查詢(Federated Query);CIDOC-CRM 則作為博物館、圖書館、檔案館資料語義整合的概念參考模型。
3. 圖資料庫深度比較:Neo4j、Amazon Neptune、ArangoDB
相較於傳統關聯式資料庫,圖資料庫以節點(Nodes)與邊(Edges)儲存資料,原生支援高度互聯資料的快速遍歷(traversal),特別適合神譜關係、宗派傳承、經典引用等道教知識的建模需求。在機構知識圖譜建構中,JSON-LD 被用作序列化格式,結合 Schema.org 詞彙與機構專屬類型,每個實體節點攜帶穩定識別碼、類型與來源追溯欄位(source_system, observed_at, ingested_at),確保事實可溯源。
Neo4j 是目前最廣泛使用的原生圖資料庫(自 2007 年),採用屬性圖模型(Property Graph),查詢語言為 Cypher(最接近 ISO GQL 標準 39075:2024)。Neo4j 具備原生圖儲存引擎,指標無鄰接(index-free adjacency)使其在 OLTP 式遍歷查詢中表現優異,並提供 Graph Data Science(GDS)函式庫支援圖演算法與機器學習。其社群版採用 GPLv3 授權,企業版為商業授權,部署模式包括自建與 Aura(多雲託管)。對於道教神譜知識圖譜而言,Neo4j 的原生圖儲存與 GDS 社群偵測算法(如 Louvain、Label Propagation)尤具價值,可用於識別神祇信仰社群與宗派網絡的集群結構。
Amazon Neptune 是 AWS 全託管圖資料庫,獨特之處在於同時支援屬性圖(openCypher + Gremlin)與 RDF(SPARQL)。Neptune Analytics(2023 GA)與 Neptune ML 提供圖機器學習與大規模分析能力。對於已採用 AWS 生態系且需要 RDF 與屬性圖並存的機構而言,Neptune 是理想選擇。然而,其 AWS-only 的部署限制對於需要本地部署或跨雲策略的道教研究機構可能構成限制。
ArangoDB 是多模型資料庫(Multi-model),同時支援圖、文件與鍵值儲存,查詢語言為 AQL(ArangoDB Query Language)。適合需要圖與文件資料共存、不想維護多套資料庫的應用場景,如同時管理經典全文(文件儲存)與神譜關係(圖儲存)。但在純圖操作效能上略遜於 Neo4j,且其 BSL 1.1 + Community License 的授權模式需要審慎評估。
綜合比較,道教數位典藏的知識圖譜層若偏重圖分析與社群生態探索,Neo4j 為首選;若需 RDF 與屬性圖並存且採用 AWS 雲端架構,Neptune 較為合適;若應用場景需要圖與文件的高度整合且對純圖效能有彈性要求,ArangoDB 可作為折衷方案。
4. JSON-LD 與語義標記(Schema.org 擴充)
JSON-LD(JavaScript Object Notation for Linked Data)是 W3C 於 2014 年標準化的 RDF 序列化語法,以 JSON 格式表達鏈結資料。其最大優勢在於可直接嵌入 HTML 網頁的 <script type="application/ld+json"> 標籤中,無需改變現有 HTML 結構,即可讓搜尋引擎與機器讀取結構化中繼資料。對於道教數位典藏平台而言,這意味著每個經典條目、神祇頁面或儀式文本均可攜帶機器可讀的語義標記,提升跨平台發現率與搜尋引擎的能見度(rich snippets)。
Schema.org 是由 Google、Bing、Yandex 等主流搜尋引擎於 2011 年發起的結構化詞彙集,為 W3C 倡議。在文化遺產領域,除了核心詞彙外,尚有 BiblioGraph.net(圖書與文化資源)、Architypes(檔案典藏)、Schema.org Bibliographic Extension 等擴充,可更精確描述藝術品、手稿、建築與檔案的特徵。以道教圖像典藏為例,一幅「明代太上老君像」的 JSON-LD 標記可包含:CreativeWork 與 VisualArtwork 類型、畫作標題、高解析度圖像 URL、描述文字、媒材(絹本設色)、創作年代、創作者資訊,並透過 sameAs 屬性連結至 Wikidata 實體,實現跨知識庫的語義對齊。
動態語義標記管線的建構亦為可行:以 Django 模板為例,博物館可於資料庫中錄入藏品資訊後,由模板自動生成 JSON-LD 腳本,將畫作標題、創作日期、媒材、藝術家傳記等轉為機器可讀格式。這不僅提升搜尋引擎的能見度,更促進跨機構資料的互操作與聚合。對於 lius.cc 這類具有 105,158 筆節點的大型資料庫,導入 JSON-LD 語義標記可顯著提升資料在開放網路中的可發現性與語義連結能力。
5. IIIF 在宗教圖像典藏中的應用
國際圖像互操作框架(International Image Interoperability Framework, IIIF)是一組開放標準 API,旨在解決文化機構數位圖像「系統隔離、介面不一、難以比較」的問題。其最大創新在於將焦點從「圖像檔案」轉移至「Manifest」——一份以 JSON 撰寫的結構化文件,描述數位物件的內容、結構與中繼資料,並透過持久 URL 引用圖像。
IIIF 包含五項核心 API:Image API 支援動態請求不同尺寸、格式、區域的圖像,適用於高解析度經卷、壁畫、法器細節的線上檢視;Presentation API 描述數位物件結構與序列(Manifest),可用於表達道藏經書多卷本結構或儀式文本順序;Search API 支援圖像內文字的全文檢索,適用於 OCR 後的科儀經本全文搜尋;Annotation API 支援圖像上的註釋、標記與分享,可用於神譜圖像的神名標註或儀式空間註解。
研究者可在單一檢視器(如 Mirador、Universal Viewer)中並置不同機構的宗教手稿或繪畫,例如同時開啟巴黎國家圖書館與根特大學圖書館的 IIIF Manifest,進行跨館比較研究。IIIF 支援高解析度圖像的即時傳輸、縮放、旋轉、區域裁切,以及註釋功能——研究者可在圖像上標記、轉錄文字或繪製區域,並分享發現。與數位典藏平台的整合方面,Omeka S、Islandora、Digital Bodleian 等平台均已原生支援 IIIF,FromThePage 轉錄平台與 Recogito 協作標註平台亦能載入並處理 IIIF 物件。對於道教數位典藏而言,IIIF 特別適用於道教神仙圖卷、科儀抄本、法器攝影、壇場紀錄等圖像資源的跨機構比較與協作研究。
6. 開源數位典藏平台比較
開源數位典藏平台可大致分為三類:機構典藏庫(Repository)如 DSpace、Fedora,側重學術產出與數位資產的長期保存;內容管理與網站發布如 Omeka,側重策展敘事與公眾展示;博物館與檔案館專業系統如 CollectiveAccess、ArchivesSpace,側重豐富的中繼資料建模與館藏管理。
Omeka S 由喬治梅森大學 Roy Rosenzweig Center for History and New Media 開發,定位為「介於通用內容管理系統(WordPress/Drupal)與專業典藏庫(DSpace/Fedora)之間」的解決方案。Omeka S 特別強化鏈結資料支援,允許使用者從任意 RDF 詞彙建立自訂中繼資料綱要,並透過模組化架構整合 IIIF、索引服務與外部資料源。其多站點(multi-site)架構使同一安裝可服務多個數位展覽。對於中小型道教數位典藏計畫、博物館與教育者而言,Omeka S 是最具彈性與易用性的選擇。
DSpace 由 MIT 與 HP 聯合開發,支援 OAI-PMH、DOI/Handle、版本控制與提交流程,廣泛用於大學與研究機構的學術產出典藏。其中繼資料以 Dublin Core 為主,IIIF 支援有限,鏈結資料能力亦較為有限。適合需要嚴格學術典藏流程的大學道教研究中心。
Fedora(Flexible Extensible Digital Object Repository Architecture)是支援鏈結資料與彈性內容建模的後端平台,本身不提供前端展示,需搭配自定義前端或 Islandora/Samvera 使用。適合具備技術團隊、需要高度客製化內容建模的機構。
Islandora 結合 Fedora 與 Drupal 前端,提供 CMS 導向的數位典藏與展示,原生支援 IIIF 與鏈結資料。適合需要內容管理系統功能的圖書館與博物館。
CollectiveAccess 專為博物館與檔案館設計,具備高度彈性的資料建模、控制詞彙管理與強大的匯入/對映工具,適合需要深度客製化中繼資料的機構,但 IIIF 與鏈結資料支援相對有限。
綜合評估,道教數位典藏平台選型應考量計畫規模、技術能力與功能需求:中小型計畫優先考慮 Omeka S;需要嚴格學術典藏流程者選 DSpace;具備技術團隊且需高度客製化者選 Fedora + Islandora;深度博物館編目需求者選 CollectiveAccess。
7. NLP 在古典漢語文本處理中的應用
古典漢語 NLP 面臨的核心挑戰包括:文本缺乏現代標點與自然詞邊界,存在大量異體字、通假字與語法變化。傳統方法(如 Jieba、spaCy)依賴詞典匹配與隱藏馬可夫模型,面對歷史文獻時難以處理未登錄詞(out-of-vocabulary terms)。近年預訓練語言模型的崛起,為古典漢語文本處理帶來了突破性進展。
GujiBERT 利用大規模未標記古典漢語語料進行遮罩預訓練(masked pre-training),為下游任務提供編碼古典漢語知識的嵌入表示。該模型在古典漢語的句讀標註、命名實體識別等任務上表現優於通用中文模型。
SikuGPT 以大規模古典漢語語料進行生成式預訓練,展現了生成式模型在古典詩文創作上的潛力,為道教經典文本的生成式理解與補全提供了技術基礎。
Xunzi(荀子)系列模型 由南京農業大學開發,專為古典文本智慧處理設計,在標點標註、實體標記、文本翻譯等任務上表現突出。該系列模型已被用於為《算經十書》等無標點文本自動添加句讀。Xunzi-Qwen-7B 在古典漢語標點任務上 F1 分數約達 78.62。
TongGu-7B 是首個專為「古典漢語理解」(Classical Chinese Understanding, CCU)設計的垂直領域大模型,基於 Baichuan2-7B-Base,在 24.1 億字古典漢語語料上進行增量預訓練,並以 400 萬條指令資料微調。其創新技術包括 Redundancy-Aware Tuning(RAT),緩解災難性遺忘;以及 CCU-RAG(檢索增強生成),顯著提升知識密集型任務效能。TongGu-7B 在 C3bench(涵蓋分類、檢索、NER、標點、翻譯五項任務)上大幅超越既有模型,古典漢語標點 F1 達約 89.97,NER F1 達約 73.46,知識檢索能力顯著優於通用 LLM。
專用基準與評測方面,EvaHan2024(LT4HALA @ LREC-COLING-2024)是首個針對古典漢語自動斷句與標點的國際評測。結果顯示,大語言模型(LLM)已超越傳統模型,但在未見過的文本上效能下降約 10%,且存在約 1-2% 的過度生成(over-generation)導致原文改變的問題,需要後處理校正。歷史文獻的 NER 與詞性標註研究亦指出,神經網路方法雖有進步,但在歷史材料上的精確度仍落後於當代文本;領域專屬的資料集建構與微調(fine-tuning)是提升效能的關鍵。
對於道教數位典藏而言,這些 NLP 技術可直接應用於《道藏》經文、敦煌道經寫本、明清科儀抄本等無標點或低品質 OCR 文本的自動標點、神名與地名實體識別、經文分類與主題標註,大幅降低數位文本前期處理的人力成本。
8. AI/LLM 在宗教文本數位化中的最新應用
通用 LLM(如 GPT-4、Claude)雖在廣泛 NLP 任務上表現卓越,但在古典漢語等低資源(low-resource)領域仍有不足。宗教文本的數位化更面臨特殊挑戰:文本破損、異體字密集、專業術語眾多、詮釋傳統複雜。針對科普特語(Coptic)宗教文本的研究顯示,專門訓練的翻譯模型與 Claude Opus 在翻譯品質上表現最佳,而 GPT 與 Gemini 家族在面對破損嚴重的文本時容易產生「幻覺」(hallucination),輸出與原文無關的聖經引文。這凸顯了領域專屬模型對於宗教文本數位化的重要性。
系統性文獻回顧指出,AI 與語言技術正重塑宗教實踐,包括跨語言傳播、自動化經文詮釋、以及宗教聊天機器人的興起。然而,LLM 在生成宗教內容時存在誤引文本、誤用教義的風險,需要領域專家進行評估與驗證。Chandra 等人(2024)運用 LLM 進行《薄伽梵歌》與《登山寶訓》的隱喻檢測,展示了 LLM 在宗教文學分析中的潛力,但也強調了人工校驗的必要性。
多模態知識圖譜擴展方面,WJoconde 專案針對法國文化遺產建構了多模態知識圖譜,結合 LLM 與視覺語言模型(VLM),從文本描述與圖像中自動抽取新實體,驗證了 LLM 在開放世界假設(Open World Assumption)下進行知識圖譜補全(KGC)的潛力。對於道教數位典藏,這意味著未來可以結合 LLM 與道教神仙圖像,自動識別圖像中的神祇、法器與壇場元素,並將其補全至知識圖譜中。
Barnes 等人(2024)的研究指出,AI 系統的文化依賴性回應已成為重要議題——不同文化背景的使用者對 AI 生成的宗教內容可能有截然不同的接受度與詮釋方式。這對道教數位典藏的國際化與多語言鏈接提出了額外的倫理與技術挑戰。
9. 道教數位典藏五層技術架構建議
基於上述技術比較與道教研究的特殊需求,本文提出「道教數位典藏五層技術架構」建議,從底層資料儲存到頂層知識圖譜,形成完整的技術棧:
資料層:以 Fedora 或 DSpace 作為後端典藏庫,支援 RDF 與長期保存(OAIS 標準);以 Omeka S 作為前端展示與策展平台,整合 IIIF 與鏈結資料模組。對於 lius.cc 等既有平台,可逐步導出 Node 資料為 RDF/JSON-LD 格式,與後端典藏庫對接。
語義層:採用 CIDOC-CRM 作為核心本體論,結合自建的道教神譜本體論(參考卿希泰《中國道教史》、蕭登福《六朝道教上清派研究》、呂鵬志《唐前道教儀式史綱》的領域知識);以 JSON-LD 序列化中繼資料,嵌入 Schema.org 與自訂詞彙;透過 SPARQL Endpoint(如 Apache Jena Fuseki、Virtuoso 或 Trigo)提供查詢服務;引入 Gravsearch 抽象層簡化人文學者的查詢操作。
圖像層:宗教圖像、經卷、法器照片以 IIIF 標準發布,使用 Mirador 或 Universal Viewer 提供跨機構比較與註釋。對於 lius.cc 中大量的經典與儀式文獻,可逐步將掃描影像轉為 IIIF Manifest,提升圖像資源的互操作性。
文本處理層:未標點道教經典(如敦煌寫本、明清科儀本)以 TongGu-7B 或 Xunzi-LLM 進行自動標點與 NER;以人工校正確保品質,建構高品質訓練語料。對於科儀文本的模式化欄位(如疏文中的地址、神名、日期),可運用 Python 正規表示式進行結構化擷取,輔以 LLM 進行語義理解。
知識圖譜層:以 Neo4j(若偏重圖分析與社群生態)或 Amazon Neptune(若需 RDF+屬性圖並存且採用 AWS)作為圖資料庫;將神祇、經典、儀式、法器、地域等實體與關係建模為知識圖譜,支援 Cypher 或 SPARQL 查詢。對於 lius.cc 現有 105,158 筆節點,可將 concept、deity、location、ritual、scripture、sect 等類型轉為知識圖譜中的節點類型,建立「經典—神祇—科儀」三元關係網絡。
此五層架構的核心理念在於:每一層既可獨立運作,又能透過標準介面(如 SPARQL、IIIF、JSON-LD)與其他層級及外部系統互操作。這種「分層解耦、語義互聯」的設計,使道教數位典藏能夠在保持技術彈性的同時,逐步累積語義資本與知識網絡。
九、結論與後續研究建議
1. 本文核心發現總結
本報告系統梳理了道教數位典藏的方法論框架、技術工具與實踐案例,從經典標記、神譜資料庫與儀式文本知識圖譜三個核心面向,提出了一套可操作的數位人文方法論體系。綜合前八章的討論,本文的核心發現可歸納為以下三點:
第一,道教文本的「模式化」特質為數位人文方法提供了天然的應用場域。 相較於一般文學文本的開放性與歧義性,道教科儀文書——尤其是疏文、榜文、符命等儀式文書——具有高度的結構化與模式化傾向。林敬智對府城延陵道壇近 1,300 篇開光疏文的文本探勘案例充分證明,運用正規表示式與 Python 程式即可從這類文本中自動擷取信徒地址、分靈祖廟、開光神明、儀式日期等結構化資訊,並結合 GIS 與社會網絡分析揭示傳統閱讀難以發現的時空模式與信仰網絡。這一發現對於《道藏》中大量科儀文獻的批量數位化處理具有直接的啟示意義。
第二,語義網與知識圖譜技術為道教知識的結構化組織提供了先進的技術底座。 從 Linked Open Data、SPARQL、圖資料庫到 JSON-LD 與 IIIF,當代語義技術已發展到足以支撐宗教文本的「概念級」與「關係級」語義建模。相較於佛教數位典藏已建立的成熟 TEI/XML 標記標準與多語言對照機制(如 CBETA、BuddhaNexus),道教文本在語義標記、校勘編碼、知識圖譜化方面仍有很大發展空間,但這同時也意味著道教數位典藏具有「後發優勢」——可以直接借鑑佛典與聖經數位化的成熟經驗,跳過部分探索階段,建構更為先進的語義基礎設施。
第三,AI 與大語言模型的發展為道教文本的智能化處理開闢了新路徑,但必須以領域知識為錨點。 TongGu-7B、Xunzi-LLM 等專為古典漢語設計的垂直領域模型,在自動標點、命名實體識別與知識檢索等任務上已展現出超越通用 LLM 的顯著優勢。然而,宗教文本的數位化不能僅依賴技術工具,更需要道教學者的領域知識參與——無論是訓練語料的品質控制、模型輸出的校正審核,還是數位版本的學術可信度評估,均需要人文學者的深度介入。
2. 經典標記、神譜資料庫、儀式知識圖譜三位一體方法論的整合價值
本報告提出的「經典標記—神譜資料庫—儀式知識圖譜」三位一體方法論,並非三個獨立模組的簡單拼貼,而是一個有機整合的知識生態系統。其整合價值體現在以下幾個層面:
在知識表示層面,經典標記(以 TEI/XML 為核心)回答「文本是什麼」的問題——它將道教經典的結構(卷、品、章、段)、語義(神名、地名、儀式步驟)、版本(異文、校勘)與詮釋(注釋、疏文)進行形式化編碼;神譜資料庫回答「神祇是誰」的問題——它系統記錄神祇的名號、屬性、源流、職司、圖像與信仰分布;儀式知識圖譜則回答「儀式如何運作」的問題——它將儀式文本、儀式程序、儀式空間、參與者與神聖時間建模為可查詢、可推理的語義網絡。三者結合,方可回答「在特定時空脈絡中,誰以何種經文、向哪位神祇、進行何種儀式」這一綜合性學術問題。
在技術互操作層面,TEI 標記的命名實體(named entity)可直接輸出為神譜資料庫的條目,神譜資料庫的 RDF 三元組可與儀式知識圖譜的本體論對齊,儀式知識圖譜的 SPARQL 查詢結果可反向驅動經典標記的檢視介面。這種「標記→資料庫→圖譜→查詢→檢視」的閉環,構成了道教數位典藏的完整技術管線。
在學術研究層面,三位一體方法論使研究者能夠進行傳統文獻學難以實現的跨文本、跨神譜、跨儀式比較分析。例如,研究者可以查詢「宋代以後所有提及『北極四聖』的科儀文本」,並進一步追蹤這些文本中四聖的神名變化、法器配置與壇場方位,從而揭示北帝信仰在儀式實踐層面的歷史演變。這種「結構化查詢 + 語義推理 + 可視化呈現」的研究範式,是數位人文賦予道教研究的核心方法論創新。
3. 對 lius.cc 等平台發展的啟示
lius.cc(鼎稔道學館)作為道教學術知識平台,目前已累積 105,158 筆節點,涵蓋 concept(30,606 筆)、deity(13,587 筆)、location(9,739 筆)、paper(8,385 筆)、person(5,501 筆)、ritual(11,935 筆)、scripture(24,032 筆)、sect(1,278 筆)與 custom(95 筆)等九種類型。這一規模在華語道教學術資料庫中已屬前列,為數位典藏的深化發展提供了堅實的素材基礎。
然而,從本文的方法論視角審視,lius.cc 的現有架構仍存在若干可強化的方向:
結構化標記的空白。目前「經文標記」作為關鍵詞在資料庫中尚無命中(0 筆),「標記」僅 167 筆且多為曆法標記或科儀標識,而非文本結構標記(如 TEI/XML 語意標記)。現有條目以「摘要式百科條目」為主,尚未見到以結構化標記語言對經文進行分段、分章、分品、語意註解的數位文本。未來可以《雲笈七籤》《靈寶五符序》等已有旗艦報告的經典為試點,探索 TEI 標記框架在道教經典中的應用。
知識圖譜的潛力。「知識圖譜」關鍵詞僅 1 筆命中(scripture:仙苑編珠),顯示 RDF、本體論、語意網路等技術方法尚未進入資料庫的知識架構。然而,現有 13,587 筆 deity 節點與 24,032 筆 scripture 節點之間存在大量隱含的引用與從屬關係,11,935 筆 ritual 節點與 scripture 節點之間也存在「經—科—儀」的複雜對應。將這些關係顯式建模為 RDF 三元組,即可在既有資料基礎上快速建構道教知識圖譜原型。
跨節點關聯的強化。現有條目多以「單一節點」為單位,節點與節點之間的結構化關聯(如「經典—神祇—科儀」三元關係)尚未以數位化方式呈現。以北帝信仰為例,lius.cc 中已有大量關於北極真武大帝的 deity 條目、相關 scripture 條目(如《北極真武玄天上帝聖蹟圖說》《北極四聖降臨儀》等)以及 ritual 條目,但這些條目之間的語義關聯仍需研究者自行拼合。透過知識圖譜技術將這些關聯顯式化,將顯著提升平台的學術研究價值。
綜合而言,lius.cc 的 105,158 筆節點已構成一座「數位礦藏」,其價值的充分釋放,有賴於從「條目式百科」向「關係式知識圖譜」的方法論升級。
4. 未來研究方向
基於本文的方法論討論與現有平台的技術評估,未來道教數位典藏研究可在以下五個方向深化拓展:
(1)道教專用 TEI ODD 的開發。 TEI(Text Encoding Initiative)雖已成為人文文本數位化的事實標準,但其原設計以西方古典文獻與聖經研究為主要對象,對於道教文本的特殊結構——如「三洞四輔」的分類體系、科儀文本的「步驟—咒語—符號」交替結構、經文內的存思圖像描述等——缺乏針對性的標記元素。CBETA 在佛教文本數位化過程中已發展出漢籍專屬的標記擴展,道教領域亟需類似的專用 ODD(One Document Does it all)規範,以確保道教經典標記的互操作性與標準化。建議由道教學者、數位人文專家與圖書資訊學者組成跨領域工作小組,參考 CBETA 的經驗與《道藏通考》的目錄學框架,制定「道教文本編碼倡議」(TEI for Daoist Texts, TEI-DT)。
(2)跨教派儀式比較的數位方法。 道教內部宗派林立,同一類儀式(如開光、安龍奠土、北斗燈儀)在不同道派、不同地域的實踐中存在顯著差異。傳統的比較研究依賴學者的個人閱讀與記憶,難以處理大規模文本的系統性比較。數位方法為此提供了新的可能:將不同道派的科儀文本進行 TEI 標記後,運用文本相似度算法(如文本重合度分析、版本譜系學算法)自動識別儀式步驟的共性與變異,並以可視化方式呈現各派儀式的「結構親緣關係」。這種「計算儀式學」(Computational Ritual Studies)將為道教宗派研究開闢全新的方法論路徑。
(3)多語言鏈接與 LOD 生態建構。 道教研究本質上是國際化的學術領域,涉及中文、日文、英文、法文、德文等多語言文獻。目前各國的道教數位資源大多處於「資料孤島」狀態,缺乏統一的語義標準與鏈結機制。未來應推動道教數位資源的 LOD 化,以 Wikidata、CRTA、中研院 Linked Data 平台為錨點,將各機構的道教資料集(神祇、經典、學者、機構)對齊至共享的 URI 空間,建構「全球道教鏈結開放資料雲」(Global Daoist Linked Open Data Cloud)。這不僅能提升資料的跨語言發現率,更能支援跨國、跨機構的協作研究。
(4)AI 輔助標記與自動化知識抽取。 隨著 TongGu-7B、Xunzi-LLM 等古典漢語專用模型的成熟,道教文本的自動化處理已具備技術可行性。未來研究可聚焦於以下任務:以 LLM 進行《道藏》經文的自動標點與斷句;以 NER 模型自動識別經文中的神名、地名、法器名、儀式步驟名;以關係抽取模型自動建構「神祇—經典—儀式」三元組;以圖像識別模型自動標註道教神仙圖像中的神格與法器。這些技術的導入將大幅降低數位典藏的人力成本,但同時需要建立嚴格的品質控制機制與人工校正流程,確保 AI 輸出的學術可信度。
(5)活態儀式動態對應與即時數位典藏。 現有的道教數位典藏多以「靜態文獻」為對象,對於活態儀式的數位記錄與即時分析相對薄弱。未來可結合行動裝置、可穿戴感測器與即時串流技術,建構「活態儀式數位典藏系統」:在儀式進行過程中,系統即時記錄儀式程序、誦經內容、壇場空間配置、參與者行動軌跡,並將其與預先建構的「儀式知識圖譜」進行動態對應,實現「儀式進行到哪一步,系統即時顯示對應的經文、神祇與歷史背景」。這種「活態對應」不僅具有學術研究價值,也能作為道教文化傳播與教育的新型媒介。
5. 學術倫理反思:無據不寫、不編造引用、數位版本的可信度
數位人文技術的強大能力也帶來了相應的倫理挑戰,道教數位典藏研究必須對此保持高度自覺。
無據不寫,不編造引用。 數位工具的便捷性可能誘使研究者過度依賴自動生成的數據與分析結果,忽視對原始文獻的仔細核實。道教研究涉及大量珍稀文獻、田野調查資料與口傳傳統,任何數位分析結果都必須能夠回溯至可驗證的原始來源。本文所有引用均標註出處,凡涉及具體數據(如 lius.cc 的節點統計、各種模型的效能指標)均註明資料來源與查詢時間,以確保研究的可複製性與可核實性。
數位版本的可信度。 數位文獻學的一個核心理論挑戰在於:如何使數位版本被學術界認可為「獨立的批判性版本」。即便最先進的數位版本(如 CBETA),學界通常仍引用其紙本原始出處。道教數位典藏平台在發布數位文本時,應明確標示數位化流程(OCR 引擎、校正者、版本來源)、文本狀態(草稿、審閱中、已發布)以及與紙本原典的對應關係,並建立版本控制與修訂歷史,使數位文本具備學術引用所需的透明度與可追溯性。
技術的謙遜。 數位人文方法能夠揭示傳統閱讀難以發現的模式,但它不能取代人文學者的詮釋能力與批判性思維。正如宋芬芬所強調,數位人文研究應承認自身的局限性,避免過度依賴算法,將資訊處理與知識創造相結合。道教數位典藏的最終目的不是用技術取代學者,而是為學者提供更強大的工具,使其能夠提出更深刻的問題,給出更豐富的回答。
參考文獻
Alcaraz-Martínez, Rubén. "The Use of the Omeka Semantic Platform for the Development of the University of Belgrade Digital Repository." ResearchGate, 2021. https://www.researchgate.net/publication/349130769.
Althage, Melanie. "Topic Modeling." In Compendium of Computational Theology Vol.1: Introducing Digital Humanities to Theology, 2023.
Armand, Colin. "Beyond Digital Humanities: Thinking Computationally." 2023. https://shs.hal.science/halshs-04194570/document.
Bamman, David, et al. "A Comparative Analysis of Word Segmentation, POS Tagging, and NER for Historical Chinese Sources, 1900-1950." arXiv:2503.19844, 2024.
Barnes, A. J., et al. "AI and Culture: Culturally Dependent Responses to AI Systems." Current Opinion in Psychology, 2024.
Bingenheimer, Marcus. "Digitization of Buddhism." Oxford Bibliographies, 2020. https://mbingenheimer.net/publications/bingenheimer.2020.oxford-bib-digitizationOfBuddhism.pdf.
Blei, David M., Andrew Y. Ng, and Michael I. Jordan. "Latent Dirichlet Allocation." Journal of Machine Learning Research 3 (2003): 993-1022.
Carroll, J. J., et al. "Named Graphs, Provenance and Trust." In Proceedings of the 14th International Conference on World Wide Web, 2005, pp. 613-622.
Cao, J., et al. "TongGu: Mastering Classical Chinese Understanding with Knowledge-Grounded Large Language Models." Findings of EMNLP, 2024. https://aclanthology.org/2024.findings-emnlp.243.pdf.
Chandra, R., et al. "Large Language Models for Metaphor Detection: Bhagavad Gita and Sermon on the Mount." IEEE Access, 2024. doi: 10.1109/ACCESS.2024.3411060.
Chang, B., et al. "SikuGPT: Generative Pre-training for Classical Chinese." 2023.
Chen Zhang. "Religious Theory, Digital Humanity, Trend Exploration, Digital Mining Technology." SSCE 2022 Proceedings. https://webofproceedings.org/proceedings_series/ESSP/SSCE%202022/SS57.pdf.
Clement, Tanya E. "Where Is Methodology in Digital Humanities?" Debates in the Digital Humanities, 2016. https://dhdebates.gc.cuny.edu/read/untitled/section/cfa5a92d-0d35-4e3d-b632-85644039cb1c.
Daquino, Marilena, et al. "Enhancing Semantic Expressivity in the Cultural Heritage Domain: Exposing the Zeri Photo Archive as Linked Open Data." Semantic Web Journal, 2017. https://arxiv.org/pdf/1605.01188.
Dean, Kenneth. "Digital Humanities Approaches to the Study of Chinese Communities in Malaysia: Introducing the Malaysian Historical GIS (MHGIS)." Journal of the Malaysian Chinese Studies Centre 28 (2022): 1-45.
Dean, Kenneth, Guan Thye Hue, Ruo Lin, et al. "The Malaysian Historical Geographical Information System (MHGIS): The Case of Chinese Temples in Johor." Religions 14, 336 (2023).
Dean, Kenneth, and Zheng Zhenman. Ritual Alliances of the Putian Plains. Vol.1: Historical Introduction to the Return of the Gods; Vol.2: A Survey of Village Temples and Ritual Activities. Leiden: Brill, 2010.
Dean, Kenneth, et al. "Chinese Temple Networks in Southeast Asia: A Web-GIS Digital Humanities Platform for the Collaborative Study of the Chinese Diaspora in Southeast Asia." Religions (2020): 1-23.
Doerr, Martin. "The CIDOC Conceptual Reference Model (CRM): A Standard for the Integration of Cultural Information." Proceedings of the Conference on Information Technology and Communications, 2003.
Ehrmann, Maud, et al. Cited in: "A Comparative Analysis of Word Segmentation, POS Tagging, and NER for Historical Chinese Sources, 1900-1950." arXiv:2503.19844, 2024.
Fabrizio Pregadio, ed. Encyclopedia of Taoism. New York: Routledge, 2008.
Gesterkamp, Lennert. 〈道教神譜的圖像〉,《大道季刊》56 期(2009),頁 11-15.
Hanneken, Todd R. "International Image Interoperability Framework (IIIF)." In The Textual History of the Bible, Vol. 3. Leiden: Brill, 2019.
Hauwaerts, Evelien. "What is IIIF?" Mmmonk Project, 2021. https://www.mmmonk.be/en/about-iiif/wat-is-iiif.
Hoover, Stewart M., and Helen Rose Ebaugh. "Religion and Digital Religion." In The Oxford Handbook of Religion and American Politics, 2016.
Huimin Bhikkhu, Tu Aming, Zhou Bangxin, and Wang Zhipan. "Techniques for Collating Multiple Text Versions in the Digitization of Classical Texts: The CBETA Taishō Buddhist Canon as an Example." Chung-Hwa Buddhist Journal 18 (2005): 299-325.
Hyvönen, Eero, et al. "Publishing and Using Cultural Heritage Linked Data on the Semantic Web." In Semantic Computing Research Group (SeCo). Helsinki: Aalto University, 2014.
Kannran, A. B., et al. "SemanticHadith: An Ontology-Driven Knowledge Graph for the Hadith Corpus." Journal of Web Semantics 78 (2023): 100797.
Li, B., et al. "Overview of EvaHan2024: The First International Evaluation on Ancient Chinese Sentence Segmentation and Punctuation." In Proceedings of LT4HALA @ LREC-COLING-2024. https://aclanthology.org/volumes/2024.lt4hala-1/.
Michel, Jean-Baptiste, et al. "Quantitative Analysis of Culture Using Millions of Digitized Books." Science 331, no. 6014 (2011): 176-182.
Morris, James Harry, and I. Digital Humanities and Religions in Asia: An Introduction. The Digital Orientalist, 2023. https://digitalorientalist.com/2023/12/22/digital-humanities-and-religions-in-asia-an-introduction/.
Munibi, A. Z. "Faith in the Digital Era: How Language and Artificial Intelligence Technology Reshape Religious Practices." SMART Journal, 2025. https://journal.blasemarang.id/index.php/smart/article/view/2906.
NARRATE Project. "GIS in Religious Heritage." NARRATE Literature Review, June 2023. https://narrateproject.eu/media/deliverables/WP2_R2.1_NARRATE_Literature%20review%20_v1_June23.pdf.
Pastor-Sanchez, J., et al. "Greek Mythology as a Knowledge Graph: From Chaos to Zeus and Beyond." Semantic Web Journal (2021). https://www.semantic-web-journal.net/system/files/swj3884.pdf.
Polak, Alexander, and Eric Morgan. "A Comparative Analysis of Word Segmentation, POS Tagging, and NER for Historical Chinese Sources, 1900-1950." arXiv:2503.19844, 2024.
Roller, R. "Theory-Driven Statistics for the Digital Humanities." Journal of Cultural Analytics (2023). https://culturalanalytics.org/article/id/1297/.
Saorín, T. 引於 García Amen, Fernando. Folders 02_FADU. 烏拉圭共和國大學, 2011.
Schipper, Kristofer. Concordance du Tao-tsang: Titres des ouvrages. Paris: EFEO, 1975.
Schipper, Kristofer, and Franciscus Verellen, eds. The Taoist Canon: A Historical Companion to the Daozang. Chicago: University of Chicago Press, 2004.
SemanticTafsir Team. "SemanticTafsir: Building a Cultural Heritage Ontology and Knowledge Graph from the Quranic Exegesis of al-Tabari." Semantic Web Journal, 2024. https://www.semantic-web-journal.net/system/files/swj3884.pdf.
Smarason, B. "Building an Institutional Knowledge Graph with Neo4j." Smarason Blog, 2026. https://smarason.is/en/blog/building-institutional-knowledge-graph-neo4j.
Song, Fenfen. "Exploring and Rethinking Digital Humanities." SHS Web of Conferences, 2024. https://www.shs-conferences.org/articles/shsconf/pdf/2024/10/shsconf_edss2024_02022.pdf.
Stanley-Baker, Michael. "Daoism and Digital Humanities: A Bibliographic Review." 2019.
Stanley-Baker, Michael. "Materia Medica in Chinese Religious Sources: Towards A Critical Digital Philology for Modelling Knowledge Distribution in Early Chinese Texts." 2019 Pacific Neighborhood Consortium Annual Conference. https://www.researchgate.net/publication/338065561.
Stanley-Baker, Michael, and Chong Underwood. "Daoism and Digital Humanities." 2019.
Sundararajan, K., et al. "Text Mining of Daoist Canon." 2020.
Wang, X., and Li, Z. "Two Sequence Labeling Approaches to Sentence Segmentation and Punctuation Prediction for Classic Chinese Texts." LT4HALA 2024.
Wang, Y., et al. "GujiBERT: A Pre-trained Model for Classical Chinese." 2023.
Wannaz, A. C., et al. "Assessing Large Language Models in Translating Coptic Texts." NLP4DH @ ACL, 2024. https://aclanthology.org/2024.nlp4dh-1.44.pdf.
Wu, T., et al. "KG-Buddhism: The Chinese Knowledge Graph on Buddhism." JIST 2017 Proceedings. Springer, 2017, pp. 259-267.
Yan Yingwei, Kenneth Dean, et al. "Chinese Temple Networks in Southeast Asia: A Web-GIS Digital Humanities Platform for the Collaborative Study of the Chinese Diaspora in Southeast Asia." Religions (2020): 1-23.
Yang, C. K., et al. "Digital Methods in Chinese Religious Studies." 2015.
Zeri Photo Archive SPARQL Endpoint. https://w3id.org/zericatalog/sparql.
「近年來我國道教發展狀況的數據分析。」中國社會科學院世界宗教研究所. http://iwr.cass.cn/yjly/djyj/lw/202301/W020230104624938128219.pdf.
〈網絡分析在數字人文中的應用框架〉,《圖書情報工作》。https://www.lis.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=24850.
伊吹敦。〈透過特定用語考察重構《金剛經解義》版本〉。
北京愛如生「道教經典庫」。http://er07.com/home/pro_156.html.
釋惠敏等,〈簡介 Metadata 於佛教電子文獻的應用〉,《中華電子佛典協會新聞電子報》第 6 期(1999-10-25)。https://www.gaya.org.tw/journal/m32/32-main3.htm.
石井公成。〈利用 NGSM 方法考察《起信論》用語與菩提流支、勒那摩提譯本的相似性〉。
張繼禹等主編。《中華道藏》。北京:華夏出版社,2004(49 冊)。
張陽,〈數字人文宗教學視閾下的道教問題探析〉。https://www.dhcn.cn/wp-content/uploads/2023/05/Shu_Zi_Ren_Wen_Zong_Jiao_Xue_Shi_Yu_Xia_De_Dao_Jiao_Wen_Ti_Tan_Xi_Zhang_Yang.pdf.
張超然,〈早期道教喪葬儀式的形成〉,《輔仁宗教研究》20(2010 年春),頁 27-66。
張超然,〈專醮酬恩:近代道教為民間信仰所提供的儀式服務〉,收入侯沖主編,《經典、儀式與民間信仰》(上海:上海古籍出版社,2018),頁 259-293。
張超然,〈道法整合的藍圖:《太上天壇玉格》研究〉,《華人宗教研究》20(2022.7),頁 1-37。
康豹(Paul R. Katz)。〈道教與地方信仰——以溫元帥信仰為例〉,《從地獄到仙境:漢人民間信仰的多元面貌:康豹自選集》(臺北:博揚文化,2009),頁 19-50。
教育部,《詮釋資料格式(Metadata)規範》(2000-07-11)。https://edu.law.moe.gov.tw/LawContent.aspx?id=GL000029.
李豐楙,〈仙詩、仙歌與頌贊靈章——《道藏》中六朝詩歌史料及其研究緒論〉,《憂與遊:六朝隋唐仙道文學》(北京:中華書局,2010)。
李豐楙。《仙境與遊歷:神仙世界的想像》。北京:中華書局,2010.
林敬智,〈道教開光儀式疏文之文本探勘與數位人文探索:以府城延陵道壇為例〉,《圖資與檔案學刊》第 12 卷第 2 期(2020 年 12 月),頁 45-70. DOI: 10.6575/JILA.202012_(97).0002. https://jila.lib.nccu.edu.tw/wp-content/uploads/2021/03/97-02.pdf.
林富士主編,《「數位人文學」白皮書》。臺北:中央研究院數位文化中心,2017. ISBN: 9789860542394.
林富士總策畫、曹銘宗撰稿,《遠見與承擔:中央研究院數位人文發展史(1984-2015)》。臺北:中央研究院數位文化中心,2017.
林富士,〈「數位人文學」概論〉,收入林富士主編,《「數位人文學」白皮書》(臺北:中央研究院數位文化中心,2017),頁 1-36.
林富士,〈「祝由」醫學與道教的關係——以《聖濟總錄.符禁門》為主的討論〉,收入康豹、劉淑芬主編,《第四屆國際漢學會議論文集.信仰、實踐與文化調適》(臺北:中央研究院,2013),下冊,頁 403-448.
法鼓文理學院,〈佛典數位化與研究工具〉。https://sp.dila.edu.tw/magazine/downloadfile/89/1.htm.
法鼓文理學院數位典藏專案。https://lic.dila.edu.tw/digital_archives_projects.
盧雲峰、黃星堯、陳朗,〈數字人文視野中的中國民間信仰〉。http://www.shehui.pku.edu.cn/upload/editor/file/20240913/20240913161502_4481.pdf.
呂鵬志,《唐前道教儀式史綱》。北京:中華書局,2008.
呂鵬志,〈天師道授籙科儀——敦煌寫本 S203 考論〉,《中央研究院歷史語言研究所集刊》第 77 本第 1 分(2006),頁 79-166。
任繼愈、鐘肇鵬主編。《道藏提要》。北京:中國社會科學出版社,2005.
謝聰輝,《新天帝之命:玉皇、梓潼與飛鸞》。臺北:臺灣商務印書館,2013.
謝聰輝,《修真與降真——六朝道教上清派仙傳研究》。臺北:國立臺灣師範大學國文研究所博士論文,1999.
項潔主編,《從保存到創造:開啟數位人文研究》。臺北:國立臺灣大學出版中心,2011.
蕭登福,《六朝道教上清派研究》。臺北:文津出版社,2005.
蕭登福,《先秦兩漢冥界及神仙思想探原》。臺北:文津出版社,2001.
蕭登福,《周秦兩漢早期道教》。臺北:文津出版社,1998.
蕭登福,〈試論道教內神名諱源起兼論東晉上清派存思修煉法門〉,《六朝道教上清派研究》。臺北:文津出版公司,2005.
許無。〈A History of Encoding from XML Markup to the TEI and EpiDoc Guidelines〉. Ogham in 3D Project, 2024-07-25. https://ogham.glasgow.ac.uk/index.php/2024/07/25/a-history-of-encoding-from-xml-markup-to-the-tei-and-epidoc-guidelines/.
許無。〈The Application of the Text Encoding Initiative (TEI) Guidelines〉. EI (學術期刊). https://soapubs.com/index.php/EI/article/download/1090/1076/3378.
許無。〈Using TEI for Quantitative Inquiry and Computer-Assisted Stemma Analysis in Biblical Studies〉. De Gruyter, 2021. https://www.degruyterbrill.com/document/doi/10.1515/9783110744828-014/pdf.
趙益,〈《道藏通考》評介〉(學術會議論文)。https://www.semanticscholar.org/paper/f6b72f60a5a9935b6de9ad477a5f18f734e8487c.
中華電子佛典協會(CBETA)。https://www.cbeta.org/.
中研院道教經典庫初集(試用版,2026)。https://www.litphil.sinica.edu.tw/library/posts/67585.
中研院民族學研究所「道教文物特藏」。http://www.ioe.sinica.edu.tw/chinese/dao/data/main.asp.
中研院漢籍電子文獻。http://www.sinica.edu.tw/tdbproj/handyl/.
中央研究院數位文化中心 / 臺灣數位典藏入口網。https://culture.teldap.tw/.
周邦信等,〈簡介 Metadata 於佛教電子文獻的應用〉,《中華電子佛典協會新聞電子報》第 6 期(1999-10-25)。
CIDOC-CRM. https://www.cidoc-crm.org/.
Dublin Core Metadata Initiative. DCMI Metadata Terms. https://dublincore.org/documents/dces/.
Europeana LOD. https://pro.europeana.eu/page/linked-open-data.
Gravsearch / Knora API (DaSCH). https://dasch.swiss/.
Harvard Digital Collections. https://library.harvard.edu/digital-collections.
Integrating Citizen Experiences in Cultural Heritage Archives: Requirements, State of the Art, and Challenges. Journal on Computing and Cultural Heritage (JOCCH). https://cris.unibo.it/bitstream/11585/848584/6/Integrating_citizen_experiences_in_cultural_heritage_archives__requirements__state_of_the_art__and_challenges__JOCCH_Submission_-6.pdf.
"IIIF: Activating Digital Assets for Accessibility and Creativity." Agnes Etherington Art Centre, Queen's University, 2024. https://agnes.queensu.ca/site/uploads/2024/12/IIIF_-Activating-Digital-Assets-for-Accessibility-and-Creativity_FINAL.pdf.
"IIIF in Digital Asset Management." Orange Logic, 2024. https://www.orangelogic.com/iiif-international-image-interoperability-framework-in-digital-asset-management.
Leiden University Library. "Digitised Texts and Images Available via Advanced IIIF-Technology." 2020. https://www.library.universiteitleiden.nl/news/2020/12/digitised-texts-and-images-available-via-advanced-iiif-technology.
LMU Digital Cultural Heritage – Knowledge Representation and LOD. https://www.kw.lmu.de/dch/en/research/methods/knowledge-representation-and-linked-open-data/.
"Multimodal Cultural Heritage Knowledge Graph Extension with Language and Vision Models." arXiv:2605.17669v1, 2026. https://arxiv.org/html/2605.17669v1.
"Pattern-Based Design Applied to Cultural Heritage Knowledge Graphs." Semantic Web Journal, 2021. https://www.semantic-web-journal.net/system/files/swj2665.pdf.
"Publishing and Using Cultural Heritage Linked Data on the Semantic Web." Semantic Web Journal, swj4048.
"Semantic Markup Annotations with Schema.org and JSON-LD for Cultural Heritage." CEUR Workshop Proceedings, Vol. 4021, 2024. https://ceur-ws.org/Vol-4021/paper7.pdf.
SemanticTafsir GitHub. https://github.com/A-Kamran/SemanticTafsir.
"The Computational Case against Computational Literary Studies." Critical Inquiry.
"Top 5 Graph Database Solutions in 2026." Top-5-Solutions, 2026. https://top-5-solutions.com/top-5-graph-database-solutions/2026/.
"12 Top Document Archive Open Source Tools for 2026." DocParseMagic, 2026. https://docparsemagic.com/blog/document-archive-open-source.
"Top 10 Best Archival Management Software of 2026." Gitnux, 2026. https://gitnux.org/best/archival-management-software/.
W3C. "JSON-LD 1.1: A JSON-based Serialization for Linked Data." W3C Recommendation, 2020. https://www.w3.org/TR/json-ld11/.
W3C SPARQL 1.1 Overview. https://www.w3.org/TR/sparql11-overview/.
Xunzi-LLM-of-Chinese-classics. https://github.com/Xunzi-LLM-of-Chinese-classics/XunziALLM.
卿希泰、唐大潮,《道教史》。江蘇:江蘇人民出版社/文物出版社,2006(初版 1994)。
卿希泰、詹石窗,《中國道教通史》(五卷本)。成都:四川大學出版社,2020.
卿希泰主編,《中國道教史》(修訂本,四卷本)。成都:四川人民出版社,1996.
康豹(Paul R. Katz)。Demon Hordes and Burning Boats: The Cult of Marshal Wen in Late Imperial China. Albany: SUNY Press.
康豹(Paul R. Katz)。Images of the Immortal: The Cult of Lü Dongbin at the Palace of Eternal Joy. Princeton University Press.
施舟人(Kristofer Schipper),〈《老子中經》初探〉,《中國文化基因庫》(北京:北京大學出版社,2002)。
黎志添等,「道教數位博物館」項目報告,香港中文大學道教文化研究中心,2015. https://www.daodigitalmuseum.net/CH/background.html.
黎志添,《道教研究與中國文化》。香港:中華書局,2003.
黎志添,《道藏輯要提要》(3 卷本)。香港:香港中文大學出版社,2021.
馬德偉(Marcus Bingenheimer)與洪健榮,台灣佛教寺廟 GIS 時空平台。https://mbingenheimer.net/publications/hung_bingenheimer_gisInDigitalArchives.2011.pdf.
附錄
附錄一:道教經典 TEI 標記範例(以《清微玄樞奏告儀》為例)
以下為道教科儀文本的 TEI/XML 結構化標記範例,示範如何以 <div>、<head>、<stage>、<sp>、<formula> 等元素標記科儀文本的結構層次、儀式動作、誦唱內容與咒語:
<?xml version="1.0" encoding="UTF-8"?>
<?xml-model href="http://www.tei-c.org/release/xml/tei/custom/schema/relaxng/tei_all.rng"
type="application/xml" schematypens="http://relaxng.org/ns/structure/1.0"?>
<TEI xmlns="http://www.tei-c.org/ns/1.0">
<teiHeader>
<fileDesc>
<titleStmt>
<title>清微玄樞奏告儀</title>
<author role="attributed">佚名</author>
</titleStmt>
<publicationStmt>
<publisher>鼎稔道學館數位典藏計畫</publisher>
<availability><licence target="https://creativecommons.org/licenses/by-nc/4.0/">
CC BY-NC 4.0</licence></availability>
</publicationStmt>
<sourceDesc>
<bibl>
<title>正統道藏</title>
<biblScope unit="dong">洞真部</biblScope>
<biblScope unit="lei">威儀類</biblScope>
<idno type="CT">CT 207</idno>
</bibl>
</sourceDesc>
</fileDesc>
<profileDesc>
<langUsage><language ident="zh-Hant">古典漢語</language></langUsage>
<textClass>
<keywords scheme="#daoritual">
<term>清微派</term>
<term>奏告儀</term>
<term>雷法</term>
</keywords>
</textClass>
</profileDesc>
</teiHeader>
<text>
<body>
<div type="ritual" n="1" xml:id="qwxszg_01">
<head>入壇</head>
<stage type="action">法師具職,步罡登壇,焚香啟白。</stage>
<sp>
<speaker><name type="deity" ref="deity:shangqing_lingbao_tianzun">
上清靈寶天尊</name></speaker>
<p>臣今奏為<name type="deity" ref="deity:leizu">雷祖</name>玉樞之下……</p>
</sp>
</div>
<div type="ritual" n="2" xml:id="qwxszg_02">
<head>發爐</head>
<stage type="action">法師存思自身化為天尊,左手掐玉清訣。</stage>
<formula type="incantation" xml:lang="zh-Hant">
<lg>
<l>无上玄元<name type="deity" ref="deity:taishang_laojun">太上道君</name>,</l>
<l>召出臣身中三五功曹……</l>
</lg>
</formula>
</div>
<div type="ritual" n="3" xml:id="qwxszg_03">
<head>宣章</head>
<stage type="action">法師朗誦奏章,存想章文上達天聽。</stage>
<div type="document" subtype="petition">
<head>具位臣<name type="person" role="officiant">某某</name>誠惶誠恐,稽首頓首</head>
<p>謹據<placeName ref="loc:taizhou">台州</placeName>
<placeName ref="loc:linhai">臨海縣</placeName>……</p>
</div>
</div>
</body>
</text>
</TEI>
標記說明:
| TEI 元素 | 用途 | 道教特定應用 |
|---|---|---|
<div type="ritual"> | 儀式程序分段 | 以「入壇」「發爐」「宣章」等步驟為單位 |
<stage> | 儀式動作描述 | 標記法師的肢體動作、存思、步罡 |
<sp> / <speaker> | 誦唱對話 | 區分天尊、法師、高功等不同發言者 |
<name type="deity"> | 神名標註 | 連結至神譜資料庫 URI(如 deity:leizu) |
<formula type="incantation"> | 咒語/真言 | 區分經文敘述與儀式誦唱內容 |
<placeName> | 地名標註 | 連結至地理知識庫,支援 GIS 視覺化 |
<biblScope unit="dong/lei"> | 道藏分類 | 標記三洞四輔部類歸屬 |
附錄二:神譜資料庫核心欄位設計表
| 欄位名稱 | 資料類型 | 說明 | 範例 |
|---|---|---|---|
deity_id | URI | 唯一識別碼,遵循 CRTA 或機構命名空間 | deity:beiji_zhenwu |
canonical_name | string | 正統名號 | 北極真武玄天上帝 |
alternative_names | array[string] | 別名、尊號、俗稱 | [玄天上帝、真武大帝、北帝] |
pinyin | string | 漢語拼音 | Bei Ji Zhen Wu Xuan Tian Shang Di |
gender | enum | 性別屬性 | male / female / androgynous / unknown |
origin_text | URI | 起源經典(連結至 scripture 節點) | scripture:beiji_zhen_wu_shangdi_ben_zhuan |
origin_period | string | 神格化年代 | 北宋 |
origin_region | URI | 信仰起源地 | loc:wudang_shan |
hierarchy_level | integer | 神譜層級(1=最高) | 2 |
superior_deity | URI | 上級神祇 | deity:yuqing_yuanshi_tianzun |
subordinate_deities | array[URI] | 從屬神祇列表 | [deity:tianpeng_yuanshuai, deity:tianyou_yuanshuai] |
func_domains | array[string] | 職能領域 | [鎮宅、驅邪、護國、延壽] |
ritual_associations | array[URI] | 相關儀式 | [ritual:beidou_dengyi, ritual:anzhai_tuhuang] |
iconographic_attributes | array[string] | 圖像特徵 | [披髮、黑衣、仗劍、踏龜蛇] |
temple_associations | array[URI] | 主祀廟宇 | [loc:wudang_shan_zi_xiao_gong] |
sect_associations | array[URI] | 相關宗派 | [sect:quanzhen, sect:beidi_pai] |
same_as_wikidata | URI | Wikidata 對應實體 | https://www.wikidata.org/entity/Q12345 |
same_as_crta | URI | CRTA 對應條目 | https://crta.info/deity/xxx |
source_references | array[string] | 文獻出處 | [《道藏通考》頁 1234,《中國道教史》卷三] |
editorial_note | text | 編輯註記 | 宋代以後地位上升,明代永樂年間敕封 |
附錄三:儀式本體 OWL 類別與屬性設計表
核心類別(Classes):
| 類別名稱 | 上級類別 | 說明 |
|---|---|---|
dao:Ritual | crm:E7_Activity | 儀式活動總類 |
dao:LiturgicalText | crm:E33_Linguistic_Object | 科儀文本 |
dao:RitualStep | crm:E7_Activity | 儀式步驟/節次 |
dao:AltarSpace | crm:E53_Place | 壇場/儀式空間 |
dao:Incantation | dao:LiturgicalText | 咒語/真言 |
dao:PetitionDocument | dao:LiturgicalText | 奏章/疏文 |
dao:Talisman | crm:E22_Man-Made_Object | 符籙/法器 |
dao:SacredMusic | crm:E29_Design_or_Procedure | 科儀音樂 |
dao:RitualRole | crm:E55_Type | 儀式角色(高功、都講、監齋等) |
dao:Invocation | dao:RitualStep | 啟請/召神步驟 |
dao:Visualization | dao:RitualStep | 存思/內觀步驟 |
dao:Offering | dao:RitualStep | 獻供/祭獻步驟 |
核心屬性(Object Properties):
| 屬性名稱 | 定義域 | 值域 | 說明 |
|---|---|---|---|
dao:hasStep | dao:Ritual | dao:RitualStep | 儀式包含步驟 |
dao:hasText | dao:Ritual | dao:LiturgicalText | 儀式對應文本 |
dao:invokesDeity | dao:Invocation | dao:Deity | 步驟召請神祇 |
dao:usesTalisman | dao:RitualStep | dao:Talisman | 步驟使用符籙 |
dao:performedAt | dao:Ritual | dao:AltarSpace | 儀式舉行地點 |
dao:performedBy | dao:Ritual | crm:E39_Actor | 儀式執行者 |
dao:hasRole | crm:E39_Actor | dao:RitualRole | 執行者擔任角色 |
dao:hasTemporalPart | dao:Ritual | crm:E52_Time-Span | 儀式時間跨度 |
dao:prescribedIn | dao:Ritual | dao:LiturgicalText | 儀式載於何經 |
dao:hasPrecondition | dao:Ritual | dao:Ritual | 前置儀式(如齋戒) |
dao:hasPostRitual | dao:Ritual | dao:Ritual | 後續儀式(如謝師) |
dao:sameAsWikidata | dao:Deity | xsd:anyURI | Wikidata 對齊 |
核心資料屬性(Data Properties):
| 屬性名稱 | 定義域 | 資料類型 | 說明 |
|---|---|---|---|
dao:lunarDate | crm:E52_Time-Span | xsd:string | 農曆日期(干支紀年) |
dao:solarDate | crm:E52_Time-Span | xsd:date | 公曆對照日期 |
dao:ritualDuration | dao:Ritual | xsd:duration | 儀式預計時長 |
dao:textFormat | dao:LiturgicalText | xsd:string | 文本格式(抄本/刻本/印本) |
dao:incantationLanguage | dao:Incantation | xsd:string | 咒語語言(漢語/梵語/密語) |
附錄四:現有道教數位典藏項目綜合比較表
| 項目名稱 | 主辦機構 | 資料類型 | 規模 | 技術特色 | 鏈結資料 | IIIF | 開放程度 |
|---|---|---|---|---|---|---|---|
| 道教數位博物館 | 香港中文大學道教文化研究中心 | 廟宇、碑刻、科儀、呂祖文獻 | 150+ 廟宇(一期) | Web-GIS、主題標籤、跨文獻索引 | 有限 | 否 | 開放瀏覽 |
| 道教經典庫初集 | 中央研究院中國文哲研究所 | 正統道藏、萬曆續道藏 | 1,486 種典籍 | 全文檢索、圖文對照 | 否 | 否 | 試用版 |
| 道教文物特藏 | 中央研究院民族學研究所 | 道壇文物(文疏、經書、掛軸、符版、法器) | 5 處道壇 | 全文影像、文物編目 | 否 | 否 | 開放瀏覽 |
| 道教經典庫 | 北京愛如生 | 道藏編 + 藏外道書編 | 正續道藏 + 2,000+ 種藏外書 | 全文檢索、圖文對照 | 否 | 否 | 商業授權 |
| 漢籍電子文獻 | 中央研究院 | 道教經典(含於漢籍全文庫) | 數百種 | 全文檢索 | 否 | 否 | 開放瀏覽 |
| lius.cc(鼎稔道學館) | 鼎稔道學館 | 經典、神祇、儀式、人物、地點、概念、宗派、學術報告 | 105,158 筆節點 | 節點式百科、全文搜尋、分類瀏覽 | 否 | 否 | 開放瀏覽 |
| CBETA(對照參考) | 中華電子佛典協會 | 佛教大藏經 | 《大正藏》全文 + 擴展 | TEI/XML、多語言對照、版本比對 | 部分 | 否 | 開放資料 |
| BuddhaNexus(對照參考) | 奧地利科學院 | 佛教文本重合度 | 梵、巴利、藏、漢文本 | 文本重合度算法、多語言對照 | 否 | 否 | 開放瀏覽 |
附錄五:lius.cc 資料庫節點類型分布統計
調查日期:2026 年 6 月 8 日
資料來源:lius.cc 生產資料庫
總節點數:105,158 筆
| 節點類型 | 筆數 | 占比 | 說明 |
|---|---|---|---|
concept | 30,606 | 29.10% | 概念條目,涵蓋術語、理論、方法等 |
scripture | 24,032 | 22.85% | 經典文獻,涵蓋道藏經典、科儀文本、地方志、寶卷善書等 |
deity | 13,587 | 12.92% | 神祇條目,涵蓋星辰神、護法神、地方神、佛教菩薩等 |
ritual | 11,935 | 11.35% | 儀式條目,涵蓋科儀類型、儀式程序、法事名稱等 |
location | 9,739 | 9.26% | 地點條目,涵蓋山岳、宮觀、洞天福地、行政區域等 |
paper | 8,385 | 7.97% | 學術論文與期刊文獻 |
person | 5,501 | 5.23% | 人物條目,涵蓋道士、學者、歷史人物等 |
sect | 1,278 | 1.22% | 宗派條目,涵蓋道派、法派、道教組織等 |
custom | 95 | 0.09% | 旗艦學術報告,涵蓋敦煌道經、道教金石、地方道派、度亡科儀等專題 |
| 合計 | 105,158 | 100% | — |
數位人文相關節點統計:
| 關鍵主題 | 命中筆數 | 觀察 |
|---|---|---|
| 數位典藏 | 15 | 已有基礎概念條目 |
| 資料庫 | 54 | 學術資料庫概念已建立 |
| 知識圖譜 | 1 | 尚未成為獨立研究主題 |
| TEI | 3 | 多為期刊論文來源連結 |
| XML | 14 | 技術層面提及 |
| 數位人文 | 13 | 概念條目已建立 |
| 經文標記 | 0 | 結構化標記尚屬空白 |
主題領域分布觀察:
| 主題領域 | 相關節點估算 | 數位化潛力 |
|---|---|---|
| 道藏/經典 | ~34,400(scripture 為主) | 高:適合 TEI 標記與知識圖譜化 |
| 神祇/神譜 | ~13,587(deity 為主) | 高:適合 RDF 知識圖譜與網絡視覺化 |
| 科儀/儀式 | ~57,000+(ritual + scripture) | 高:適合結構化比對與流程圖譜化 |
| 宗派/傳承 | ~1,278(sect 為主) | 中:適合譜系圖與 SNA |
| 地方信仰 | ~9,739(location 為主) | 高:適合 GIS 時空分析 |
| 學術文獻 | ~8,385(paper 為主) | 中:適合引用網絡分析 |