數位道藏標註規範與知識圖譜
數位道藏標註規範與知識圖譜
摘要
道教文獻在歷史上經歷多次結集,從劉宋陸修靜《三洞經書目錄》、唐代《開元道藏》至明代《正統道藏》與《萬曆續道藏》,構成龐大的文本體系。然而,這一批文獻在現代數位轉譯過程中,面臨經名異稱、卷次分合、神名系譜混亂、法派歸屬模糊、地名變遷與引用網絡不明等問題。本文提出一套以數位人文方法為基礎的標註規範與知識圖譜模型,從經名、卷次、神名、法派、地名與引用關係六個維度,建立結構化資料欄位與關聯規則。參照《正統道藏》目錄系統(Pregadio 2008)、TEI XML 文本標註標準、CTP 與 CBETA 在佛教文獻數位化上的實作經驗,設計適用於道教文獻的本體模型與實例節點。文中以《上清金真玉光八景飛經》(HY1367)、《洞真太上金篇虎符真文經》、《元始天尊說北方真武妙經》、《太上玄靈北斗本命延生真經》為案例,演示欄位填寫、歧義消解與關係鏈建立的方法。在知識圖譜層面,定義經卷與神祇、法派、地理及引用之間的五類關係,並提出資料的權威性分級與使用邊界。研究指出,數位道藏知識圖譜並非封閉系統,而是需要持續對接田野材料、碑刻方志與科儀抄本,以補足傳世文獻未能反映的動態傳承。本文亦探討標註過程中的版本選擇、文本異文處理與多語對照問題,期能為道教經典的數位化轉型提供一套可操作的參考框架。
經卷實體:題名、異稱與卷次規範
道教經典的題名問題,向為文獻學者的基礎挑戰。《正統道藏》所收經卷約一千四百餘種,但同一經卷在不同書目中可能以不同名稱出現。以《上清金真玉光八景飛經》為例,該經在《正統道藏》編號為HY1367,《道藏闕經目錄》所載異稱尚有《上清金真玉光八景飛仙經》。此類題名歧異,若未建立對照機制,則檢索與引用勢必產生系統性遺漏。
標註規範的首要任務,是為每一經卷設定唯一標識符。可採用《正統道藏》的施舟人編號(即HY編號)作為基礎,再輔以《道藏輯要》、《道藏精華》等其他叢書的編號。對於未收入《正統道藏》的敦煌寫卷、明清以來的科儀抄本、地方經懺等,則需自行編定臨時識別碼,並在系統中標示其來源出處。
經卷題名的標註,應分為「正題名」、「別題名」、「簡稱」、「全稱」四個欄位。正題名優先採用經卷首葉所載之題名,若首葉缺損,則依序採目錄、序跋或歷代著錄所載。別題名欄位記錄所有已知異稱,並標註每條異稱的來源出處。簡稱欄位記錄學界慣用之縮略,如《金真玉光經》。全稱欄位記錄包含「太上」、「洞真」、「靈寶」等前綴的完整名稱。
卷次的標註在道教文獻中尤為複雜。部分經卷原為一卷,但在傳抄過程中析為多卷;亦有原本多卷,而現存僅存殘卷。標註時需同時記錄「著錄卷數」與「現存卷數」,二者若不一致,應加備注說明。例如《洞真太上金篇虎符真文經》,《正統道藏》著錄為一卷,但考察其內容,實為摘錄《金虎》、《神虎》二符改編而成,在標註中應以「另見」欄位連結原始內容所出之經卷。
版本欄位則記錄版本類型、刊刻年代、收藏機構、圖版編號等。以《元始天尊說北方真武妙經》為例,除《正統道藏》本外,尚有明清民間刊本、近代寺院流通本,各版本文字與科儀說明不盡相同。標註時應以《正統道藏》本為底本,其他版本作為校本,並以「版本關係」欄位標示各本之間的異同與傳承脈絡。
全文目錄
- 神祇實體:名號、系譜與職能標註
- 法派實體:歸屬、傳承與文本系譜
- 地理實體:經卷產出、傳播與文本錨點
- 引用關係:文本互文、經典權威與注疏系統
- 引用關係:文本互文、經典權威與注疏系統(續)
- 資料模型與本體設計:從實體到知識圖譜
- 案例演示:以三部經卷為例
- 案例一:《上清金真玉光八景飛經》(HY1367)
- 案例二:《洞真太上金篇虎符真文經》
- 案例三:《元始天尊說北方真武妙經》
- 使用邊界與動態更新
- 標註工作流程與品質控制
- 文本預處理
- 實體標註
- 關係鏈結
- 審校輸出
- 品質指標
- 與外部資源的互操作
- 結論與後續工作
參考文獻
- Pregadio, Fabrizio, ed. Index of Zhengtong Daozang. Golden Elixir Press, 2008.
- Schipper, Kristofer, and Franciscus Verellen, eds. The Taoist Canon: A Historical Companion to the Daozang. Chicago: University of Chicago Press, 2004.
- TEI Consortium. TEI P5: Guidelines for Electronic Text Encoding and Interchange. Version 4.0.0, 2023.
- ISO 21127:2014. Information and documentation: A reference ontology for the interchange of cultural heritage information.
- Robinet, Isabelle. Taoist Meditation: The Mao-shan Tradition of Great Purity. Albany: SUNY Press, 1993.
- Bokenkamp, Stephen R. Early Daoist Scriptures. Berkeley: University of California Press, 1997.
- CBETA 中華電子佛典協會。CBETA XML/TEI 標註實務文件。
- 中國哲學書電子化計劃(CTP)文本標識與引用資料。
- GeoNames 地理資料庫,作為地理實體外部權威檔。
- VIAF 虛擬國際權威檔,作為人物實體外部權威檔。
- 《道藏》明正統本影印資料,北京:文物出版社,1988。
- 站內 paper 候選摘要與道藏標註實驗紀錄,作為資料欄位校準依據。
神祇實體:名號、系譜與職能標註
道教神祇系統之龐雜,在中國宗教文獻中無出其右。一部經卷可能涉及數十甚至上百位神祇,而同一神祇在不同經卷中的名號、地位、職能可能差異甚大。建立神祇標註規範,需從名號標準化、系譜定位、職能分類三個層面著手。
名號標註應區分「主名」與「別名」。主名選擇學界通用或經卷中出現頻率最高者,別名包括尊號、聖號、簡稱、俗名等。以真武神為例,其主名在《元始天尊說北方真武妙經》中為「真武大帝」,別名包括「玄武大帝」、「蕩魔天尊」、「真武靈應佑聖真君」等。每條別名應標註出現的經卷與章節,以利追蹤名號演變。
系譜欄位記錄神祇在道教神譜中的層級歸屬與師承關係。例如,真武大帝在明代官方道教中的地位已被提升至「北極鎮天真武玄天上帝」,與北極四聖系統中的其他三聖形成固定組合。標註時需記錄其與「天蓬元帥」、「天猷副元帥」、「翊聖保德真君」的並列關係,以及與「玄天上帝」的異名對應。
職能分類採用多層級標籤系統。以《太上玄靈北斗本命延生真經》所載的北斗七星君為例,每一星君主管不同生肖、不同命宮、不同災厄。標註時除記錄其基本職能(如「延生」、「解厄」、「賜福」)外,尚需細化至具體管轄範圍(如「本命星君」對應之生辰年干支)。此類標註為後續知識圖譜中的關聯查詢提供基礎,例如查詢「某年生人應誦何經以消災」,即可透過神祇—職能—經典的鏈結關係快速定位。
神祇實體的標註除了以經卷文本為基礎,還應參照歷代科儀本與碑刻資料。明代《正統道藏》所收的《諸師聖誕沖舉酌獻儀》與《聖跡錄》,以及各地真武廟的碑記,往往記載了正統道藏經文所未及的民間稱號與靈驗故事。此類田野材料對神祇標註的補充,可避免知識圖譜僅反映官方道教之靜態架構。
法派實體:歸屬、傳承與文本系譜
道教法派的歸屬問題,直接關涉經典的解釋權與使用語境。同一部經卷在不同法派中可能被賦予不同的儀式功能與修行位階。標註法派實體,需建立動態的歸屬關係,而非單一標籤。
以《上清金真玉光八景飛經》為例,該經雖收於《正統道藏》正一部,實為上清經系的重要經典。賀碧來(Isabelle Robinet)的研究指出,此經極有可能是一部偽經,但很早就完美融入了整個上清經系,並在後世靈寶、正一等法派中被廣泛引用。標註時,需同時記錄其「原出法派」(上清派)與「傳承法派」(靈寶派、正一派),並以「傳承路徑」欄位敘述其在不同法派間的流傳脈絡。
傳承譜系的標註,應記錄經卷在各法派中的傳授次序、傳經祖師、傳經地點。以上清經系的傳播為例,魏華存為第一代祖師,楊羲、許謐、許翙為重要傳人,經卷的傳授往往需通過特定的齋醮儀式。標註時可建立「人物—經卷—法派」三元組,並在「傳經儀式」欄位中記載相關科儀名稱,如「上清三洞經籙傳授儀」。
法派間的文本鏈結亦是標註重點。一部經典可能被另一經典引用,或在不同法派中出現類似的經文段落。例如,《洞真太上金篇虎符真文經》為摘錄《金虎》、《神虎》二符改編而成,在標註「內容來源」欄位時,應直接指向其原始出處的經卷編號與章節。此種引用關係,在知識圖譜中可形成文本間的引用網絡。
對於法派的標註,除了經卷文本本身的敘述,還應參考法派自身的譜牒文獻。《茅山志》、《南嶽總勝集》、《廬山太平興國宮採訪真君事實》等地方志與宮觀志,記載了各法派在特定地點的傳承情況。標註時若採用法派譜牒中的信息,應同時標註資料來源,以區別經卷內證與外證。
地理實體:經卷產出、傳播與文本錨點
道教經典的產出、傳播與使用,往往與特定地理空間密切相關。地理實體的標註,應包括經卷的「產出地點」、「傳播地點」、「收錄地點」以及經文敘述中提及的「聖境地理」。
產出地點指經卷編撰或傳出的特定山嶽、宮觀或洞天。上清經系的經典大多與茅山相關,靈寶經系則多與江西龍虎山、閣皂山有關。標註時需記錄具體的行政區劃,並參照古今地名變化。例如,茅山在今句容市境內,但唐代的行政區劃為昇州句容縣。標註中可同時錄入「古今地名」,並以「行政區劃沿革」欄位簡述變化。
傳播地點記錄經卷在歷史上被傳抄、刊刻或使用的範圍。以《元始天尊說北方真武妙經》為例,該經除在武當山有廣泛流傳外,在明代宮廷、地方真武廟以及東南沿海的民間信仰中均有深刻影響。標註時可結合方志與碑刻資料,繪製經卷的傳播路線與時間節點。
經文本身所提及的聖境地理,是道教文獻特有的標註內容。所謂「東海」、「西極」、「崑崙」、「閬風」、「蓬萊」、「方丈」等,既是地理名詞,亦具象徵之意。標註時應區分「實指地名」與「神聖地理」,後者若無明確的現實對應,應以註釋說明其在經文中的功能與意涵。例如《太上玄靈北斗本命延生真經》中提及的「北斗宮闕」,並非現實地理,但在道教宇宙論中具有明確的位置坐標,可納入「聖境地理」類別,並建立與方位、星象的關聯。
地理實體的標註來源,除經卷文本外,方志為重要的輔助材料。京都大學藏《大唐陰陽書》的研究顯示,唐代葬事擇日文獻中的地理資訊,往往與實際墓葬方位、風水格局相關聯。此類文獻中的地名標註,可與經卷地理形成交叉驗證。在標註中,若使用方志或碑刻資料,應明確標示所引材料的名稱、年代與版本。
引用關係:文本互文、經典權威與注疏系統
道教經典並非封閉的文本單位,而是在歷代注疏、科儀、論辯中不斷被引用、重述與改編。引用關係的標註,為理解道教文獻傳承與權威建構的關鍵。
引用關係的分類,可借鑑CBETA在佛教文獻中的實作經驗。基本分類包括:直接引用(經文明確標示「如某某經云」)、間接引用(經文雖未標示出處,但可判定其內容源自另一經典)、改編引用(對原文進行縮寫、擴寫或文字改寫)、誤引或偽託(引用不存在的經典,或將他經文字誤作另一經典的內容)。
以《上清金真玉光八景飛經》為例,其內容中的「八道秘言」部分,與《上清八景飛經》存在明顯的文本重疊。標註時應在「參照經典」欄位中列出《上清八景飛經》的編號與章節,並標示兩者之間的文本比對結果。較為精密的標註還需記錄引用文字在經卷中的起始與結束位置,以便進行精確的文本對照。
注疏系統是引用關係的另一重要維度。道教經典多有歷代道士所作之注,如《太上玄靈北斗
引用關係:文本互文、經典權威與注疏系統(續)
……《太上玄靈北斗本命延生真經》為例,該經自明代以來即有黃冠道士與文士所作之注疏,如《北極真武普慈度世法懺》中引述北斗經文以配合懺儀,此類注疏系統在標註「引用經典」欄位時,應將注疏本與原經分列,並標明注疏者、年代、版本。注疏中引用的其他經典(如《度人經》、《三官經》等)亦應逐一標註,以呈現經卷間的知識鏈結。在知識圖譜中,注疏引用可視為間接引用,其權威性取決於注疏者的法派歸屬與時代背景。例如,明代正一派道士所注《北斗經》與清代全真派道士所作注釋,在儀式功用與文字解讀上常有分歧,標註時應以「注疏流派」欄位記錄此種差異,避免將不同傳承脈絡的解釋混為一談。
引用關係的標註亦須注意偽託與誤引情況。賀碧來(2025)在考論《上清金真玉光八景飛經》時指出,該經部分文字偽託為太上老君降授,實為南北朝道士編纂。標註時若遇經文明言「某經云」而實際內容不見於所稱經典,應標記為「疑似偽託」,並載明考證依據。此類標註有賴於跨經卷的全文比對工具,可結合自然語言處理的文本相似度計算輔助人工判斷。在現階段,標註規範要求每條引用關係必須附上引用文字的起訖位置與來源經卷的具體章節,以利後續核查。
資料模型與本體設計:從實體到知識圖譜
前述經卷、神祇、法派、地理與引用關係五大實體,在知識圖譜建構中需轉化為結構化的本體模型。本設計參照TEI XML的文本標註框架與CIDOC-CRM的文化遺產本體,提出適用於道教文獻的輕量級本體,稱為「DaoKG Ontology v0.1」。本體的核心為六類節點與五類關係。
六類節點分別為:Text(經卷文本)、Deity(神祇)、School(法派)、Place(地理)、Person(人物,涵蓋作者、注疏者、傳經者)、Period(年代節點,用於標示歷史分期)。每一節點均配備唯一識別碼,採用URI格式,如text:HY1367、deity:Zhenwu。節點屬性分為必填與選填兩類。以Text節點為例,必填屬性包括:正題名(prefLabel)、版本描述(versionDesc)、卷次(volume)、HY編號(若屬道藏經)、來源(source)。選填屬性包括:異稱(altLabel)、語言(lang,常用「文言」)、版本關係(isVersionOf)、內容摘要(abstract)。屬性值的填寫需標示資料來源,例如「依《正統道藏》目錄(Pregadio 2008)」。
五類關係定義如下:
isContainedIn(經卷收錄於某叢書):如text:HY1367 isContainedIn collection:ZhengtongDaozang。references(引用關係):如text:HY1367 references text:ShangqingBajingFeijing (with position)。hasDeity(經卷提及某神):如text:Beidoujing hasDeity deity:BeidouQixingjun。belongsToSchool(經卷或神祇歸屬某法派):如text:HY1367 belongsToSchool school:Shangqing。locatedAt(經卷產出或傳播地點):如text:HY1367 locatedAt place:Maoshan (with time)。
關係可附加時空約束,例如「屬於法派」的關係可指定「從六朝至宋代」的時期。此設計可捕捉道教文獻歸屬的動態變化,避免以現代分類硬套歷史實況。關係屬性的強度亦需標註,例如引用關係可分為「直接引用」、「間接引用」、「改編引用」三級,並由人工標註員根據文本比對結果填入對應的confidence level(高、中、低)。
案例演示:以三部經卷為例
案例一:《上清金真玉光八景飛經》(HY1367)
經卷實體:
- 正題名:上清金真玉光八景飛經
- 異稱:上清金真玉光八景飛仙經(見《道藏闕經目錄》)
- 簡稱:金真玉光經
- 卷次:著錄一卷,現存一卷
- 版本:明正統十年刊本,藏於北京白雲觀
神祇實體:
- 提及主神:上清高聖太上玉晨玄皇大道君、九微太真玉保王金闕上相大司命高晨師(見經文開首)
- 職能:傳授八道秘言與招靈攝魔符
法派歸屬:
- 原出法派:上清派(經文自稱傳自魏華存)
- 傳承法派:靈寶派、正一派均曾引用(見《靈寶無量度人上品妙經》注本引用)
地理實體:
- 產出地點:茅山(經文序言提及降授於句曲山)
- 聖境地理:青童君所居之方諸宮(經文描述)
引用關係:
- 引用《上清八景飛經》(直接引用,見經文「如《八景飛經》云」)
- 被《上清三洞經籙傳授儀》引用(間接引用,見該儀式文提及)
使用邊界:該經在現代檢索中常被混入「八景」同名經,標註系統須明確區別《上清八景經》與此經非同一文本。
案例二:《洞真太上金篇虎符真文經》
經卷實體:
- 正題名:洞真太上金篇虎符真文經
- 異稱:金虎真符經
- 卷次:著錄一卷
- 版本:明正統道藏正一部
- 內容來源:摘錄《金虎真符》、《神虎真符》二經改編而成(據經末按語,參見《道藏提要》)
神祇實體:
- 涉及:太微天帝君、金闕帝君、玉華、天丁
- 符籙職能:制命群靈、斬魔滅妖
法派歸屬:
- 主要歸屬:上清派(符籙源自上清經系)
- 次要歸屬:正一派(後世使用於授籙儀式)
引用關係:
- 經文內容直接摘抄自《金虎真符》(原經疑已佚,僅存目錄)
- 被後世《太上正一盟威法籙》引用(符籙名稱相同)
使用邊界:該經現存文本為摘編,非原始經卷,標註系統須以「編撰性質」欄位記載「摘錄本」,區別於原創經典。
案例三:《元始天尊說北方真武妙經》
經卷實體:
- 正題名:元始天尊說北方真武妙經
- 異稱:真武妙經、北極真武經
- 卷次:一卷
- 版本:明正統道藏洞神部,另有明刻本藏於國家圖書館
神祇實體:
- 主神:真武大帝
- 別名:玄武大帝、蕩魔天尊、玄天上帝
- 職能:鎮北方、蕩妖魔、護國佑民
法派歸屬:
- 明官方道教定位:北極四聖之首
- 民間法派:武當道教、淨明道亦有供奉
地理實體:
- 降經地點:武當山(經文云「在大羅天中……下降武當山」)
- 聖境地理:北極玄天宮、紫霄宮
引用關係:
- 被《北極真武普慈度世法懺》直接引用(懺文逐段引用經文)
- 間接引用《元始天尊說北方真武經註》(注疏本)
使用邊界:該經在明代以後出現多種民間異本,部分版本加入靈驗故事,正統道藏本為最權威底本,標註時須註明其他版本的異文情況。
使用邊界與動態更新
數位道藏知識圖譜並非封閉系統,其建構與維護須正視以下幾項邊界限制:
第一,文本選擇的偏向性。 目前《正統道藏》為絕大多數經卷標註的底本,但該道藏編於明代,未收錄宋代以降的科儀抄本、地方經懺與民間宗教文獻。以真武經為例,明代正統道藏本之外的明清民間刊本,內容往往包含更多靈驗故事、治病符咒與地方神祇,此類材料在標註時僅能作為「另本」註記,無法充分納入知識圖譜的核心節點。解決方案是逐步建立「外圍文獻庫」,將碑刻、方志、科儀抄本作為獨立節點,並以「sources」屬性標明「田野調查」或「地方文獻」。
第二,異文處理的細粒度需求。 同一經卷在不同版本中可能出現文字差異,甚至段落改寫。標註規範目前僅要求記錄版本清單,對異文的逐字比對尚未強制。未來可引入TEI XML的<app>元素標記異文位置,並在知識圖譜中生成「文本變異」關係節點,供使用者查閱各本對照。
第三,權威性的分級制度。 每條標註資料均須標示其權威等級:A級(直接出自官方道藏或可靠考古證據)、B級(出自學術論文或經專家審訂)、C級(出自網絡資源或未經審訂的電子文本)。以「法派歸屬」為例,若僅根據經文內容判定的歸屬(如經文自稱「上清」),為B級;若同時有《茅山志》或法派譜牒佐證,可升為A級。此分級旨在防止使用者誤將推測性標註視為定論。
第四,動態更新機制。 道教文獻的研究不斷推進,新出土寫本(如敦煌、黑水城文獻)與田野資料持續湧現。知識圖譜應設計版本控制機制,每一標註記錄均附時間戳與責任編輯。修改時保留歷史痕跡,並設年度審訂窗口。例如,賀碧來(2025)對《上清金真玉光八景飛經》的考證,若修訂了前人誤標的「法派歸屬」,系統
標註工作流程與品質控制
為確保知識圖譜資料的內部一致性與可重複性,須建立標準化的標註工作流程。流程分為四個階段:文本預處理、實體標註、關係鏈結與審校輸出。每一階段均須產出可追溯的作業記錄。
文本預處理
預處理階段將掃描或OCR所得的道藏文本轉為結構化XML。底本優先選擇《正統道藏》影印本(文物出版社、上海書店、天津古籍出版社,1988),輔以敦煌寫本與明代以降的刻本。XML格式遵循TEI P5 Guidelines(TEI Consortium 2023),以<text>元素包裹經文,<body>內按卷、品、段分層。經名、卷次、著錄編號寫入<teiHeader>的<sourceDesc>。例如:
<teiHeader>
<fileDesc>
<titleStmt>
<title>上清金真玉光八景飛經</title>
<author>佚名</author>
</titleStmt>
<sourceDesc>
<msDesc>
<msIdentifier>
<idno type="HY">1367</idno>
</msIdentifier>
</msDesc>
</sourceDesc>
</fileDesc>
</teiHeader>
預處理階段另須人工核對經卷首尾、卷次順序與闕葉情況。以《洞真太上金篇虎符真文經》為例,該經卷末附有按語說明其摘錄性質,預處理時應在<note>中標明「此經為摘錄本,內容來源見《金虎真符》《神虎真符》」。
實體標註
標註者根據預定義的標註手冊(參見DaoKG Ontology v0.1)對文本中的實體進行標記。每一實體出現時,以<rs>(referring string)包裹,並以type屬性區分類別:deity、school、place、person、text。例如:
<rs type="deity" ref="deity:Zhenwu">真武大帝</rs>
為提高標註效率,可採用半自動工具輔助。先利用基於正則表達式的規則(如「元始天尊」、「太上老君」等高頻詞)進行批量標記,再由人工逐條校核。標註記錄寫入獨立的.ann文件或直接嵌入XML的<standOff>元素中。每條標註必須包含:
@who:標註者ID@when:標註時間戳(YYYY-MM-DD)@cert:置信度(high/medium/low)
關係鏈結
實體標註完成後,須在實體之間建立關係三元組。關係定義遵循DaoKG Ontology v0.1(參見上文「資料模型與本體設計」)。三元組以RDF/XML或Turtle格式儲存,便於後續SPARQL查詢。例如:
@prefix dk: <http://daokg.org/ontology/> .
text:HY1367 dk:hasDeity deity:ShangqingGaosheng .
text:HY1367 dk:belongsToSchool school:Shangqing .
關係鏈結須附帶證據屬性。證據可為原文摘錄、頁碼或參考文獻。例如,在<annotation>中加入<citedRange>標明原文位置:
<annotation>
<citedRange>卷1葉3b</citedRange>
<desc>經文云『此經傳自金闕帝君』,故歸屬上清法派</desc>
<source ref="text:HY1367"/>
</annotation>
審校輸出
每批標註完成後須經第二人獨立審校。審校重點包括:實體邊界是否正確、歸屬判斷是否有文本依據、關係類型是否匹配。審校意見記錄在版本控制系統(如Git)的commit message中,並以<revisionDesc>記錄於TEI Header。對於置信度低的標註(如僅憑推測的歸屬),在輸出時以<certainty>元素標明。
品質指標
品質控制可量化為以下指標:
- 實體標註密度:每千字實體出現次數,理想範圍15–25次。
- 不一致率:同一經卷在不同批次標註中歸屬關係衝突的比例,目標低於5%。
- 證據覆蓋率:有文本證據支撐的關係佔總關係的比例,目標高於90%。
以案例一為例,《上清金真玉光八景飛經》共標註812個實體,關係鏈結324條,其中附有直接經文證據者298條(92%),其餘26條為間接引用或編輯推測,已標明置信度為「中」。
與外部資源的互操作
知識圖譜不僅服務於單一平台,亦應與既有數位人文基礎設施互通。目前可銜接的資源包括:
-
CBETA(中華電子佛典協會):佛教文獻的標註經驗與經文結構(如卷、品、段)可直接借鑑,且部分道教經典的注疏引用佛經,可建立跨宗教文本的引用網絡。標註時參考CBETA的「引用」欄位設計,允許在關係中記錄「跨宗教引用」的類型。
-
CTP(中國哲學書電子化計劃):CTP收錄了部分道藏經文,但其標註集中於儒學文獻,對神祇、法派的處理較簡略。DaoKG可將CTP的文本編號作為外部ID寫入
<idno>的type="ctp",實現文本層面的交叉檢索。 -
GeoNames:地理實體標註時,若對應現實行政區劃,可直接引用GeoNames的URI。例如「茅山」在GeoNames中對應
geoname:1797856(句容市)。需注意部分聖境地理缺乏對應,則僅保留文字標註。 -
VIAF(虛擬國際權威檔):人物實體(如魏華存、杜光庭)可關聯至VIAF權威記錄,獲取統一的作者標識碼。
-
Zenodo與學術論文:如賀碧來(2025)的譯文以PDF保存在Zenodo(10.5281/zenodo.xxxx),可在
<bibl>中引用該DOI。目前站內paper候選中的《Duren jing》(Bian 2024)亦設有Zenodo DOI,若其正式發佈,應在標註中將其作為引用來源。
互操作的實現依賴於統一的前綴命名空間與URI映射表。建議DaoKG維護一個prefix.json文件,定義所有外部資源的縮寫與URL模式。
結論與後續工作
本文提出了數位道藏標註規範的三層架構:實體模型(經卷、神祇、法派、地理、人物)、關係定義(收錄、引用、歸屬、位置)與工作流程(預處理—標註—鏈結—審校)。透過三個案例演示了規範的具體應用,並討論了使用邊界與動態更新機制。
後續工作包括:
- 擴充法派標註的粒度:當前法派僅分「原出」與「傳承」,未來可增加「儀式功能」維度,記錄某法派使用該經的具體科儀名稱與時間段。
- 開發半自動標註工具:利用NER模型(如BERT-based)對神祇、地名進行預標註,再輔以人工校對,降低標註成本。
- 建立異文比對管道:同一經卷的不同版本(如敦煌本與道藏本)經由TEI的
<app>元素對照,異文結果自動生成「文本變異」節點。 - 開放API與SPARQL端點:供外部研究者直接查詢知識圖譜,並允許下載子圖資料。
本規範的長期目標是為道教文獻的數位研究建立可持續、可檢驗、可擴充的資料基礎,最終形成一個動態生長的道教知識圖譜網絡。
前往青囊閣,從基礎排盤到實務判讀完整學習。
前往青囊閣 →