佛典數位化與藏經個人化——杜正民教授談CBETA電子佛典集成

◎杜忠全

1998年首發的試用版以迄今日,中華電子佛典已歴經十二個年頭,我雖身在大馬,卻也每年輾轉獲得更新版本,2010年最新版出爐之際,正巧自己身在法鼓山,便與多年來主其事的杜老師約訪,請他把中華電子佛典協會投入佛典數位化工程的內部思考與未來展望說個梗概。

細說從頭

1998年,中華電子佛典協會成立(簡稱CBETA),當年推出的試用版先從般若部著手,經三年半才完成《大正藏》全藏的輸入,進而轉入《卍字續藏》。杜老師說,為方便計,他們以每五年為一期,第一期做大正藏,第二期側重卍字續藏,目前是第三階段,陸續在做《嘉興藏》、《趙城金藏》乃至藏外佛典、石經等部分的輸入。2011年開始,CBETA將與臺北國家圖書館合作,把該館所藏善本書而未曾入藏的佛典電子化;這部分包括刻本與寫本,後者即含敦煌資料了。關於敦煌資料的輸入,我說,這是否會跟歐洲學界的某些成果重疊?杜老師隨即釋疑,說電子佛典計劃與歐洲學界整理敦煌資料的方式有所不同:

“我們做的是全文輸入,歐洲方面是按原圖檔進行掃描。”他說:“電子佛典的特色是不光可以看,還可以再應用和編寫,使用者可複制文字或按引文功能來直接引用。”

“如果是寫本電子化,”我繼續追問:“那些俗字的辨識和輸入是否有難度呢?”

“這就是我們面對的挑戰了!”杜老師說:“所以,未來我們的一個長期工作計劃,就會落在寫本電子化上了,這是無法回避的。”

重新編目與藏經個人化

電子佛典推出之初,有人質疑主事者為何要重新編目,而不將大正藏的《昭和法寶總目錄》直接輸入,是未獲授權?

“是的,這部分日本方面的確未授權給我們使用,連同圖象部也一樣。”杜老師率然地說:“但除了這個,我們還有自己的考量……”

為電子佛典重新編目,當年在會議上面對這一質疑,他在現場即予以回應,即電子佛典還要繼續往下做:完成大正藏之後,還要把大正藏以外的佛典匯整而入。大正藏是近代人編的,雖然很豐富,但並不完全涵蓋所有的現存佛典,更遑論近數十年來出土的新資料了。

“而且,經過這十多年的發展,我倒覺得,”杜老師說:“這編目其實也可以開放給使用者自己來做。現在的數位功能很強,不同專業或側重點有別的學者,可以按自己的研究主軸來應用電子佛典編一套自己的藏經。這也就意味著,將來編藏會是一樁很個人化的事,這是必然的趨勢。”

電子佛典的標示功能

陸續編藏,電子佛典以大正藏為主而編入其他的藏經,經典收錄方面不重疊,但如有版本上的差異呢?

“電子佛典最重要的其實不只在於文字輸入,我們還做了很多的標記。”杜老師說:“這些標記即是在處理諸如校勘、版本等問題;用標記的方式,我們就無需重複輸入相似的經文了。其實我們並不是一開始就做校勘,而是先做資料比對,比如目前在做的《趙城金藏》;我們之前已針對以《金藏》為底本的大陸《中華藏》做了比對,現在《趙城金藏》入館了,我們又再做了一次。無論如何,目前電子佛典協會並沒有足夠的人力與能力去做所有版本的校勘,這也是未來還可繼續努力的部分。”

關於電子佛典的標記功能,杜老師進一步解釋,說有了確定的單一版本(即大正藏)之後,他們就可將其他版本的同經異文據以標出。大正藏當年也做了校勘,但如原校勘有誤,或一些新發現的版本,就可以在標記上予以添加了。

“難道《大正藏》當年沒把《嘉興藏》納入校勘嗎?”我不無疑惑地問。

“有,但不多。”杜老師說:“而且,大正藏當年號稱以《高麗藏》為底本,我們把這兩套藏經拿來比對之後,發現事實未必如此,其中的差距多達一萬多筆,整個校勘的成果,都呈現在CBETA的光碟和網頁了。”

“那麼,句讀呢?”談到重新校讀大正藏,我隨即想起大二時讀吉藏的《中觀論釋》;讀大正藏的《中觀論釋》,幾經遲疑之後,後來我還是拿起紅筆,一一為那些不堪卒讀的句讀重新調整。大正藏的句讀問題,我是有所領略的。

“哦,這是老問題了。”杜老師說:“完成大正藏的輸入後,我們也著手做新式標點,大致已完成近半了,這算來是電子佛典的新貢獻了。”

開放的線上資料

每一年新版的電子佛典,都是對舊版本的修正和新增。過去一年裏使用者的回饋,包括一些錯誤和缺失,尤其是版本上的問題,主事者都盡量予以納入和改進,也對使用者的回饋感激不已。

“那麼,電子佛典是否考慮采維基百科的互動模式?”我試探性地問。

“我們一直都希望這麼做,很想!”杜老師很誠懇地說:“我們的理念就是, Web 2.0的時代來臨之後,使用者對文本是可以參與與修訂的,這裏頭可以產生一個機制。但是,CBETA在走到這一步之前,還有一個很重要的步驟,即必須有足夠的數據量,同時這機制要很完整。有了這前提,我們就能走到與使用者即時互動的全開放模式,也更能契合新時代的需求了。但是,這可能得分步驟來落實……”

杜老師說的分步驟,是先開放給特定領域的學者,如某一些學者專精於某些經典,那就開放這些學者來參與線上修訂;未來機制更完善後,才對所有的使用者開放。

這樣,是否就不需要每年推出實體光碟了?我問。

“是的,我們一直都在思考這問題。”杜老師說:“目前顯然還有這個需要,因某些偏遠地區還沒辦法連網,一些地方的網速太慢,無法有效應用網上資料庫。其實,我們每一次推出新的光碟版,都會有一個壓縮版本上載到CBETA網站,大家都可以上網下載,不需要索取實體光碟的。但是,這麼做的前提是網路系統必須完善,否則就會面對無法完成下載的問題了。”

無論如何,這是個未來趨勢,將來,中華電子佛典協會將針對使用者情況來調整,比如減少光碟的發行量,鼓勵大家線上下載網路版。關於這一點,杜老師說,除了客觀的網路配備條件外,其實也牽涉到使用者習慣:

“新一代的使用者不像老學者,後者往往需要有一個實體的東西握在手裏,而新世代的使用者則覺得,他們其實只需要一個介面,其他的資料放在遠端,自己隨時連線使用就行了,甚至都不需要把資料下載了占據儲存空間。”談到未來趨勢,杜老師繼續說:“甚至那些經過自己編輯和整理的資料,都可以選擇存在自己的電腦或遠端,這都是未來可行的。後面說的還是一個夢想,但很快就會到來了……”

獨立運作,不隸屬單一單位

中華電子佛典協會的成立,是因為早期臺灣有一群人希望可以做出電子佛典,但討論經年而未見成果,其時杜老師正與恒清法師著手建立臺灣大學佛學研究中心的佛學數位資料庫。那時一位蕭振國先生自己出資在大陸請人輸入大正藏,並且完成了首25冊,他把這階段性的成果無償捐出。以此初步成果為基礎,他們結合一群志同道合者成立了T25,初步構想是先把大正藏的首25冊給完成,再擴大到其他的部分:

“我們中華電子佛典協會募得的第一筆款項,是恒清法師向北美印順導師基金會募來的。”回顧電子佛典的起步,杜老師說:“開始的測試版是每半年出一張光碟,大致穩定後維持一年一張。早先是每年2月份推出的,但有一年我們的作業有所拖延,慢了兩個月推出,這才變成目前的4月份。我們還在討論是否要恢複原先的2月份,但這樣就勢必造成某一年我們的作業期限比較短……”

中華電子佛典協會早期多采義工制,後來則多委外,請兼職人員來協助,正職人員只得五位:

“我們的經費本來就不多,協會會址早期設在龍江街的慧日講堂,後來雖然搬到北投光明路的中華佛教文化館,但並不隸屬法鼓山體系,而是獨立運作的。”談到協會的運作,杜老師強調:“我們的基本概念是,佛典是屬於大眾的,雖然這些年來很多的資源和經費都來自法鼓山,尤其早期聖嚴法師給予我們很大的支持,但雙方都很清楚這樣的定位,而從不把佛典當作單一單位的資產。”

結束談話之後,我沿著貫接圖資館與宿舍之間的廊道往回走,時正春寒,入夜後,山上的氣溫尤低,濕冷的風從對外窗的縫隙灌入,這才讓我感到凍冷;方才拿著當天出爐的光碟跟杜老師談佛典電子化,卻只感到他的一片熱心腸,談興正酣時,竟把四下的寒意給驅退了!

杜正民教授簡介

中華數位佛典協會 總幹事

法鼓佛教學院 專任教授兼副校長

歴任中華佛學研究所 副研究員、網資室主任、圖資館館長等。

2011120日,星期四,南洋商報-登彼岸版-佛教數位化.上篇

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *

*

你可以使用這些 HTML 標籤與屬性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

你的瀏覽器必須開啟 javascript 以進行驗證動作!