2015年9月30日 星期三

爾雅辭典

《爾雅》是我國最早的一部解釋詞義和名物的專著,也可說是世界上最早的一部辭典。它是由秦、漢間學者綴輯諸書舊文遞相增益而成,最後成書於西漢初年。《漢書.藝文志》將《爾雅》列為儒家的經典之一,包括在後來的十三經之中。《爾雅》的前三篇 --- 釋詁、釋言、釋訓解釋一般語詞,後面的十六篇專門解釋各種名物術語,是後代常用來考證古代詞義和名物的重要參考資料。

旅居國外的親友一一地返回居住地了,我也逐漸恢復了日常的閱讀作息。受耽擱的詩經進度已經自行補課追回,轉眼間讀詩也快滿三個年頭了。讀詩經時常常得逐字逐句地參考毛傳的訓詁,而毛傳的訓詁又常是引自爾雅而來,這讓我想:「如果能有一部 "爾雅辭典" 加入我的辭典群的話,每次查詢都能讓我知道哪些字詞的訓詁事實上是來自爾雅,那該有多好呀!」因著這個念頭,從去年的十月份開始,我便另外啟動了一個 --- 製作 "爾雅辭典" 的計畫。

整理離線辭典,第一步當然就是收集完整的原文內容。但找遍了網路上的幾個版本(漢川草廬數位經典中國哲學書電子化計劃維基文庫 ......),每個版本都有些細微之處不太一樣(有些是用字、有些是斷句),也不知道它們是按哪個善本校對(多半沒有明確標示)?哪個版本才比較可以信任?整理古籍資料最棘手的莫過於版本的莫衷一是,這些資料經過千百年的輾轉傳抄,訛誤分歧所在多有,哪個版本才是最好最正確的,有時連專家學者都要吵成一團,更何況是我一個小小的業餘書呆了。那怎麼辦呢?只好找我所知道的善本,自己來對對看了。這一對,原本只打算花個一兩個星期就要完成的辭典,卻演變成了一趟橫跨七個多月的辭典製作之旅。

我首先找來清朝阮元校刻的《重刊宋本十三經注疏附校勘記》(《十三經注疏-附校勘記》中華書局1980年影印,以清嘉慶二十年南昌府學刊本為原始底本),以裏面的《爾雅注疏》為底本,開始逐字地校對起來。結果發現手邊的數位文本與紙本不一致之處甚多,於是一一訂正。校刻本裏有一些古體字、避諱字,只要 Unicode 裏找得到的我就儘量保留原貌。利用日常下班後晚上就寢前的一兩個小時,每天校對一點,大概花了一個月的時間,完成了我的一校。

古本的爾雅是沒有標點斷句的,這不利於我的閱讀,於是我又找來了北大版的《爾雅注疏》(簡體標點本),進行了第二次校對。除了原文的又校之外,同時也把標點、斷句給校訂過一次。

後來我總算借到了一本北大版的《爾雅注疏》(繁體標點本),於是又進行了第三遍校對。除了原文的再校之外,同時也把今本與古本用字不同的古今字給標註上去。阮元的校勘記裏訂正了許多原文的訛誤,在三校的同時決定把它更正進原文裏,但怕後閱者不知修改的原由,於是又決定把校勘也給補註上去。這一決定又把自己累慘,逐條掃描校勘文字、OCR、校對、繕打訂正,這第三校不知又花了多少時間。

等到三校完成,得到了含有校勘註記的完整數位文本,於是開始拆分詞條,定出 Keyword,排版成 MDict 格式。遇到 Keyword 含有古今字、正訛字的詞條,則以連結處理,確保用古字、今字;正字、訛字均能檢索到相對應的詞條。

完成詞條的拆分後,這部辭典的製作也快接近尾聲,算算時間已然過去半年多了。最後再將相同 Keyword 的詞條整理合併,這部耗我時間最久的離線辭典終於完成。

這部主要以阮元校刻十三經注疏版為底本的 "爾雅辭典.mdx",共有詞條 2642 條(含136個異體連結),其中單字詞條 1838 個,複詞詞條 668 個,校勘文字 360 條。



釋詁  摟〔樓〕,聚也。釋宮  陜而脩曲曰樓。「樓」,唐石經、單疏本、雪牎本同。《釋文》:「摟,力侯反,從手,本或作『樓』,非。」《爾雅義疏》作「摟」。「脩」,唐石經、單疏本、雪牎本、元本、閩、監本同,唯毛本作「修」。下注疏準此。



䗖(螮)蝀
釋天  䗖(螮)蝀,虹也。——風雨


方括號〔〕表示原本訛字,其前為依校勘訂正過的正字。圓括號()表示現代本用字,其前為古本原字。


3 則留言:

  1. 這個自己加工的版本,應該沒有版權問題,可以放出來吧?

    回覆刪除
    回覆
    1. 校記應該還是有版權問題,我一直想重做這部辭典,只是一直沒時間。另一方面也在評估、克服一些技術問題,等到因緣俱足,或許這部辭典就會跟大家見面,呵呵!

      刪除