2022年4月8日 星期五

《本草綱目》辭典

☆ 2022/12/30 累積訂正更新,原連結請重新下載。
☆ 2022/09/23 因應 Unicode 15 發布,同步更新《本草綱目》字典,原連結請重新下載。

《本草綱目》是一部集醫藥、本草大成的著作,由明代李時珍費時二十七年,歷經三次改寫而成。萬曆六年(1578年)定稿,卻苦無書商願意承印,又歷十二年,才獲南京藏書家兼出版商胡承龍的贊助,於萬曆二十三年(1596年)正式在南京刊行。然而,李時珍在獲得贊助後,未及三年便撒手人寰,終究未能看到自己的著作問世。

《本草綱目》雖然不是字書,但算得上是中國古代一部劃時代的醫藥類百科全書,影響後世至深且鉅。清代著名的《康熙字典》,引用《本草》相關的引文就有五百多處。時至今日,我們還能經常在廣告文案上看到:「《本草綱目》有記載,……。」云云,讓人倍感親切、信賴。《本草》其實早已內化到每一個華人的骨子裡,是生活上、文化上無法切割的一部分。

多年前蔣老師曾贈我一些《本草綱目》相關的整理資料,由於尚須大量時間處理,我遲遲沒有真正動手,只在有機會時儘量收集相關的補充資料以備後用,就這樣擱置多年。只是我始終牽掛,未曾忘記這部鉅著。

今年年假期間,忽然覺得是時候該動手了,於是開始著手整理。把我這些年收集到的資料全部翻出來,一一歸納彙整。以蔣老師相贈——趙懷舟先生的研究稿為底本,拆分成詞條,製成辭典。近年來大陸有許多學者出版金陵本的現代點校本,不過可惜的是均以簡體字發行,終究不是古籍的原貌。我獲得的這份研究稿是以繁體完成,雖然在很少數地方仍能發覺漏改的簡繁轉換錯誤,但已屬難得,可以之為基礎,日後再慢慢訂正。


(對應於原籍:淺紫色為標題字;墨水藍為內文大字;深灰色為夾注小字)

我收集到兩版金陵本,一本來自美國國會圖書館(下載自書格),解析度較高,可惜有些缺頁;一本來自日本國會圖書館,解析度稍低,應該無缺頁(有少數手抄補頁)。兩版都經我剖頁處理,利於檢索,也算是全世界少數珍本之二,呵呵!

《本草綱目》雖然多以條列的方式撰寫,但畢竟是古代的著作,體例不是那麼一致,很多地方無法批量處理,只能以人力一條條閱讀,定出詞頭並予以拆分。光要從 1897 項正藥詞條中再細分拆出分支藥品與附錄藥品,我便二易文本,逐條遍析 1897 項正藥兩輪,歷時經月才定下雛型。

1106 幅插圖,原先集中置於書首的附圖卷,我將其分拆,補入各相應詞條之下,便於參看,省去前後翻書的不便,也讓版面有圖有文較不單調。


(內文中有點校作者的校注共一千多條)

整理過程中遇有全宋體尚未收錄的缺字,即造字補上,遇有被替換成現代通行字的古字也儘量改回去。但畢竟投入的時間有限,掛一漏萬,離完美尚有遙遠距離。只能先求有個方便檢索的工具能用,後續若有有心人能在此基礎上再下苦工校對、修訂,當是眾人之福。

感謝老搭檔 suns99 兄,與我合力將金陵本、張紹棠本的頁碼索引製作出來,讓檢索對照原書變得便捷。劉衡如、劉山永校注的《本草綱目》新校注本頁碼則是蔣老師提供的數據,我再加以細化修補而成。有古本、有今本,相互參酌,當極有利於閱讀。尚有許多參考書籍(書單參見辭典的 About),還沒有時間收集整理,製作索引。若有朋友願意相助,十分歡迎。

有朋友認為以今日醫藥科技衡之,《本草綱目》所述多有無稽。我則以為,《本草》的價值是多面向的,莫要單以藥典角度視之。況且它記錄的正是四百多年前,那一時代人們的所知所識,有其歷史上、文化上的價值。相信若於四百年後再回過頭來看今日,怕是許多今日我們的認知也難免會是無稽吧,呵呵!

徵得研究底稿作者懷舟兄的同意,現將此《本草綱目》辭典無條件分享出來,希望能幫助更多的人研究、親近這部偉大的經典。請參閱一系列四篇「漢字使用環境的建置 ㈠ —— 顯示篇」、「漢字使用環境的建置 ㈡ —— 輸入篇」、「漢字使用環境的建置 ㈢ —— 辭典篇」、「漢字使用環境的建置 ㈣ —— 開卷篇」的說明安裝字型與相關工具,以利完整顯示和輸入查詢。辭典中用到了一些目前 Unicode 尚未收錄的漢字【註①】,目前只有配合最新版的全宋體才能完整地顯示。


詞條總數:9857
名詞數目:5688
正藥品項:1897
支藥品項:2318
附藥品項:261
序跋附錄:58
圖片數目:1106
連結數目:4111

下載連結:本草綱目.zip本草綱目(日國會金陵本).pdf本草綱目(張紹棠本).pdf(「美國會金陵本」體積太大,我的 Google 空間有限,放不下幾本這種大部頭,請見諒)


樂見學術研究、教育工作、個人閱讀這方面的運用,但請勿用做任何形式的商業營利行為。希望這些寶貴的資料能更方便地被大家運用,也請有使用的朋友能將發現的瑕疵、錯誤反應給我知道,以利我後續的修正。




【註①】在辭典中若使用了「全宋體」的補充漢字,我一律標示為紅字,以提醒使用者注意。這些補充漢字並非 Unicode 官方訂定的通用標準,故於論文、著作一類的正式場合引用辭典內容時,請特別小心處理、標註,以免參閱者看不見該補充漢字。



3 則留言:

  1. 这本实测在GD上无法显示图片,解包发现是UTF-16编码,为何改成UTF-8编码重新生成mdx和mdd不行呢?求指点

    回覆刪除
    回覆
    1. 由於很多軟件對UTF-8的編碼處理都存在或多或少的問題,容易產生亂碼造成資料毀損,所以我的製作一律採用UTF-16編碼。生成的辭典,在 MD 之下效果沒有差異,體積也幾乎相同,不會膨脹兩倍。

      若是要改成UTF-8的編碼,我記得辭典文本與 style 都要改成UTF-8「沒有 BOM」的編碼才行,編譯軟件並不接受「有 BOM」的UTF-8編碼,會有問題,您可以試試。

      刪除
    2. 好的,了解了,谢谢!!

      刪除