2014年11月18日 星期二

國際電腦漢字及異體字字典

隨著兩年多來閱讀詩經的持續進行,我對這些古老詩歌的閱讀深度也自然而然地逐步加強。有時候我會翻遍手邊所有的辭典,只為了對某一個單字或複詞的意義有更深入的理解。這時候,我自己收集製作的七、八部離線辭典通常就能幫上大忙,讓我可以方便、可靠地查到我想要找的資料。不過現有的幾部主力辭典基本上收字都侷限在 BIG-5 碼定義的一萬三千多字(例如:教育部重編國語辭典修訂本---單字 11199、遠流活用中文大辭典---單字 10417、漢語大詞典3.0---單字 13069),許多古籍裡的異體字、罕用字就幾乎都查不到,這也讓這個有力的閱讀輔助工具總有那麼一點美中不足。

2014年9月1日 星期一

全宋詞典

在收集整理全唐詩資料的同時,我同時也在收集宋詞的相關資料。體例上參照《全唐詩》的《全宋詞》收有宋詞兩萬餘首,我當然也就比照辦理,以它為出發點,開始整理宋詞的資料。經過數個月的蒐集整理,以正體的繁體中文為篩選目標,淘汰掉 簫堯『中國詩苑』《全宋詞》 一類充斥簡體轉繁體痕跡的多個版本後,最終只留下了 網路展書讀 的 唐宋詞全文資料庫 一個版本。

2014年8月25日 星期一

全唐詩典

常常在閱讀一些散文或文學小說的作品時,會讀到作者引用某一段古詩詞來烘托文章的情境與意象。若是我未曾讀過的詩詞,又覺得頗為喜歡,這時我就會想去找出它的全文與出處,做一些延伸性的閱讀。紙本的唐詩三百首、千家詩、宋詞選輯等詩詞欣賞一類的書我也有好多本,但真要查找一首不知何名的作品,還真不知道該從何找起。當然 Google 的搜尋引擎常能幫上忙,但線上有的詩詞資料,簡體的內容占了絕大多數,資料的正確性、嚴謹程度也常值得懷疑。於是我想:如果有一部可靠的數位化的 "詩詞" 辭典,能在我有需要的時候快速而方便地查找詩詞,那該有多好啊!

2014年8月16日 星期六

教育部重編國語辭典與詩經前105篇相關之勘誤 (續增至166篇)

這個週末讀到了詩經的第 105 篇 --- 齊風的載驅,這仍是一篇諷刺文姜與齊襄公淫亂的詩歌。但是在閱讀查詢相關資料的過程中,無意間卻發現了教育部重編國語辭典裡一個不算小的連環錯誤,於是就把讀詩經以來,累積發現的教育部重編國語辭典與詩經相關之錯誤做個勘誤整理,自己留存備忘,也讓有使用這部辭典(以及其衍生的相關辭典,例如萌典)的朋友做個參考,讓這些錯誤的資訊能早日得到更正,不再繼續誤導流傳。

2014年6月27日 星期五

遠流活用中文大辭典

為了幫助一位想自力彙編開放辭典的朋友收集辭彙名稱,特別將我手邊已整理好的幾部離線辭典的辭彙名稱(僅含名稱與注音不含釋義內容)給轉換出來相贈。聽聞他以純手工複製、貼上在收集 遠流活用中文大辭典 的辭彙名稱,我實在佩服他的毅力且心疼,於是再度下海,快速地調出以前的程式進行修改,花了幾天的時間便完成了線上資料的擷取收集,並將其中的所有辭彙名稱轉出,一併相贈。經他比對,他的手工作業還是給漏了兩千餘條辭彙名稱,人工終究還是比不上機器呀!

雖然原先是為了友情相助,但既然資料都已經收集好了,接下來就順手把它整理成離線辭典吧!於是兩、三天後這部 "遠流活用中文大辭典.mdx"(約 4 MB) 離線辭典就誕生了。