2018年5月29日 星期二

漢字使用環境的建置 ㈢ —— 辭典篇

閱讀工具


閱讀書籍,尤其是一些古籍經典、文學名著,最重要的一項工具莫過於一部好的辭典。有了好的辭典做為輔助,讀起書、做起研究來都可以事半功倍,讓閱讀、研究都能真正充滿樂趣。但什麼是好的辭典呢?我覺得除了內容要詳實可靠之外,還要能靈活組合、方便查閱才行。

數位辭典


在我構思的「數位化閱讀環境」裡,「數位化的辭典」佔有重要的一席之地。因為它能方便地大量查閱,還能快速地摘錄、引用做成筆記,這點,傳統的紙本辭典做不到。若用傳統的紙本辭典來輔助閱讀,一個早上大概查不了幾個字詞、讀不了幾頁書,兩者的差距,幾乎不可以道里計。

所以在幾年前初讀詩經時,我便開始布置「數位化辭典」的這一塊,時至今日,大大小小的各式中文數位化辭典,已經累積製作了兩百餘部,成為我閱讀時的一項重要工具。

辭典平台


目前能開放離線使用的「數位化辭典」平台,早期有星際譯王(StarDict),後來陸續又有靈格斯翻譯家(Lingoes)、Babylon,近期則以 MDict、GoldenDict 較為知名。

我選擇了大陸網友張文偉先生開發的 MDict 做為我的「數位化辭典」平台,一來它是可以免費使用的辭典平台,二來它的辭典內容完全可以自行製作,能包含圖片、文字,彈性極大。就這樣,我在這個平台之上,製作了一部又一部的數位化辭典,提供給自己極大的便利。現在把這個使用經驗也介紹給大家,希望有所助益。

環境布置


首先請到 MDict 的官網下載 MDict 程序,目前最新的 Windows 版本為 2.0.5。MDict 另有 iOS 及 Android 的版本,不過不在本篇的討論範圍之內,略過不提。

建議先建立一個「辭典」專用資料夾,然後將下載得到的壓縮檔直接解壓縮到該資料夾中(MDict 並不需要安裝,算是一款綠色軟體)。看一下 "辭典\MDictPC" 資料夾下,應該會有一個 "MDict.exe" 檔案,這就是它的主程式,不過先別急著執行它,我們還沒準備好辭典內容。

在「辭典」專用資料夾下,建議再建立一個「MDict詞庫」資料夾,專門用來放置辭典檔案。拿我製作的《教育部重編國語辭典(第五版)》、教育部《成語典》為例,請參考 教育部重編國語辭典(第五版)教育部《成語典》離線辭典 這兩篇,下載取得 "教育部重編國語辭典(第五版).zip"、"教育部成語典.zip",直接都解壓縮到「MDict詞庫」資料夾下,這樣辭典內容就準備好了(若有其他的辭典檔案可一併放置進去)。

導入辭典


現在可以執行 MDict 的主程式,選擇功能表上的「詞庫 \ 詞庫管理」,再選擇「導入詞庫」,點「瀏覽」將資料夾切換到 "辭典\MDict詞庫",再按「確認」,這樣所有的辭典便能一次性全部導入。

若是之後還有新辭典要加入,拿我製作的《教育部成語典(附錄)》為例,下載取得 "教育部成語典(附錄).zip",一樣丟進「MDict詞庫」資料夾下,選擇功能表上的「詞庫 \ 詞庫管理」,再選擇「加入詞典」,切換資料夾找到要加入的新辭典,再按「開啟舊檔」,這樣就能完成加入。

若對辭典的排列順序不滿意,可以選取想要調整的辭典,再利用「向上移」、「向下移」兩個按鈕來調整該辭典的排列順序(通常會把常用而重要辭典排在前面),直到都滿意了為止,按下「完成」來結束辭典的導入設定。

切換辭典


選擇功能表上的「詞庫」,這次會看到我們已經導入的辭典表列,點選想查詢的辭典,這樣就可以開始使用了。

查詢檢索


在淺藍色的查詢列上輸入想查詢的字詞,或是由左邊的詞條表列裡直接選取,都可以檢索詞條的內容。若是覺得顯示的字太小,可以點選一下然後用 Ctrl+滾輪 來調整(左邊的詞條表列與右邊的詞條內容可以分別調整喔)。

MDict Windows 版一直有個小 BUG,就是上圖中紅色箭頭指處的一段多餘空白區域。很多人可能以為本來就是如此設計,但事實上卻是原作者的一個小失誤。在 "MDictPC\res" 資料夾下有個 "html_begin.html" 檔案,它的作用是內容頁面的框架樣板,原始檔案的編碼為有 BOM 的 UTF-8 格式,但可能是程式沒處理好的關係,BOM 被當成顯示字元,因而造成此現象。解法是將編碼格式改成沒有 BOM 的 UTF-8 格式,即可消除此現象。
多餘的空白區域不見了,是不是順眼多了!也節省了寶貴的內容頁面顯示空間。

如果您弄不清楚什麼是檔案編碼,我提供了一份改好的檔案(html_begin.html),請下載解壓縮後直接覆蓋原檔案即可。(2018.12.10 EDIT:新版已經沒有此問題。)

聯合檢索


除了單本單本地檢索外,數位辭典的真正強大之處,在於可以將多部辭典聯合起來檢索。請選擇功能表上的「詞庫 \ 詞庫管理」,雙擊那個 "All" 群組(或是利用「新建分組」新增一個群組也可以)以進入該群組,再選擇「加入詞典」,利用前面提過的新增辭典程序,將所有辭典都一一加入此群組,最後再按下「完成」即可。
現在切換辭典到 "All" 群組,輸入查詢的字詞,就可以看到包含了多部辭典的查詢結果。這種形式的應用,等同於將幾乎無限多部的各式辭典(只要您擁有)組合成一部超級大辭典,讓查詢不再侷限於單一部辭典的範圍,這是現下任何一本紙質辭典、任何一個辭典網站所做不到的事情。

利用相同的技巧,我們可以建立各式各樣的群組(例如:中文辭典、英文辭典、百科辭典等等),將不同屬性的辭典分門別類地加以交叉組合,以應付不同情境的查詢需求。

全文檢索


除了按詞頭檢索內容外,我們也可以對整部辭典進行全文檢索。不過截至目前為止,MDict 仍僅能對單部辭典進行全文檢索,不能對整個群組進行全文檢索,這是美中不足之處。請切換辭典到某個單部辭典,選擇功能表上的「工具 \ 全文搜尋」,輸入搜尋的關鍵字,按下「搜尋」。
這樣就可以看到搜尋的關鍵字被「反白」標示起來,按 F4 可以繼續往下搜尋,直到遍歷整部辭典為止。
透過這個方式,我們便可以對辭典的內容進行全文檢索,取得更全面的檢索結果。

後記


這一篇心得分享我斷斷續續寫了好幾個月,不是「難以下筆」,而是「心有障礙」,呵呵!自己每天使用、認為理所當然的事,要鉅細靡遺、圖文並茂地寫下來,一想到就發懶;但不清清楚楚地交代一些細節,估計剛想走入這個環境的朋友一定會遇到困難。這兩個念頭就這樣不停地拉扯,寫了又停、停了又寫。好不容易,趁著一批辭典的製作告一段落之際,逼著自己一鼓作氣把這篇「數位辭典」心得寫完,總算是鬆了一口氣。

請朋友們不必私下向我索取辭典,沒有授權疑慮的辭典(就像《教育部重編國語辭典》、教育部《成語典》、《臺灣樹木解說》等等),我一定都會陸續地公開分享出來;有可能有侵權疑慮的辭典,即使索取我也不會隨意發送、散布。讓這些資料發揮最大的價值一直是我心所願,但資料來源方的權利我也會予以尊重。

接下來還有計畫中的「漢字使用環境的建置 ㈣」要寫,陸續也會將我製作的離線辭典介紹給各位,請大家繼續期待。



4 則留言:

  1. 在 "MDictPC\res" 資料夾下有個 "html_begin.html" 檔案

    想當初為一勞永逸
    動這裏面的設定
    被Sky66說了幾句

    回覆刪除
    回覆
    1. 呵呵,我一字未動,只是改了檔案的編碼方式。

      刪除
  2. 阿兄
    左欄(辭頭)的字體要怎麼改

    回覆刪除
    回覆
    1. 詞頭表列的字體好像沒法改,固定會調用系統字體。

      刪除