2021年7月13日 星期二

《學生字典》

☆ 2023/10/13 累積訂正更新,原連結請重新下載。

記得還在念小學時,每年導師都會從班上選出一位小朋友做模範生,統一提報到學校匯總,然後校長就會在朝會上公開表揚,並頒發獎狀、獎品。念小學的六年裏,我就有三年當選了模範生,所以拿了不少獎品,呵呵!在那個相對沒那麼富裕的年代,獎品通常也不會是什麼貴重的東西,很多就是印有縣長啦、地方議員啦敬贈的毛筆、硯台、墊板、鉛筆盒等文具用品,最貴重的應該就屬是一本燙金精裝的國語字典了。今天要介紹的,就是一本學生時代的字典,但不是我的學生時代,而是我的上一代、再上一代,民國初年時期的一本字典——《學生字典》。

由陸爾奎、方毅先生主編的《學生字典》,是由上海商務印書館發行的一本小型字典,定位是給學生和一般大眾使用,因此規模不是很大。但自民國四年開始發行,至民國十九年就已經歷經一百零一刷,可見這本字典在當時的影響之大。陸爾奎、方毅兩位先生同時也是《辭源》的主編,這本《學生字典》可以說就是由《辭源》精簡而成,不過它也增添了一些《辭源》沒有的素材。字典共收字頭八千餘字,後經多次增訂、再版復刻。

很多年前這本字典的文本數據就在日本的漢字データベース網站,以開源的形式公開。我看不懂日文,只能透過 Google 翻譯大概知道,原始的數據是由電脳瓦崗寨的站長自費請人由 1915 年發行的復刻本轉製而成,在所有者許可的情況下發布出來。

原始的數據瑕疵很多,更有近一千八百餘處無法輸入(或是 OCR 無法識別)的漢字以黑方塊替代,我手邊並沒有這本字典的書影,根本無法還原這些黑方塊,讀起來坑坑巴巴地實在彆扭,因此多年來這份數據一直堆放在硬碟的一個角落,並沒有加以應用。

四月初,偶然在網路上找到一份還算清晰的民國四年發行的《學生字典》掃描書影,這讓我又想起了這部老字典,於是趁著空檔開始了整理的工作。

首先我先把原始文本利用正則處理轉換成 MDict 的詞條格式,修正所有不規範的地方,並初步加以排版。然後依書影編製頁碼索引,為每個字頭加上「開卷條碼」,以便隨時可以快速對照書影。之後就開始慢慢逐頁比對,將所有字頭校對一次。所有用字儘量依原書字形,被替代成現代通行字形的一一改回去。由於數據所依的 1915 年復刻本是經過增修過的,與民國四年發行的初版略有差異,我的處理原則是:增訂者不刪,加上新增的註記。刪除者補回,手動打字補上。調動順序者,依書影移回原順序。總之就是儘量依初版原狀,但增補內容不予刪除。

花了兩週時間,把字頭全部清理完畢,並且將所有缺字的黑方塊全數還原。實得初版字頭 8335 個,復刻版新增字頭 206 個,共計 8541 個字頭。由於沒有復刻版的書影,屬於新增字頭的缺字我只能從釋義、部首來推測還原,無法保證一定與紙本一致。另外將 5 個字庫沒有的缺字,造字補入字庫之中。至此,這部民國初年的老字典,大致就讓我給復原出來了。

字頭雖經我全面校對過一次,錯誤已少,但釋文部份我尚無力逐字校對,所以應該還存在有不少錯字。另書前還有一篇四頁的編輯大意,相當於字典的凡例,我也還沒有時間文字化(我打字實在太慢了)。若有仁人君子願意出手相助,將其打成文字提供,字典就更完整了,呵呵!

細看這部超過百年的老字典,其實還蠻有特色,釋義簡明扼要,少有贅言,尤其在各字頭下分列有七百多條「辨析」(原書以驚嘆號標示)細辨字形差異、正誤,是《辭源》所無,具有一定的參考價值。當然,百年來字形的標準還是迭有變化,所述與今時不見得一致,但它反映的正是那個年代的用字習慣與標準,細細追索,自有其風情。這部民國初年的字典正好也填補了《康熙字典》與現代字典之間百餘年的空隙,讓我們得以觀察到時間長河裏字典的流變。

請參閱一系列四篇「漢字使用環境的建置 ㈠ —— 顯示篇」、「漢字使用環境的建置 ㈡ —— 輸入篇」、「漢字使用環境的建置 ㈢ —— 辭典篇」、「漢字使用環境的建置 ㈣ —— 開卷篇」的說明安裝字型與相關工具,以利完整顯示和輸入查詢。字典中用到了不少目前 Unicode 尚未收錄的漢字【註①】,目前只有配合全宋體才能完整地顯示。


詞條總數:8780
字頭數目:8335(含 923 個附錄字)
新增字頭:206(含113 個附錄字)
序跋附錄:2
連結數目:245
下載連結:學生字典.zip學生字典.pdf

在清理完《漢字海》與開始清理《中華字海》之間的一個空檔裏,我獨力完成了這部復刻版的《學生字典》。出版已逾百年,這部《學生字典》應當已經進入公共領域,不再受著作權之限制,現在無條件地公開分享出來,樂見學術研究、教育工作、個人閱讀這方面的運用,但請勿用做任何形式的商業營利行為。希望這些寶貴的資料能更方便地被大家運用,也請有使用的朋友能將發現的瑕疵、錯誤反應給我知道,以利我後續的修正。

最後,將一些製作過程中記錄的工作日誌附在這裡,做為一個回憶與紀念:

  • 2021/04/07 將原始數據轉換成 MDict 格式,並初步完成排版。未輸入的缺字以 ■ 表示,有 1781 個。
  • 2021/04/09 依據民國四年的《學生字典》初版,完成頁碼索引。數據中有一千多個黑方塊,落在字頭的約六百多,多半是附錄字,多是些俗寫,現在可以直接「開卷」了,對照比較方便,等有空再來慢慢還原。
  • 2021/04/12 字頭的缺字已經還原了一大半,還剩 300 個。
  • 2021/04/20 字頭清理完畢,初版字頭共 8335 個,復刻版新增 206 個字頭。由於沒有復刻版 PDF,新增字頭的缺字只能從釋義、部首來猜測還原,無法保證一定與紙本一致。新增 5 個補充字。
  • 2021/04/23 缺字的黑方塊全部還原完畢。
  • 2021/04/26 最後的修整完成。



【註①】在辭典中若使用了「全宋體」的補充漢字,我一律標示為紅字,以提醒使用者注意。這些補充漢字並非 Unicode 官方訂定的通用標準,故於論文、著作一類的正式場合引用辭典內容時,請特別小心處理、標註,以免參閱者看不見該補充漢字。



4 則留言:

  1.    ◎檢查注意
    一、字體有因正俗混用、形態類似,玫難檢索者,
      如「壻」字從「士」不從「土」、「延」字從「廴」亦從「辶」。
      初學者,如先檢「土」部、「辶」部不得,當再於「士」部、「廴」部檢之。
      餘可類推。 茲將昒混之部,列於左‥
        人入 刀力 匚匸 冖宀 冫氵 冖冃 厂广
        㔾己 卩阝 土士 廴辶 弋戈 大犬 夕歹
        日曰 爪瓜 欠攵 禾示 白自  网罒  目耳
        𤴔足 皿血 革韋 門鬥 月冃 攴支文 襾网雨
    二、難檢之字,所屬部首不時時,可依畫數,於檢字中索之;
      惟遇連晝之字,如亞兕等,均為八畫,而初學計算,時有出入,致檢索不易。
      凡遇此類字,須於前後數晝中求之。
    三、部首凡二百餘,不易記憶,初學者,宜常加瀏覽,部首之有無、次序之後先,
      了然胸中,檢查自易。

       ◎編輯大意
    一、本書專供兩等小學及中學以下學生檢查之用,故名《學生字典》。
    二、部定小學國文教科用字,共四千有餘。
      其他科目所應用者,不在此限。
      前讀音統一會,曾選定七千餘字,謂足放中學以下之用。
      本書根據此數,亦以七千數百字為率,惟去取之間,互有出入,
      一以切於實用為主。
    三、本書以小學適用為目的,解釋務求淺顯,凡生僻字義,概不闌入,
      故視他種字典,頗多簡省;惟字義之出引伸假借,有通俗習用,
      而不求甚解者,不憚反覆引喻,期得真詮。
      而關於科學上之應用,注解尤不厭其詳。
    四、《說文》每字之下,往往弔一古籍,以證其義。此後遂沿為字書通例。
      本書以便初學起見,引證多用成語,不據經典。惟助詞之類,非成語能顯其意味者,除四子書、詩經外,亦罕引用。
      至子義單簡,無須引證者,概不強贅。
    五、字典與詞書不同,故本館前出新字典,凡兩字以上名詞,皆不列入。
      本書取便初學,重應用而不拘體裁。
      凡信札及淺近文言中,習用成語,間亦附入,俾收觸類旁通之益。
      閱者幸勿以掛一漏萬,責以自亂其例也。
    六、古人反切,皆依等子、韻攝,以求雙聲、疊韻,不限喉音之字,
      故上一字收聲,以下一字發聲,往往自相衝突,難以貫讀。
      音韻闡微,始用合聲之法,反切與拼音相通,最便初學。
      且時代極近,音易較確。
      本書所用切音,凡有直音可貼,或四聲可紐者,其反切概行省去。
      惟可貼之字,生於原字,則伋用反切,皆以闡微之今用、協用為準。
    七、吾國方言不同,讀音每至歧出,其病不在貼音與反切之不密,
      在所貼之音,讀法仍不一致。
      前教育部,設讀音統一會,創制簡母,并附歐文拼法。
      會員王樸,集以成書。
      按近世所出英文切官音之書極多,最通行者,有‥
       Stent, Baller, Williams, Made 等五家。
      而尤以Made氏所著者為特長。王氏所集拼音,大半與之相合。
      故本書據以附入。
      雖七音清濁,分辨未細,亦可與切音,互相參證。
      且高小已授英文,拼法自所素習,則於讀音統一之事,或可收效於萬一也。
    八、本館前編新字典,於切音下,皆贅韻部,一以《佩文詩韻》為準,
      取其在近世社會中,最占勢力。
      惟學校並無詩詞課程,韻書自非學生素習,
      故本書一律刪去,逕用四聲,以免周拆。
    九、字體為事物符號,以能統一為貴。今日行楷通行,小篆齊書,類多不講。
      然俗書訛字,充滿行間,亦非學子所宜。
      本書所用字體,不拘正俗,專以通行為主。
      惟略仿《佩觿字鑑》之例,於筆畫之沿誤、形態之相似者,
      隨時指辨,以初學,習字之惜鑑,決非高談六書也。
    十、古俗字體,與正文兩見者,仍附錄於每部之後,俾便檢查。
      惟過於俚俗之字。如「雞作鳮、聖作圣」之類,
      非學生所應用者,仍不附入,以免誤會。

    回覆刪除
    回覆
    1. 感謝阿文兄百忙之中出手相助,呵呵!「編輯大意」先前西風兄已經提供,我把「檢查注意」再校對、訂正一遍,加進字典。已經更新上傳,原連結重新下載即可。

      刪除
  2. 谢谢制作,没看到下载链接

    回覆刪除
    回覆
    1. 呵呵!您沒仔細看內文喔,就在倒數幾段的統計資料那裡有下載連結。

      刪除