2015年12月6日 星期日

教育部《成語典》離線辭典

☆ 2023/10/13 累積修正更新,原連結請重新下載。
前幾天發現教育部對《成語典》的授權方式做了更新,原來教育部在上個月月初,又修訂了相關國語辭典的授權方式:

授權參見:教育部國語辭典公眾授權網
中華民國教育部《重編國語辭典修訂本》、《國語辭典簡編本》、《國語小字典》與《成語 典》相關資料採「創用CC-姓名標示- 禁止改作 臺灣3.0版授權條款」釋出。 本授權條款允許使用者重製、散布、傳輸著作(包括商業性利用),但不得修改該著作,使用時必須遵照「使用說明」之內容要求。

《成語典》終於也加入了授權釋出,原始資料同時提供下載。教育部終於聽到了大家的聲音,採取了更開放的做法,實在值得讚許。

一直以來受惠於教育部《重編國語辭典修訂本》這部優秀的辭典,所以一直想將我自己轉製的相關 MDict 離線辭典,分享、推薦給大家,讓其他的閱讀人也能像我一樣受惠,無奈沒有取得授權,實在不敢輕易 "以身試法"。現在教育部終於開放了公眾授權,我的離線版辭典也就可以 "名正言順" 地公開發布了。


涇渭分明
注音ㄐㄧㄥ ㄨㄟˋ ㄈㄣ ㄇㄧㄥˊ拼音jīng wèi fēn míng近義:黑白分明、壁壘分明反義:不分皂白、是非不分、涇渭不分關聯涇渭不雜涇渭斯明涇渭自分涇渭了然涇渭自明
【釋義】涇水流入渭水時,清濁不混,界限分明。語本《詩經.邶風.谷風》。後用「涇渭分明」比喻彼此的區別非常清楚。△「壁壘分明
【典源】▶ 《詩經.邶風.谷風》行道遲遲,中心有違,不遠伊邇,薄送我畿。誰謂荼苦?其甘如薺。宴爾新昏,如兄如弟。以渭濁,湜湜其沚。宴爾新昏,不我屑以。毋逝我梁,毋發我笱。我躬不閱,遑恤我後  ① 涇:涇河,亦稱「涇水」,關中八川之一。源自甘肅省平涼西南的六盤山東麓;流入陝西省注入渭河,是渭河水系中的最大支流。② 渭:渭河,亦稱為「渭水」。源出甘肅省渭源縣西的鳥鼠山,東南流經陝西省,至高陵縣會涇水,又東流至朝邑縣會洛水,注入黃河。③ 湜湜其沚:河水靜止時,清澈見底。湜,音ㄕˊ,水清澈見底的樣子。沚,音ㄓˇ,水中小塊陸地。④ 宴爾新昏:形容新婚甜蜜的生活。宴,快樂。昏,通「婚」,婚姻。⑤ 不我屑以:不願與我共同生活。以,與、共。⑥ 毋逝我梁:不要拆掉我用以捕魚的土堰。⑦ 笱:音ㄍㄡˇ,竹製的捕魚器具。⑧ 我躬不閱:我尚且不能自容。躬,自身。閱,容納。⑨ 遑恤我後:沒有餘力再去憂慮我後代的子孫。遑,何、怎能。
【典故】涇水是渭水的支流,源出甘肅省而流入陜西省注入渭水,《詩經.邶風.谷風》中說:「涇以渭濁,湜湜其沚。」意思是說涇水和渭水,各有清濁,在涇水注入渭水時,仍然清濁不混,界限分明。在《初學記.卷六.涇水九.敘事》引《辛氏三秦記》及《山海經注》提到:「涇水出安定朝郡縣西幵頭山,……與渭水合流三百里,清濁不相雜。」由此可見,自古即有涇、渭之清濁不相雜的說法,然而古時對於涇、渭二河的清濁,一直存在兩種說法,一說涇清渭濁,一說涇濁渭清。清末學者譚嗣同對此做過仔細的觀察,認為河水的清濁,是隨著季節時序而改變的,他在《石菊影廬筆識.學篇》中說:「留心覘之,夏秋二水皆濁,冬春二水皆清,合流處亦隨時清濁,……豈可據為常清濁哉?」所以涇水和渭水的清、濁,並沒有一定,是隨著季節以及二河水位上升或乾枯而有所變化。後來「涇渭分明」就從《詩經》的「涇以渭濁,湜湜其沚」這裡演變而出,用來比喻彼此的區別非常清楚。
【書證】① 《喻世明言.卷一〇.滕大尹鬼斷家私》:「原來梅氏平生謹慎,從前之事,在兒子面前,一字也不題,只怕娃子家口滑,引出是非,無益有損。守得一十四歲時,他胸中漸漸涇渭分明,瞞他不得了。」② 明.畢自嚴〈釐剔十款疏〉:「益操守潔者,無不愛其黎民;而生聚繁者,斷難幾之墨吏,良有以也。邇者計典方行,旌異懲貪,涇渭分明,恩法罔貸。大小臣工,諒各洗心震疊之下矣。」③ 明.雷思霈〈瀟碧堂敘〉:「石公胸中無塵土,氣慷慨,大略以玩世涉世,以出世經世。姱節高標,超然物外而涇渭分明,當機沉定有香山眉山之風。」④ 清.盧文弨〈公祭汪容甫文〉:「君實不狂,而眾曰狂。皮裏春秋,涇渭分明。彼妄男子,號召群愚。如羶集蟻,如矢叢蛆世。奉尊奢,君實唾弃。」⑤ 《江西通志.卷七一.人物志.傅孟春》:「傅孟春,高安人,嘉靖進士。授常州府推官,累官刑部侍郎。先是督北畿學政,時尚操切,孟春獨以寬著。……生平和易,若於世油油然而中實涇渭分明,有大臣之度。」
【用法】  比喻彼此的區別非常清楚。  用在「區隔清楚」的表述上。  ① 這兩個產品一經比較,品質立即涇渭分明,各自的優劣表露無遺。② 老許認為真假、善惡、美醜,這些價值觀都是涇渭分明,不容混淆的。③ 東南亞的國家幾乎看不到涇渭分明的四季,有的只是熱度的高與低而已。④ 參加這次比賽的隊伍強弱涇渭分明,水準可說是近年來最參差不齊的一次。⑤ 他律己甚嚴,對於所經手公款以及私人款項的處理,一向涇渭分明,不曾公私不分。
【辨似】  「涇渭分明」及「壁壘分明」都有區分得很清楚的意思。  「涇渭分明」側重於彼此的區分清楚;「壁壘分明」則側重於雙方的立場對立。
涇渭分明壁壘分明辨似例句
這兩個產品一經比較,品質立即~,各自的優劣表露無遺。
關於是否在此地設置觀光賭場,支持與反對雙方~,互不相讓。



發布之前,我調整了一下 "關於詞典" 的內容,明確標示出了資料的版本、出處、授權條款以及著作權歸屬,相關的網站聯結也都附上,在此遵循「創用CC-姓名標示-禁止改作臺灣 3.0 版授權條款」分享出來(我對這些授權的法律規定不算熟悉,若有疏漏不妥之處,尚請熟悉相關規定的朋友指正),希望這些寶貴的資料能更方便地被大家運用,也請有使用的朋友能將發現的瑕疵、錯誤反應給我知道,以利我後續的修正。

下載連結:教育部成語典.zip教育部成語典(附錄).zip (請依照教育部的授權規定使用)

關於我轉製教育部《成語典》離線辭典的前因後果,請參見:教育部成語典

補充說明:
在版本的標示上,由於我製作的版本是兩年前擷取的資料,尚未與教育部國語辭典公眾授權網裡,版本編號為 2014_20151102 的原始資料比對。我想既出於善意使用,教育部應該不至於會為難於我,暫時標示版本編號為 2014_20151102,但內容保持為我當初的製作,並註明資料的擷取時間為2013年12月初,待以後釐清再行更正。


21 則留言:

  1. 您好,請問「2018/05/29 小幅修訂更新」,大致更新了哪些內容呢?因為如果差別不太大,敝人就直接續用舊版了。謝謝!

    回覆刪除
    回覆
    1. 應該是些許格式調整、少數錯字訂正之類,時間久了,我也記不真切,差別應該不會太大。

      刪除
    2. 這部成語辭典,收詞精審,適合作為一本書去閱讀,不知您是否可以將其轉為一本直排epub或pdf書籍,若可以將不勝感激。

      刪除
    3. 您好,目前似乎沒有適合的工具可以直接做這樣的轉換。當然要做也不是不行,得花時間去手工處理,只是我目前最缺的就是時間,排定要處理的資料大概幾年也消化不完了,呵呵!《成語典》官方網站裡直接就提供有線上電子書(http://dict.idioms.moe.edu.tw/cgi-bin/cydic/gsweb.cgi?ccd=.AODDn&o=e0&sec=sec5&ebook=1&init=1&active=ebook),排版很精美,適合您提的閱讀方式,不妨參考看看。

      刪除
  2. 在Goldendict 上發生錯誤,不能使用;上一版的則無此問題。

    教育部成語典摺疊條目查詢錯誤:Failed loading article from C:\MDictPC\doc\教育部成語典.mdx, reason: Dictionary file was tampered or corrupted

    回覆刪除
    回覆
    1. 您好,我用慣了 MDict,幾乎沒有使用 GoldenDict。經您提及,我特別用手邊有的 GoldenDict(1.5.0-RC2 基於 QT 5.6.0) 測試了一下,一切正常,沒有您說的錯誤發生。

      從訊息看,會不會是辭典檔案毀損?您有重新下載試過嗎?由於少用,不夠熟悉,我也不知道如何幫您排除問題,可能要麻煩您多試試。或許暫時排除其他辭典只加成語典,或是重新加入、重新索引等等。

      刪除
    2. 下載了幾次,還是發生錯誤,最後把檔名換成英文就通過了。從來沒遇過的情況,不影響使用就不計較了。

      多謝!

      刪除
    3. 聽起來可能跟您使用的 GoldenDict 版本有關,似乎對中文的支援度不好。我記得早期一些軟體對中文的支援不佳,遇到一些特定的中文字就會出事,好像成功的 "成" 字就是其中之一,或許 "成語典" 這個名字也是因為這個因素造成問題,您若有興趣研究不妨改不同的字測試看看(或把其他辭典故意改成這個名字)。當然根本的解決方法,可能還是換個沒有問題的 GoldenDict 版本才能一勞永逸。

      刪除
  3. 不知作者是否熟悉如何添加简体索引,能否制作简繁索引的版本,造福两岸语言爱好者,感激不尽!!

    回覆刪除
    回覆
    1. 您好!添加簡體索引,技術上是沒有任何困難,我比較好奇的是,MDict 不是已經支援簡繁通查了嗎,只要將 "使用智能中文查找(自動使用簡/繁體進行查找)" 的選項勾上即可,辭典不須加任何的簡體或繁體索引,查詢時自動就能查簡得繁、查繁得簡。如果您還不知道此功能,建議您趕緊試試,據我所知 GoldenDict 也有類似功能。希望這項資訊對您有所幫助。

      刪除
    2. 感谢您的回复!!简繁自动转换查询功能在一些软件里确实有自带,但如果开启此功能的话,很多其他带简繁索引的词典就会重复显示两个结果(一个是索引指向的结果,一个是经过此功能转换得到的结果),会造成一些不便。目前mdict中文词库已有很多是自带简繁索引,因此不得不关掉此功能以避免杂乱。加之软件自带的简繁转换有时并不准确。还望能考虑一下~~ 不过我自己不太清楚制作简繁索引所需的时间和精力投入几何,如有冒犯还请见谅~~

      刪除
    3. 您說的 "重複顯示兩個結果",在 MDict 應該不會發生才對,MDict 的作者 R 大曾經跟我聊過他處理這問題的邏輯,我也提供過一些建議與測試,所以略知一二。MDict 並不會產生另一個轉換的結果,而是在查詢的比對過程中做處理,您大可以放心開啟此功能,若真有您說的現象,請詳細告知配置的情形,我可以回報給 R 大,請他協助修正。

      製作簡繁索引,需要花費的時間倒是不多,主要是我製作的辭典都長期有在進行訂正維護,所以我不喜歡有多個版本並存,那會增加維護的負擔,我自己並不會用到簡繁索引,所以製作了勢必得另立版本,這不利於維護,這才是我主要的考量。

      您可以先試試 MDict 的簡繁通搜功能,若是真不能達到您的期待,我們再來討論,看怎樣才能提供給您協助。

      刪除
    4. 我是用的goldendict,手机端用的Bluedict(深蓝词典),这两个软件带的简繁转换功能都会产生重复显示两个结果的问题。经过多次使用对比,个人感觉mdict在功能性和易用性上还是不如goldendict,手机端也是经过比较,最终选择了Bluedict~~ 我先试试 Mdict 的这个功能吧~~ 我想如果可以,今后只维护一个简繁通搜的版本,这样适用面可能更广些吧~~

      刪除
    5. 我尝试了下,mdict自带的智能中文查找确实好用,不过我只加载了十本词典,查了几个词,软件就闪退崩溃了~~~

      刪除
    6. 您的使用體驗正好跟我相反,呵呵!我用 GoldenDict 的體驗通常不會太好(雖然功能較多)。加了簡體索引,對繁體的使用者來說,正類似您所感到困擾的情況 --- 每個詞條都會看到一繁、一簡的索引,對使用者來說也是一種干擾,所以原則上我不會維護這樣的一個版本。

      我的 MDict 裡,單一群組就加載了近百本自己製作的辭典,全部表列總和更超過了五百本(MDict 有500本的上限限制),並沒遇到您說的現象(當然 MDict 還是有 BUG 的,平均幾個月偶爾會遇上一次閃退,重啟就又正常,無法重現),如果您遇到的現象是可以固定重現的,建議到論壇裡詳細向 R 大描述狀況,可以幫助他進行除錯。

      據我所知,論壇裡已有其他朋友替《成語典》加了簡體索引,您可以參考使用。或者,若是您懂得如何自行重製,或許我可以提供額外的簡體索引給您,由您自己加以處理。

      刪除
    7. 事實上我剛剛花了不到五分鐘,就把《成語典》的簡體索引做好,5153 條成語中有 3832 條需要加上簡體連結,其餘 1321 條簡、繁無別,無須跳轉。如我上面所述,若是您懂得如何自行重製,我可以提供這個額外的簡體索引給您,由您自己加以處理。

      刪除
    8. 感谢辛苦制作!成语典的主词典已找到添加简体索引的版本,成语典的《附录》部分有几万词条,这部分似乎没有简体索引的版本。另外据我个人体验,举两个mdict不太易用的地方:第一,添加词典的步骤较为繁琐,为词典排序时不能用鼠标直接拖移,也不能选中多个词典一起拖移,而且页面渲染引擎应该用的是IE内核,而不是chrome的webkit,页面加载性能效率较差。goldendict我目前用的是官网最新32位的版本,目前一切使用良好,具体版本号为:1.5.0-RC2-372-gc3ff15f,Qt 5.12.3 (GCC 7.3.0, 32 位)。64位的版本根据以往的体验,有时会发生闪退。goldendict同时加载多部词典的结果时,明显要快速很多。仅供参考~~

      刪除
  4. 教育部國語辭典公眾授權網三月底有更新一次資料了。
    https://resources.publicense.moe.edu.tw/index.html

    回覆刪除
  5. 请问 教育部成語典.mdx 的大小只有3.23M吗? 教育部成語典(附錄).mdx 的大小只有4.42吗?

    回覆刪除