tag:blogger.com,1999:blog-8083418832420346104.post6304693169100794663..comments2024-03-29T10:44:39.652+08:00Comments on WFG: 《教育部異體字索引字典》WFGhttp://www.blogger.com/profile/14004240365298046569noreply@blogger.comBlogger49125tag:blogger.com,1999:blog-8083418832420346104.post-85019846926266145892024-03-19T13:18:02.469+08:002024-03-19T13:18:02.469+08:00目前官網可能還在測試、調整,極不穩定,第七版一下上線一下又被撤下。我還沒時間比對數據有何改變,若如您...目前官網可能還在測試、調整,極不穩定,第七版一下上線一下又被撤下。我還沒時間比對數據有何改變,若如您所言官方刪除了某些字,除非這些字是訛字,否則全宋體應該不會加以移除。WFGhttps://www.blogger.com/profile/14004240365298046569noreply@blogger.comtag:blogger.com,1999:blog-8083418832420346104.post-37340848583130599582024-03-19T11:37:39.575+08:002024-03-19T11:37:39.575+08:00《教育部異體字字典》官方改版推出第7版,總字數從 106,330 字減少為 106,303 字,請問...《教育部異體字字典》官方改版推出第7版,總字數從 106,330 字減少為 106,303 字,請問被刪減的字在全宋體中會保留下來嗎?或是跟隨官網移除呢?yukihttps://www.blogger.com/profile/17279912001433539726noreply@blogger.comtag:blogger.com,1999:blog-8083418832420346104.post-54960355842326367292023-05-16T11:45:44.501+08:002023-05-16T11:45:44.501+08:00感謝您提供的資料,我比對了一 下,把差異列出來:
全宋體缺字 X13-1A 日本特用漢字表
X13-...感謝您提供的資料,我比對了一 下,把差異列出來:<br />全宋體缺字 X13-1A 日本特用漢字表<br />X13-1A-0023 木神=榊<br />X13-1A-0036 米刄=籾<br />X13-1A-0066 𩙿𥁕=饂<br />X13-1A-0077 魚神=鰰<br /><br />全宋體缺字 X13-1B 韓國特用漢字表<br />X13-1B-0015 文㇒乙=㐎<br />X13-1B-0046 者丶乙=乽<br />X13-1B-0060 加𠃌=㔖<br />X13-1B-0092 口者丶=啫<br />X13-1B-0131 斗𠃍=㪲<br />X13-1B-0132 斗㇒㇣=㪳*<br />X13-1B-0134 於𠃍=㫇<br />X13-1B-0138 者𠃌=䎞<br />X13-1B-0139 一厶木=𣏏<br />X13-1B-0151 龝=櫷<br />X13-1B-0198 ㇋聿丶=𢌤<br />X13-1B-0202 艹吉=䓀<br />X13-1B-0206 艹月=𧀎*<br />X13-1B-0214 豆㇄=䜳<br />X13-1B-0215 豆自穴口=𧰏*<br />X13-1B-0242 *𩙿達=𩟐<br /><br />某些含有「者」部件的字,韓國的字形「者」有加一點,兩岸的字形則無,但 Unicode 是同一碼。有加「*」的三字,字形與網站略有差異,是否能認同有待進一步求證,僅供參考。WFGhttps://www.blogger.com/profile/14004240365298046569noreply@blogger.comtag:blogger.com,1999:blog-8083418832420346104.post-70150871701014964992023-05-16T01:08:04.835+08:002023-05-16T01:08:04.835+08:00我在整理附收字時只取了字頭欄位比對,釋文內容我是忽略的
但統計數字差距這麼大,只可能是認定方式不同了...我在整理附收字時只取了字頭欄位比對,釋文內容我是忽略的<br />但統計數字差距這麼大,只可能是認定方式不同了,例如「爫」與「爫」<br />也可能是拆字習慣差異,像上面那字我拆「艹肀用」全宋體拆「艹肀月」<br /><br />我把手上資料傳一份上來,希望能對全宋體有幫助<br />教育部異體字字典字頭清單:https://cloud.freemdict.com/index.php/s/gzQYAeAfmNMt7WA<br />以下是我比對的結果,請對照 附收字表8 的部分<br /><br />全宋體缺字 X13-1A 日本特用漢字表<br />X13-1A-0023 木神<br />X13-1A-0036 米刄<br />X13-1A-0066 𩙿𥁕<br />X13-1A-0077 魚神<br /><br />全宋體缺字 X13-1B 韓國特用漢字表<br />X13-1B-0002 亼丨<br />X13-1B-0015 文㇒乙<br />X13-1B-0029 ⺾乃乙<br />X13-1B-0030 吐乙<br />X13-1B-0036 角乙<br />X13-1B-0042 坪乙<br />X13-1B-0044 松乙<br />X13-1B-0045 呼乙<br />X13-1B-0046 者丶乙<br />X13-1B-0048 馬乙<br />X13-1B-0057 人㇒尼<br />X13-1B-0060 加𠃌<br />X13-1B-0062 加業<br />X13-1B-0064 丨丶<br />X13-1B-0065 卯一一<br />X13-1B-0066 斜㔾<br />X13-1B-0071 𠂉丨口匕<br />X13-1B-0092 口者丶<br />X13-1B-0100 時口匕<br />X13-1B-0131 斗𠃍<br />X13-1B-0132 斗㇒㇣<br />X13-1B-0134 於𠃍<br />X13-1B-0138 者𠃌<br />X13-1B-0139 一厶木<br />X13-1B-0151 龝<br />X13-1B-0168 狂丶<br />X13-1B-0183 加立<br />X13-1B-0196 老味<br />X13-1B-0198 ㇋聿丶<br />X13-1B-0202 艹吉<br />X13-1B-0206 艹月<br />X13-1B-0210 虫糞<br />X13-1B-0214 豆㇄<br />X13-1B-0215 豆自穴口<br />X13-1B-0227 金主乙<br />X13-1B-0242 *𩙿達<br /><br />由於日韓古籍我不會接觸到,後續就全交由您的判斷<br />不管如何,能讓全宋體越來越完備我就達到目的了<br />再次感謝您製作了全宋體,造福世人~yukihttps://www.blogger.com/profile/17279912001433539726noreply@blogger.comtag:blogger.com,1999:blog-8083418832420346104.post-27195284379142521402023-05-15T15:47:34.572+08:002023-05-15T15:47:34.572+08:00更正:「韓國特用漢字表」缺 20 字。更正:「韓國特用漢字表」缺 20 字。WFGhttps://www.blogger.com/profile/14004240365298046569noreply@blogger.comtag:blogger.com,1999:blog-8083418832420346104.post-21093292284069788472023-05-15T15:26:51.795+08:002023-05-15T15:26:51.795+08:00可能是我們的認定不同,我這邊統計的結果是:「日本特用漢字表」共 85 字,無任何缺字(包含釋文)。「...可能是我們的認定不同,我這邊統計的結果是:「日本特用漢字表」共 85 字,無任何缺字(包含釋文)。「韓國特用漢字表」共 255 字,缺 19 字(釋文中另缺 2 字)。<br />1. 「艹肀用」即「𮏒」。我的拆分原則,部件間如果能不共筆,儘量不共筆。<br />2. 「門爪臼」即「𨶒」,「爫」與「爫」只是字形風格的差異,不影響對字的認定。<br />WFGhttps://www.blogger.com/profile/14004240365298046569noreply@blogger.comtag:blogger.com,1999:blog-8083418832420346104.post-84937638779151195392023-05-14T17:48:40.848+08:002023-05-14T17:48:40.848+08:00我清查結果是 日本特用漢字表」缺4個字,「韓國特用漢字表」缺36個字,反正很少會讀日韓的古籍就算了。...我清查結果是 日本特用漢字表」缺4個字,「韓國特用漢字表」缺36個字,反正很少會讀日韓的古籍就算了。<br />但是我發現「戶政姓氏用字表」也有2個字打不出來,如果未來全宋體能補上這2個缺字就好了。<br />1.艹肀用 *全宋體無找到<br />2.門爪臼 *全宋體有另一形但爪的方向不一致<br />圖片版:https://cloud.freemdict.com/index.php/s/8GJGdbRF3otBQDKyukihttps://www.blogger.com/profile/17279912001433539726noreply@blogger.comtag:blogger.com,1999:blog-8083418832420346104.post-14170183878013962752023-05-07T23:19:50.404+08:002023-05-07T23:19:50.404+08:00多謝補充說明!當初整理字頭,主要就是根據ABCN四張表,另外就是「日本特用漢字表」與「韓國特用漢字表...多謝補充說明!當初整理字頭,主要就是根據ABCN四張表,另外就是「日本特用漢字表」與「韓國特用漢字表」,這些應該是比較有用的部分,其餘的便未進行整理。WFGhttps://www.blogger.com/profile/14004240365298046569noreply@blogger.comtag:blogger.com,1999:blog-8083418832420346104.post-2770468578957137372023-05-07T22:38:15.292+08:002023-05-07T22:38:15.292+08:00感謝回覆,期待此字典的新版本。
9.以下並非錯誤,是因為此頁的製作紀錄與2023/02/23版本的...感謝回覆,期待此字典的新版本。<br /><br />9.以下並非錯誤,是因為此頁的製作紀錄與2023/02/23版本的全宋體造字區的字是不相容的,所以我整理時誤會了,其實沒問題,只是刪太快漏了2個字。<br /><br />另外還有異體字字典官網附錄字表的字頭,初步整理後全宋體大約有200個字打不出來,但後來發現附錄的字頭不重要,亦不影響ABCN四張表,所以就刪了。yukihttps://www.blogger.com/profile/17279912001433539726noreply@blogger.comtag:blogger.com,1999:blog-8083418832420346104.post-62924402526473586242023-05-07T15:54:39.406+08:002023-05-07T15:54:39.406+08:00感謝您的指正,說明如下:
1. 這裡確實是我收字失誤,「(U+102673)」字形當改从「凡」。...感謝您的指正,說明如下:<br />1. 這裡確實是我收字失誤,「(U+102673)」字形當改从「凡」。而A04648-011該對應「驘(U+009A58)」字;A04648-004則該對應「(U+102673)」字。<br />2. 「扌自一」在 N00481 的釋義中未見!我猜您可能說的是出現在書證圖片中。不管如何「扌自一」全宋體早已經收錄,就是「」字,字形是掃描轉換而來,有點醜,找時間再重造一下。<br />3. 官網 A01266-032 與 A01266-004 確實重形。由於授權的限制,我不能任意進行改動、刪除,訂正錯字應該已經是授權的底限了,呵呵!這裡我還是新造一字,把重形分開比較妥當。<br />4. A02940-002「穀」誤作「榖」,這一處應該是我修改、取代時失誤,已修正。<br />5. A04619-024「傌」、「馬」重出,這部分我懷疑是舊時官網的錯誤,現官網已刪除A04619-023、A04619-024,也就是「傌」不再列為「馬」的異體,已照官網修正。<br />6. B02332-001「」誤作「潴」,這應該也是我修改、取代時失誤,已修正。<br />7. B02332-003「潴」誤作「」,這應該也是我修改、取代時失誤,已修正。<br />8. C14271-003「」誤作「𨍿」,這應該也是我修改、取代時失誤,已修正。<br />9. 您似乎沒貼完?<br />以上修正會於下次更新時提供。<br />WFGhttps://www.blogger.com/profile/14004240365298046569noreply@blogger.comtag:blogger.com,1999:blog-8083418832420346104.post-33445156687887752752023-05-05T17:14:39.150+08:002023-05-05T17:14:39.150+08:00你好,我使用了《教育部異體字索引字典》 2023/02/22 版
發現幾個小問題,列為下一版的參考
...你好,我使用了《教育部異體字索引字典》 2023/02/22 版<br />發現幾個小問題,列為下一版的參考<br />如配合9月份unicode15.1更新此字典,望能順帶補正<br />1.A04648-011:(U+102673),官網使用驘(U+009A58)。A04648-011右下「凡」的點有凸出,A04648-004右下「凡」的點在几中,應可合併為一字。但全宋體2字同形,卻又不知為何分2個字碼。<br />2.N00481:釋義中多次出現「扌自一」雖為錯字,但由於傳抄甚廣,希望全宋體能增加此字。<br />3.A01266-032:與 A01266-004 重形,差別僅在一個下從「卄」總筆畫18畫,另一個字下從「十十」總筆畫19畫。應合併,不必新造字。<br />4.A02940-002:穀(U+02F959)、榖(U+006996) 不分,依此頁的製作紀錄應統一為「穀」(U+02F959)<br />5.A04619-024:傌(U+00508C)、馬(U+0099AC) 異體字區塊出現2次,應統一為「傌」(U+00508C)<br />6.B02332-001:潴(U+006F74)、(U+0FFE63) 不分,依此頁的製作紀錄應統一為「」(U+0FFE63)<br />7.B02332-003:潴(U+006F74)、(U+0FFE63) 不分,依此頁的製作紀錄應統一為「潴」(U+006F74)<br />8.C14271-003:(U+0FDE27)、𨍿(U+02837F) 官網混淆,應統一為「」(U+0FDE27)<br />9.Cyukihttps://www.blogger.com/profile/17279912001433539726noreply@blogger.comtag:blogger.com,1999:blog-8083418832420346104.post-73438333674614565062022-10-02T23:56:54.501+08:002022-10-02T23:56:54.501+08:00感謝指正。您說的沒錯,此二字重複,補充字應當註銷。感謝指正。您說的沒錯,此二字重複,補充字應當註銷。WFGhttps://www.blogger.com/profile/14004240365298046569noreply@blogger.comtag:blogger.com,1999:blog-8083418832420346104.post-50159884186153132252022-10-02T20:22:00.672+08:002022-10-02T20:22:00.672+08:00您好:
C04777-010 (補充)
似應即
𠅽(B區U+2017D)您好:<br />C04777-010 (補充)<br />似應即<br />𠅽(B區U+2017D)Walter Paihttps://www.blogger.com/profile/08871044254072485928noreply@blogger.comtag:blogger.com,1999:blog-8083418832420346104.post-51492942335908078322022-08-14T15:43:03.382+08:002022-08-14T15:43:03.382+08:00打開外部的瀏覽器是我刻意的設定,因為經常需要同時參照 mdx 內容及官方網頁,若是直接在詞典本頁裡瀏...打開外部的瀏覽器是我刻意的設定,因為經常需要同時參照 mdx 內容及官方網頁,若是直接在詞典本頁裡瀏覽就必須前、後頁切換,對照甚不方便。WFGhttps://www.blogger.com/profile/14004240365298046569noreply@blogger.comtag:blogger.com,1999:blog-8083418832420346104.post-80569391815736859072022-08-14T04:46:21.089+08:002022-08-14T04:46:21.089+08:00我現在換成了GoldenDict詞典了還有也在MDict裡嘗試了點擊字號鏈接, 發現點擊後它們都會打...我現在換成了GoldenDict詞典了還有也在MDict裡嘗試了點擊字號鏈接, 發現點擊後它們都會打開外部瀏覽器跳轉至官方頁面. 想問有辦法使字號鏈接使用詞典的內嵌瀏覽器跳轉至官方頁面嗎, 這樣可以直接在詞典本頁裡瀏覽比較方便asdvbqhttps://www.blogger.com/profile/02064889830271902068noreply@blogger.comtag:blogger.com,1999:blog-8083418832420346104.post-25783145002613224022022-07-31T22:48:46.496+08:002022-07-31T22:48:46.496+08:00那就是歐陸詞典的相容性問題了。抱歉!我沒使用過這個軟件,沒辦法給您什麼建議了。那就是歐陸詞典的相容性問題了。抱歉!我沒使用過這個軟件,沒辦法給您什麼建議了。WFGhttps://www.blogger.com/profile/14004240365298046569noreply@blogger.comtag:blogger.com,1999:blog-8083418832420346104.post-51776844047272599832022-07-31T04:10:38.123+08:002022-07-31T04:10:38.123+08:00谢谢W大. 我是在欧路词典里尝试打开的发现不行; 之后用MDict尝试同样的操作却可行, 直接用ch...谢谢W大. 我是在欧路词典里尝试打开的发现不行; 之后用MDict尝试同样的操作却可行, 直接用chrome浏览器正常访问网站也没问题。<br /><br />欧路词典截图: https://postimg.cc/B8vXFQyKasdvbqhttps://www.blogger.com/profile/02064889830271902068noreply@blogger.comtag:blogger.com,1999:blog-8083418832420346104.post-83837872261533465472022-07-30T11:06:04.906+08:002022-07-30T11:06:04.906+08:00這個應該是您的瀏覽器與官方網站的相容性問題,與辭典無關,請試著直接用瀏覽器連至官方網站查詢看看。官網...這個應該是您的瀏覽器與官方網站的相容性問題,與辭典無關,請試著直接用瀏覽器連至官方網站查詢看看。官網應該是用 cookies 來記錄顯示模式,是不是您的瀏覽器禁止了 cookies 導致?或是換用不同的瀏覽器試試看。WFGhttps://www.blogger.com/profile/14004240365298046569noreply@blogger.comtag:blogger.com,1999:blog-8083418832420346104.post-79616909081928647892022-07-30T10:36:49.587+08:002022-07-30T10:36:49.587+08:00图片地址: https://postimg.cc/NKfdJ6PX
^不知道为什么用這個索引字典來...图片地址: https://postimg.cc/NKfdJ6PX<br /><br />^不知道为什么用這個索引字典來查字,查得後點擊字號連結自動跳轉至官方頁面后就出现这个显示模式, 选择了也没用一直停留在这里asdvbqhttps://www.blogger.com/profile/02064889830271902068noreply@blogger.comtag:blogger.com,1999:blog-8083418832420346104.post-22822520792205584652022-04-06T16:36:44.194+08:002022-04-06T16:36:44.194+08:00抱歉!我忘了放進去了,呵呵!mdd 沒變動,用舊的即可。已經重新上傳,感謝提醒。抱歉!我忘了放進去了,呵呵!mdd 沒變動,用舊的即可。已經重新上傳,感謝提醒。WFGhttps://www.blogger.com/profile/14004240365298046569noreply@blogger.comtag:blogger.com,1999:blog-8083418832420346104.post-24734121933737224492022-04-06T15:22:11.355+08:002022-04-06T15:22:11.355+08:00现在新版的zip文件里不含mdd了吗?只有mdx?原来旧版的mdd文件还需要吗?现在新版的zip文件里不含mdd了吗?只有mdx?原来旧版的mdd文件还需要吗?酷儿https://www.blogger.com/profile/05023850463519840439noreply@blogger.comtag:blogger.com,1999:blog-8083418832420346104.post-18420146723335665232022-04-06T12:34:29.429+08:002022-04-06T12:34:29.429+08:00已發布更新。已發布更新。WFGhttps://www.blogger.com/profile/14004240365298046569noreply@blogger.comtag:blogger.com,1999:blog-8083418832420346104.post-39051644553706675362022-04-06T00:12:15.860+08:002022-04-06T00:12:15.860+08:00好極了。期待更新。好極了。期待更新。Mastametahttps://www.blogger.com/profile/04111438079563084718noreply@blogger.comtag:blogger.com,1999:blog-8083418832420346104.post-42941723122620469252022-04-04T10:31:01.702+08:002022-04-04T10:31:01.702+08:00多謝指正。您說的沒錯,不過《異體字典》將此二字當作「異字而同形」,收作一字,這也是我當初為何這樣處理...多謝指正。您說的沒錯,不過《異體字典》將此二字當作「異字而同形」,收作一字,這也是我當初為何這樣處理的原因,如果改用 2011E,反而與其釋義內容不符了。<br /><br />唯有官方做出修訂,此一情況才有完解。我先記錄在勘誤裡,寄望官方能看到並修訂;至於 mdx,我先多加一條跳轉連結,把 2011E 跳到 4E8C,算是應急的變通處理。<br /><br />努力了好一陣子,終於把落在15字面的《異體字典》字頭清理完了,拆分數據有缺漏部件的予以補齊,有錯誤的予以訂正,並做了最小拆分的優化。同時整併了三百多組重複的收字,讓這些位在不同字典中差點錯身而過的字重新再關聯起來。後續就剩下位於16字面的一萬四千多字尚待清理了,今年一整年還有得忙,呵呵!我預計清明連假過後就會把現有的局部修訂成果做第一次的更新發布,包含字型、部件檢索及異體字索引字典,請留意更新訊息。WFGhttps://www.blogger.com/profile/14004240365298046569noreply@blogger.comtag:blogger.com,1999:blog-8083418832420346104.post-20632628524711264002022-04-04T02:33:28.154+08:002022-04-04T02:33:28.154+08:00上字條:二4E8C 該是 𠄞2011E。上字條:二4E8C 該是 𠄞2011E。Mastametahttps://www.blogger.com/profile/04111438079563084718noreply@blogger.com