WFG: 漢字使用環境的建置 ——十七萬漢字初稿登場

2021年12月28日星期二

漢字使用環境的建置 ——十七萬漢字初稿登場

☆ 2023/10/11 更新，詳情請見漢字使用環境的建置 —— 部件檢索重要更新暨 Unicode 15.1 全宋體更新。

七月初我與 suns99 兄完成了《中華字海》字頭的清理工作後，略事休息，接著又投入了《教育部異體字字典》的字頭清理工作。由於《教育部異體字字典》的字頭清理工作難度更高，我估計憑我二人之力難以在短時間完成，於是便在7月19日去函《教育部異體字字典》的維護單位——國教院，申請《異體字字典》字頭的構形數據。7月30日收到回函，國教院同意提供《異體字字典》字頭的構形數據供我整理之用，實際收到數據已是在10月15日。與此同時，我將尚未還原的《異體字字典》字頭摘錄出來做成工作檔（先前已斷續整理還原了六萬多字，再扣除掉 13830 個手寫字形後，還有 35046 字待清理），每五千字一包，切分成七個包，suns99 兄用倉頡輸入法逐字核對清理（每包平均約花兩週時間，平均還原率略低於 50%），每完成一包發回給我，我再針對可還原的字頭覆核一遍，確保還原的正確性。花了三個月的時間，十月中完成了初步的清理工作。經過統計，利用既有全宋體字庫可檢索的字頭計有 73803 字，需新增至字庫的未收字頭共有 18366 字。然後我將國教院提供的構形數據略事整理，吻合進我的字表，最後提取 18366 個未收字頭數據，加進「部件檢索」裡，至此「全宋體」這個大型字庫，收字正式突破了十七萬漢字，應該足供大多數的漢字應用。

有不少朋友一直奇怪我為何要花那麼多時間去整理這些「幾乎用不到的」生僻漢字，甚至很多朋友很排斥使用這些「Unicode 官方沒有收錄」的私造字。我一直執著地要清理《異體字字典》的字頭，一個很主要的原因便是這項工作的邊際效益其實很高：

可以還原《異體字字典》的圖片字頭，成為純文字的可檢索字頭。這可以大大提昇這些異體字的檢索、利用效率。
可以建立起十萬漢字的橫向聯繫關係。一旦圖片字頭還原成可檢索的純文字字頭，利用《異體字字典》的異體表列，便可以將這十萬漢字的橫向關係聯繫起來，有助於字典查詢時的橫向擴展。
可以利用可還原的字頭（表示既有字庫有收）來優化既有字庫的字形。目前字庫的字形來源多元，有些質量很差，《異體字字典》的字形質量較高，可以進行替代優化。
可以將不可還原的字頭（表示既有字庫沒收）補進字庫，擴增補充字的數量。《異體字字典》的字頭多半來自歷代字書，有完整書證，有了這些補充字，便能更精確地數位化歷代字書、文獻。

要等待 Unicode 官方收錄大量古籍用字，緩不濟急，況且若是沒人整理提交，Unicode 官方也無從收錄起。所以這一年來我大量整理幾本收字量最大的漢字字典，就是希望在最短時間內，吸納這些前人的成果，將它們匯總轉化成可再利用的資源，建立一個方便使用、容易檢索的大型免費漢字平台，方便讓一般大眾、業餘愛好者、學術研究者都能快速地加以利用。

昔日日本的AINet開發了一款商業販售的東亞文字檢索軟體名為「今昔文字鏡」，從 1985 年至 2019 為止，最後的版本收錄文字達十七萬以上（據維基百科的記錄，2018年社長古家時雄病逝，改由石川忠久接手，於次年散會，「今昔文字鏡」正式落幕）。不過它的收字包含了甲骨文、篆體字、楷體字、喃字、水族文字、悉曇文字、西夏文字、變體假名等等，不純粹都是漢字，若是以不重複的純粹漢字而言，應該不到十七萬之數。現下我這個完全免費開放的「全宋體」字庫，漢字的收字規模實際上應該已經超越了「今昔文字鏡」，希望能成為對大家更為有用的漢字平台。

由於國教院提供的《異體字字典》構形數據並不完整，很多無法輸入、顯示的部件都被直接略去，導致大部分的構形數據都是「缺了胳膊，少了腿」（我去函國教院確認，確實如此）。這也印證了為什麼我利用官網的構形檢字來查字，經常會有查不到的情形。為求快速可用，我只能大致先修補一些較嚴重的缺失，然後就硬套入這些帶有瑕疵的拆分數據，先求讓這 18366 個新增字有被檢索的機會（檢索結果可能暫時跟官網一樣會有不正確的情形），之後再慢慢逐字檢查、修正數據，邊用邊改。從十月中到現在，花了兩個月的時間，我獨力檢查、修正了兩千多個新增字的拆分數據，後續尚有一萬六千字待檢，估計要完善全部的新增字拆分數據，起碼還要一年多的時間，只能再一次地發揮「愚公移山」的精神，長期抗戰了。

（國教院提供的構形數據經常「缺了胳膊，少了腿」）

期間有網友問起了台語版聖詩的一個缺字「⿱艹吐」，經過簡兄的指點，我到台灣聖經公會聖經網站找來了「臺客語漢字字型3.1版」作為參考，將它的 123 個外字，扣除 17 個台語注音字符外的 106 字清理一遍，加上「⿱艹吐」計有 75 個缺字，全部以宋體風格重新造字補入字庫，讓字庫也能涵蓋臺、客語的一些特用漢字。特別附上對照表，讓有使用這些字的朋友可以在兩種字庫之間快速地轉換。

值此歲末年終，我先將這「並不完善」的「全宋體」字庫初稿發布出來，讓大家能先行使用，也為今年一年我與 suns99 兄連續挑戰了《漢字海》、《中華字海》、《教育部異體字字典》三部收字最多字典的清理工作做一個 Ending。這一年，幾乎馬不停蹄，總計清理了三大字典的 96175 個字頭，為字庫新增了 54620 字，涵蓋了《漢字海》、《中華字海》所有字頭，以及《教育部異體字字典》的九成字頭（還有一成是手寫字形字頭，尚未處理），成績可謂豐碩。在此也要再次向 suns99 兄致謝，感謝他這一年來沒有二話的義氣相挺，陪著我這個「傻子」衝鋒陷陣，完成了一項項的「不可能任務」，呵呵！

未來一年，我應該會將重點放在繼續完善字庫的拆分數據上，至於尚未處理的 13830 個《異體字字典》手寫字形，雖然我已經做好了工作用的臨時字型，可能還是會暫時予以擱置。畢竟經此一年，我與 suns99 兄已經「兵困馬疲」，就算 suns99 兄還願意再繼續幫忙，若是前債未清後債又疊加上來，我也負荷不了。所以未來一年先以「還債」為主，至於「未竟之功」只好「且看且走」了。

（暫時擱置的《異體字字典》手寫字形）

由於《教育部異體字字典》尚未像《國語辭典》一樣開放授權，我無法將其製作成離線辭典開放給大家使用（會涉及侵權）。折衷的辦法是我捨去所有釋義的內容，只留下字頭，做成一部《教育部異體字索引字典》，方便大家以「部件檢索」檢字之後，利用這個索引字典來查字，查得後點擊字號連結便能自動跳轉至官方頁面（我曾去函向國教院請教，以連結的方式跳轉至官方頁面，應該沒有侵權的問題）。雖然不是最完美，但還是能達到比官網查字更好、更便利的使用體驗，希望這部《教育部異體字索引字典》能幫助大家更方便地利用《教育部異體字字典》這個專業級的漢字資源（《教育部異體字索引字典》將另文發布）。

樂見學術研究、教育工作、個人閱讀這方面的運用，但請勿用做任何形式的商業營利行為。希望「全宋體」這個大型字庫以及「部件檢索」這個檢字工具，能在漢字文化的整理、研究上幫上一點小忙。

下載連結：全宋體.zip

下載連結：部件檢索(測試版).7z

下載連結：倉頡碼表.7z (由於每個人的習慣不同，僅保留漢字部分，請自行併入您慣用的碼表)

下載連結：臺客語漢字外字對照表.7z

最後，將一些整理過程中記錄的工作日誌附在這裡，做為一個回憶與紀念：

2021/07/19 將欲清理的 35046 字製成一個臨時性的工作字型檔，並將尚未還原的字頭摘錄出來做成工作檔，每五千字一包，切分成七包，發給 suns99 兄，正式啟動作業。晚上去函國教院，申請《異體字字典》字頭的構形數據。
2021/07/20 收到了國教院的罐頭回信，表示收到申請，要等待他們研議後處理。
2021/07/30 收到國教院回函，同意提供數據。
2021/08/01 第1包核對完成，累計清理五千字。
2021/08/13 第2包核對完成，累計清理了一萬字，還原率約四成八。
2021/08/24 第3包核對完成，累計清理一萬五千字。
2021/09/05 第4包核對完成，累計清理兩萬字。
2021/09/17 第5包核對完成，累計清理兩萬五千字。
2021/09/29 第6包核對完成，累計清理三萬字。
2021/10/04 遲遲未收到國教院的構形數據，再度去函詢問。
2021/10/11 第7包核對完成，累計清理三萬五千字。
2021/10/15 終於收到國教院的構形數據。回函致謝。
2021/10/18 初步完成新增字的字形編碼及部件檢索，還原九成的《異體字字典》字頭。
2021/11/12 完成一千多字拆分清理。去函國教院請教數據瑕疵及授權問題。
2021/11/20 網友問起台語版聖詩的一個缺字「⿱艹吐」，去信向簡兄請教。
2021/11/22 國教院回覆數據瑕疵及授權問題。
2021/12/13 完成75個臺、客語特用漢字的造字。
2021/12/24 完成兩千多字拆分清理。

p.s. 由於收字量龐大，第 15 字面（FSung-F.ttf）的空間已經完全用罄，因此這一版字型開始啟用第 16 字面（FSung-X.ttf），接續存放補充字字形。

勘誤：

本分隔線以下已更新處理

󿉫󳴵重複，後者註銷（2022/06/07）
「󿭃」字形修正作「⿱尸丗」。《異體字字典》字形失真，據《四聲篇海》改。（2022/06/06）
𦹬󾽹重複，後者註銷（2022/06/06）
「󴮛」字形修正作「⿺辶⿱覀㠯」。《中華字海》、《漢字海》字形訛誤。（2022/06/03）
𣗪􁝫重複，後者註銷。《異體字字典》字形訛誤。（2022/05/31）
𭅃󾽈予以認同，後者註銷（2022/05/31）
裗󰳳重複，後者註銷（2022/05/31）
󷊗􁌁重複，後者註銷（2022/05/27）
􀼑󿘧重複，後者註銷（2022/05/26）
󻝺󿗁重複，後者註銷（2022/05/24）
盛􀷈重複，後者註銷（2022/05/24）
𣧇󻒀重複，後者註銷（2022/05/16）
󷱤󿔺重複，後者註銷（2022/05/15）
󱢩󾻢重複，後者註銷（2022/05/14）
󻴍􂴽重複，後者註銷（2022/05/09）
「󽃞」為《中華字海》、《漢字海》的訛誤字形（據《龍龕手鏡》當作「𥦇」），予以註銷（2022/05/05）
𥨟􁁪重複，後者註銷（2022/05/05）
「㮂󼥳」兩字字形互換（2022/05/04）
󰗆󱧨重複，後者註銷（2022/05/03）
「󴁺」字形修正作「⿰犭⿸󰐐󰓠」（2022/05/03）
󶪫􀧕重複，後者註銷（2022/05/02）
「㣣㣣」兩字字形互換。Unicode 做了調整，全字庫的 CNS 尚未相應更新。（2022/04/24）
「󲧑」字形修正作「⿰⿱非⿸厂慮力」。（2022/04/29）
「华」字形修正作「⿱󵔻十」，也就是 U+534E 改依陸標。此字既然古籍、俗體未見，僅做為簡體字，改依大陸字形比較合理。（2022/04/26）
华􁞦重複，後者註銷（2022/04/26）
糭􁆼重複，後者註銷（2022/04/26）
「􀌪」字形修正作「⿰󳁐⿱人又」。《異體字字典》字形失真，據《類篇》改。（2022/04/25）
「𤯳」字形修正作「⿺㪅生」，也就是 U+24BF3 改依陸標。全字庫的 CNS 台標字形，應誤。《中華大字典》作此訛形，《大漢和辭典》、《中文大辭典》則筆劃曖昧近於訛形，三者均引《字彙》為字源，然《字彙》實作「⿺㪅生」，可能是將「攴」捺筆的起筆裝飾性頓折誤為短撇，變成了「⿱⺊夂」，導致訛誤。（2022/04/24）
「𤿖󽊖」兩字字形互換。（2022/04/24）
𫞹􁁨重複，後者註銷（2022/04/23）
「󲏈」字形修正作「⿱亠⿳󷲏回皿」（2022/04/23）
𥺠􀸕重複，後者註銷（2022/04/21）
𬚰􃊵重複，後者註銷（2022/04/21）
綠􁈰重複，後者註銷（2022/04/20）
「𧟿􁑺」兩字字形互換。U+277FF Unicode 字形失真，此字是依《康熙字典》收字，而《康熙》是引《字彙補》，兩者字形下半俱作「王」，不作「𡈼」。《大漢和辭典》則作「𡈼」。（2022/04/19）
「𧡠󾀟」兩字字形互換，也就是 U+27860 改依陸標。全字庫的 CNS 台標字形愈改愈糟，嚴重錯誤。（2022/04/19）
𤉷􀧞重複，後者註銷（2022/04/17）
󼍉􀧝重複，後者註銷（2022/04/17）
「𰶫」字形修正作「⿰豕苓」（2022/04/14）
󰏈􀲵重複收錄，後者註銷（2022/04/13）
「󼶈」字形據〈魏李挺墓誌〉拓本修正作「⿰禾⿱㒵彡」，《廣碑別字》、《中華字海》、《漢字海》字形均失真。（2022/04/13）
「󵄫」字形據《龍龕手鑑》修正作「⿰⿱㒵彡攵」，《漢語大字典》、《中華字海》、《漢字海》字形均失真。（2022/04/13）
「󰺿」字形據《龍龕手鑑》略作修整。（2022/04/12）
「󼸟」字形據《直音篇》修正作「⿱㒵彡」，《中華字海》、《漢字海》字形均失真。（2022/04/12）
「󰛂」字形據《龍龕手鑑》修正作「⿳少㒵彡」，《漢語大字典》、《漢字海》字形均失真，《中華字海》正確。（2022/04/12）
󰥢󼦟重複，後者註銷（2022/04/12）
「󰬅」字形據《直音篇》修正作「⿺走⿸厂⿱䒑巿」，《漢語大字典》、《中華字海》、《漢字海》字形均誤。（2022/04/12）
「󱾌」字形修正作「⿱𠂉𭘧」（2022/04/11）
󱟧󵕟重複，後者註銷，字形依後者（2022/04/11）
「󲥗」字形修正作「⿱󱗴力」（2022/04/11）
「𦕥」字形修正作「⿱󲥁耳」（2022/04/11）
「󲮓」字形修正作「⿱󼃅⿳一⺌󰒈」（2022/04/10）
「󳅩」字形修正作「⿱艹⿸㇒⿺󰐾厶」（2022/04/10）
󳲱󵑓重複收錄，後者註銷（2022/04/10）
「󳲱」字形修正作「⿰豈󰍗」（2022/04/10）
󶰸󴎹重複收錄，後者註銷（2022/04/10）
「󴛴」字形修正作「⿲忄弓󰒂」（2022/04/10）
「󴾸」字形修正作「⿰女⿱令用」（2022/04/09）
「󻁯」字形修正作「⿲⺩⿱白万攴」（2022/04/06）
「󻋴」字形修正作「⿱殻木」（2022/04/06）

本分隔線以下已更新處理

「󻕬」字形修正作「⿰𦈢𢦙」（2022/04/05）
「󻝹」字形修正作「⿰⿳正𠃊⿶𠕀厶攴」（2022/04/05）
「󻬔」字形修正作「⿰牜⿳󰒾此夂」（2022/04/05）
󻻜􁕗重複收錄，後者註銷，字形依後者（2022/04/05）
󻺋􃌪重複收錄，後者註銷，字形依後者（2022/04/05）
󽘥􁔲重複收錄，後者註銷（2022/04/05）
「󼨂」字形修正作「⿰目􂔝」（2022/04/04）
「󽏨」字形修正作「⿱𡔷耳」（2022/04/04）
「󾨐」字形修正作「⿰⿱炎冋頁」（2022/04/04）
「󾬷」字形修正作「⿰口𮓜⿱食」（2022/04/04）
󵧊󿿜重複收錄，後者註銷，字形依後者（2022/04/04）
󽬓􁏱重複收錄，後者註銷，字形依後者（2022/04/03）
󻇦􀔝重複收錄，後者註銷（2022/04/03）
󱇠􀁑重複收錄，後者註銷，字形依後者（2022/04/03）
󻕂􀀛重複收錄，後者註銷，字形依後者（2022/04/03）
󽫨􀀕重複收錄，後者註銷，字形依後者（2022/04/03）
󻓔􀀒重複收錄，後者註銷，字形依後者（2022/04/03）
󼎢􀀆重複收錄，後者註銷，字形依後者（2022/04/03）
󱫸􀀄重複收錄，後者註銷（2022/04/03）
󳖱󿿾重複收錄，後者註銷（2022/04/02）
󻕄󿿽重複收錄，後者註銷（2022/04/02）
󻔊󿿸重複收錄，後者註銷，字形依後者（2022/04/02）
󳖴󿿰重複收錄，後者註銷，字形依後者（2022/04/02）
󻤣󿿫重複收錄，後者註銷（2022/04/02）
󻔨󿿪重複收錄，後者註銷（2022/04/02）
𫀄󿿩重複收錄，後者註銷（2022/04/02）
󲺶󿿖重複收錄，後者註銷（2022/04/02）
󼚗󿿑重複收錄，後者註銷，字形依後者（2022/04/02）
󲻍󿿍重複收錄，後者註銷，字形依後者（2022/04/02）
󼚘󿿇重複收錄，後者註銷，字形依後者（2022/04/02）
󰣘􁉽重複收錄，後者註銷（2022/04/01）
󺸳󿾝重複收錄，後者註銷（2022/04/01）
󴟨󿾓重複收錄，後者註銷（2022/04/01）
󶄿󿾌重複收錄，後者註銷（2022/04/01）
󾉸􁯩重複收錄，後者註銷（2022/04/01）
󴝖󿽱重複收錄，後者註銷（2022/04/01）
󴠫󿽬重複收錄，後者註銷（2022/04/01）
󴠪󿽫重複收錄，後者註銷（2022/04/01）
󴠚󿽪重複收錄，後者註銷（2022/04/01）
懔󿽨重複收錄，後者註銷（2022/04/01）
󽅪󿽑重複收錄，後者註銷（2022/03/31）
𢠢󿼿重複收錄，後者註銷（2022/03/31）
󻖼󿼾重複收錄，後者註銷（2022/03/31）
𬿲󵌽重複收錄，後者註銷（2022/03/31）
󴉎󿼗重複收錄，後者註銷（2022/03/30）
󴊃󿼖重複收錄，後者註銷（2022/03/30）
󴊩󿼔重複收錄，後者註銷（2022/03/30）
󴊮󿼐重複收錄，後者註銷（2022/03/30）
󴌺󿼏重複收錄，後者註銷（2022/03/30）
󴝇󿼀重複收錄，後者註銷（2022/03/30）
󴟲󿻿重複收錄，後者註銷（2022/03/30）
󰤚󿻸重複收錄，後者註銷（2022/03/30）
󴟣󿻷重複收錄，後者註銷（2022/03/29）
󶄈󿻴重複收錄，後者註銷（2022/03/29）
󴜞󿻨重複收錄，後者註銷（2022/03/29）
󻶓󿻕重複收錄，後者註銷（2022/03/29）
󽋈󿻒重複收錄，後者註銷（2022/03/29）
󺃝󳰼重複收錄，後者註銷（2022/03/29）
󲹗󿻑重複收錄，後者註銷（2022/03/26）
󼕫󿻈重複收錄，後者註銷（2022/03/26）
󳗢󿻄重複收錄，後者註銷（2022/03/26）
󹤯󿺸重複收錄，後者註銷，字形依後者（2022/03/26）
󳋽󿺶重複收錄，後者註銷（2022/03/26）
𣏹􀦀重複收錄，後者註銷（2022/03/26）
󴟁󿺮重複收錄，後者註銷（2022/03/26）
󼙾󿺥重複收錄，後者註銷（2022/03/26）
󴟏󿺢重複收錄，後者註銷（2022/03/23）
󴠤󿺡重複收錄，後者註銷（2022/03/23）
󳦋󿺍重複收錄，後者註銷（2022/03/23）
「󴞆」為《中華字海》錯誤字形，予以註銷（2022/03/22）
󺌍󿹽重複收錄，後者註銷（2022/03/22）
󴼖󶒒重複收錄，後者註銷（2022/03/22）
󴞦󿹻重複收錄，後者註銷（2022/03/22）
󴞥󿹺重複收錄，後者註銷（2022/03/22）
󼗪󿹭重複收錄，後者註銷（2022/03/22）
󼗃󿹨重複收錄，後者註銷（2022/03/22）
󼖨󿹦重複收錄，後者註銷（2022/03/22）
𢟥󿹣重複收錄，後者註銷（2022/03/22）
󴜼󿹞重複收錄，後者註銷（2022/03/21）
󳅱󿹗重複收錄，後者註銷（2022/03/21）
𢚩󿸺重複收錄，後者註銷，字形依後者（2022/03/20）
𥥁󿸸重複收錄，後者註銷（2022/03/20）
󸭺󿸳重複收錄，後者註銷（2022/03/20）
𪫟󿸫重複收錄，後者註銷（2022/03/20）
志󿸤重複收錄，後者註銷，字形依後者（2022/03/20）
󱯞󿸗重複收錄，後者註銷（2022/03/20）
𫧇􁕤重複收錄，後者註銷（2022/03/19）
󳽷󿸃重複收錄，後者註銷（2022/03/19）
󵥎󿷺重複收錄，後者註銷，字形依後者（2022/03/18）
󳾏󿷸重複收錄，後者註銷，字形依後者（2022/03/18）
󳼖󿷵重複收錄，後者註銷（2022/03/18）
󰿧󿷥重複收錄，後者註銷（2022/03/17）
𭾜􀸇重複收錄，後者註銷，字形依後者（2022/03/17）
复󿊺重複收錄，後者註銷（2022/03/17）
𣸪󿷐重複收錄，後者註銷（2022/03/17）
󳻓󿶽重複收錄，後者註銷（2022/03/16）
󸉉󿶬重複收錄，後者註銷（2022/03/16）
󱪺󿶫重複收錄，後者註銷（2022/03/16）
󱪉󿶨重複收錄，後者註銷（2022/03/16）
󳺄󿶖重複收錄，後者註銷（2022/03/16）
𢕊󿶑重複收錄，後者註銷（2022/03/16）
𭸎􁶣重複收錄，後者註銷（2022/02/26）
󴪄􁿘重複收錄，後者註銷（2022/02/19）
𬞞􁡺重複收錄，後者註銷（2022/02/14）
𫴂󴧤重複收錄，後者註銷，字形依後者（2022/02/10）
󳿝󿵷重複收錄，後者註銷（2022/02/01）
彩󿵱重複收錄，後者註銷（2022/02/01）
󲭼󿵰重複收錄，後者註銷（2022/02/01）
「󿵤」字形修正作「⿱彐⿰米系」（2022/02/01）
𢑴󿵢重複收錄，後者註銷（2022/02/01）
󴰾󿵠重複收錄，後者註銷（2022/02/01）
󴱩󿵜重複收錄，後者註銷（2022/02/01）
󴱈󿵒重複收錄，後者註銷，字形依後者（2022/01/31）
󺻱󿵑重複收錄，後者註銷，字形依前者（2022/01/31）
󴱞󿵐重複收錄，後者註銷（2022/01/31）
󷗓󿵏重複收錄，後者註銷，字形依後者（2022/01/31）
󴱣󿵎重複收錄，後者註銷，字形依後者（2022/01/31）
󴯢󿵍重複收錄，後者註銷，字形依後者（2022/01/31）
󳁪󿴛重複收錄，後者註銷，字形依前者（2022/01/30）
󴷸󿴙重複收錄，後者註銷，字形依後者（2022/01/29）
󼜑󿳳重複收錄，後者註銷（2022/01/28）
󶯫󿳰重複收錄，後者註銷（2022/01/28）
󲬤󿳯重複收錄，後者註銷（2022/01/28）
𤎉󿲵重複收錄，後者註銷（2022/01/25）
󴋋󿲳重複收錄，後者註銷（2022/01/25）
󴋌󿲭重複收錄，後者註銷（2022/01/25）
󼍧󵏌重複收錄，後者註銷（2022/01/25）
󱳻󵏒重複收錄，後者註銷（2022/01/25）
󰖛󿲠重複收錄，後者註銷（2022/01/24）
󴉤󿲟重複收錄，後者註銷，字形依後者（2022/01/24）
𰆨󿲞重複收錄，後者註銷（2022/01/22）
󽑚󿲜重複收錄，後者註銷（2022/01/22）
󱏟󿲛重複收錄，後者註銷（2022/01/22）
󲌤󿲔重複收錄，後者註銷（2022/01/21）
󴪷󿲈重複收錄，後者註銷（2022/01/20）
𮞔󴪴󿲆重複收錄，後二者註銷（2022/01/20）
󴈊󿱼重複收錄，後者註銷（2022/01/20）
󴇡󿱸重複收錄，後者註銷（2022/01/20）
󾿪󿱞重複收錄，後者註銷，字形依後者（2022/01/20）
󻴾󿰽重複收錄，後者註銷（2022/01/20）
󳇉󿰸重複收錄，後者註銷（2022/01/20）
󳷥󿰫重複收錄，後者註銷（2022/01/19）
󴶵󿰀重複收錄，後者註銷（2022/01/19）
𮎨󿯻重複收錄，後者註銷（2022/01/18）
󲭥󿯯重複收錄，後者註銷（2022/01/17）
𢀌󿯬重複收錄，後者註銷（2022/01/17）
󱠶󿯥重複收錄，後者註銷（2022/01/17）
「􂛿」字形修正作「⿱田⿲丿山巳」（2022/01/17）
𡹝󿯅重複收錄，後者註銷（2022/01/16）
󼝽󿯃重複收錄，後者註銷（2022/01/16）
󳰣󿯁重複收錄，後者註銷（2022/01/16）
󻙳󿮾重複收錄，後者註銷（2022/01/16）
󴬋󿮹重複收錄，後者註銷（2022/01/11）
󳰔󿮶重複收錄，後者註銷（2022/01/10）
󳱰󿮱重複收錄，後者註銷（2022/01/10）
󺢴󿮰重複收錄，後者註銷，字形依後者（2022/01/10）
𱀓󿮮重複收錄，後者註銷（2022/01/10）
󻙛󿮬重複收錄，後者註銷（2022/01/10）
󳭒󿮪重複收錄，後者註銷，字形依後者（2022/01/10）
󳮕󿮩重複收錄，後者註銷（2022/01/10）
󲰲󿮨重複收錄，後者註銷，字形依後者（2022/01/09）
󳰄󿮤重複收錄，後者註銷（2022/01/09）
󳮾󿮣重複收錄，後者註銷（2022/01/09）
󳯣󿮗重複收錄，後者註銷（2022/01/09）
𪨦󿮑重複收錄，後者註銷（2022/01/09）
󰏣󿮋重複收錄，後者註銷，字形依後者（2022/01/09）
󴳹󿮆重複收錄，後者註銷（2022/01/09）
󴵞󿭥重複收錄，後者註銷（2022/01/07）
󴵓󿭢重複收錄，後者註銷（2022/01/07）
󴵳󿭡重複收錄，後者註銷（2022/01/07）
󴴱󿭠重複收錄，後者註銷（2022/01/07）
󴵀󿭓重複收錄，後者註銷（2022/01/06）
󴳂󿓲󿭍重複收錄，後者註銷（2022/01/06）
󴳬󿭂重複收錄，後者註銷（2022/01/06）
󴴁󿬺重複收錄，後者註銷（2022/01/06）
󰜋󿬸重複收錄，後者註銷（2022/01/06）
󴳟󿬱重複收錄，後者註銷（2022/01/06）
𰍾󿬭重複收錄，後者註銷（2022/01/06）
󴱴󿬤重複收錄，後者註銷（2022/01/06）
󴳇󿬘重複收錄，後者註銷（2022/01/06）
𩴁󿬐重複收錄，後者註銷（2022/01/06）
尲󿬌重複收錄，後者註銷（2022/01/06）
󲌨󿬇重複收錄，後者註銷（2022/01/06）
󲋚󿬆重複收錄，後者註銷（2022/01/06）
𭕐󿬅重複收錄，後者註銷（2022/01/06）
󼏒󿀞重複收錄，後者註銷（2022/01/06）
󼞒󾻮重複收錄，後者註銷（2022/01/06）
𢒫󿊝重複收錄，後者註銷（2022/01/05）
󴯟󺞃重複收錄，後者註銷（2022/01/05）
󴰎󺙬重複收錄，後者註銷（2022/01/05）
󴯪󺕃重複收錄，後者註銷（2022/01/05）
󳒈󸻄重複收錄，後者註銷（2022/01/04）
𤥯󸄎重複收錄，後者註銷（2022/01/04）
󺽾󷱟重複收錄，後者註銷，字形依後者（2022/01/04）
󴨭󷦪重複收錄，後者註銷（2022/01/04）
󽆁󷚠重複收錄，後者註銷（2022/01/04）
󰛧󷈢重複收錄，後者註銷（2022/01/04）
󵶏󶽧重複收錄，後者註銷（2022/01/04）
󲕙󶯭重複收錄，後者註銷（2022/01/04）
𰩐󶯜重複收錄，後者註銷（2022/01/03）
𥨤󶯛重複收錄，後者註銷（2022/01/03）
󴦦󶯔重複收錄，後者註銷（2022/01/03）
󴦇󶯏重複收錄，後者註銷（2022/01/03）
󽅉󶯎重複收錄，後者註銷（2022/01/03）
󴦞󶯉重複收錄，後者註銷（2022/01/03）
󽅇󶯇重複收錄，後者註銷（2022/01/03）
󽆊󶯁重複收錄，後者註銷（2022/01/03）
󽅷󶮾重複收錄，後者註銷（2022/01/03）
󽅛󶮳重複收錄，後者註銷（2022/01/03）
󴦝󶮱重複收錄，後者註銷（2022/01/03）
󽄠󶮯重複收錄，後者註銷（2022/01/03）
󽅽󶮬重複收錄，後者註銷（2022/01/02）
󽄢󶮫重複收錄，後者註銷（2022/01/02）
󽃈󶮩重複收錄，後者註銷（2022/01/02）
󽅆󶮨重複收錄，後者註銷（2022/01/02）
󽅴󶮧重複收錄，後者註銷（2022/01/02）
󽅣󶮡重複收錄，後者註銷（2022/01/02）
󽅜󶮠重複收錄，後者註銷（2022/01/02）
󽅳󶮟重複收錄，後者註銷（2022/01/02）
󽅎󶮜重複收錄，後者註銷（2022/01/02）
󴥴󶮙重複收錄，後者註銷（2022/01/02）
󳴇󶮈重複收錄，後者註銷（2022/01/02）
󽅧󶮂重複收錄，後者註銷（2022/01/02）
󽄉󶭝重複收錄，後者註銷（2022/01/02）
󽄷󶭑重複收錄，後者註銷（2022/01/01）
󽄁󶭎重複收錄，後者註銷，字形依後者（2022/01/01）
󽄚󶭌重複收錄，後者註銷（2022/01/01）
󲕠󶭇重複收錄，後者註銷（2022/01/01）
𥥘󶬬重複收錄，後者註銷（2022/01/01）
𡪌󶬥重複收錄，後者註銷（2022/01/01）
𥤲󶬤重複收錄，後者註銷（2022/01/01）
𥨅󶬣重複收錄，後者註銷（2022/01/01）
󽄬󶬠重複收錄，後者註銷（2022/01/01）
𡨒󶬝重複收錄，後者註銷（2022/01/01）
󽃇󶬗重複收錄，後者註銷（2022/01/01）
󲕲󶬌重複收錄，後者註銷（2022/01/01）
󽄤󶬉重複收錄，後者註銷（2022/01/01）

130 則留言:

Unknown2021年12月28日下午6:27
我是一位先天盲視障者，目前正在研究漢字，好希望有個適合盲人操作的頁面？讓視障者也可研究中文字形！謝謝！
回覆刪除
回覆
毛小驴2021年12月28日晚上10:55

求教，我下载在链接里面下载了仓颉的码表，并且安装了全宋体字体，当用全宋体—F字体的时候，是显示字最多的，但是依然还是有个别字无法显示出来，请问这个是字体还没有完善还是我设置有问题呢？感谢!
回覆刪除
回覆
毛小驴2021年12月29日晚上10:46
不好意思，是字体安装的问题，有一个人把您的字体改了下，说里面有问题，现把改过的字体连接放到这里：https://drive.google.com/file/d/1yobqT027lTL5DTEEIf_RPV0A2zyEwj_4/view?usp=sharing。另外，我发现博客下载的仓颉码表里面有的拆分好像是有问题的，比如“id”出来应该是术，而“ijc”出来的应该是朮，但是目前码表里面“id”出来的有术和朮，这个拆分感觉不是很合理啊。
回覆刪除
回覆
毛小驴2021年12月29日晚上10:53
另外，仓颉码表里面，还有一些目前看到的错误，截图一并附上链接：https://drive.google.com/file/d/1SMgsZhlV4kOAaMT66-bNYyFtI-S1mY6x/view?usp=sharing
回覆刪除
回覆
suns992021年12月31日上午10:26
https://twblg.dict.edu.tw/holodict_new/index.html
「發穎」（［⿱艹吐］芛）
回覆刪除
回覆
Feynman2022年1月1日中午12:22
Windows11下面G区的汉字显示不出来。
回覆刪除
回覆
毛小驴2022年1月1日晚上7:54
另，该仓颉码表里面的辅助字根要比常见码表详尽很多，但是在使用当中也发现仓颉码表里面有的辅助字根是没有，希望suns99兄可以完善一下，方便有的拆分字体的输入，例如“斗”字，左上角的两点没有在码表中找到。非常感谢!!!
回覆刪除
回覆
阿文2022年1月4日下午3:33
WFG‥
　　原《部件檢索》，內設開啟頁面，為「限標準字、鍵盤展開」——
要改哪裡，才能內設開啟頁面，為「不限標準字、鍵盤收起」？
（用「倉頡輸入法」的人，不太需要用到「類聚鍵盤」也！）
　　蓋本人都用「隱私視窗」（無痕視窗）開啟使用，所以頁面無「記憶」，每次開啟，都得重設。
　　之所以用「無痕視窗」，因時常會開很多頁面，這樣就不會有瀏覽記錄——
關了網頁，也就「船過水無痕」啦！（需要登入的，才不用無痕視窗。）
　　　　　　＊　　　　　　＊　　　　　　＊　　　　　　＊
　　今天一早起來，將早先的「構想」，給付諸行動——
把「部件檢索」，修改為《倉頡碼檢索》與《漢文注音檢索》——
一個輸入倉頡碼，即可檢索字。（將「類聚鍵盤」，修改為倉碼碼。）
一個輸入注音、拼音，即可檢索字。（將「類聚鍵盤」，修改為注音、拼音，方便輸入，即可檢索有注音的漢字——台客國語皆可。）
　　呵呵！真的可行也！
　　（所以‥其它任何輸入法，其實都可以自行修改。）
　　改天，搞好一點，再寄給你，修改美觀、實用一點。
　　（遇到編寫程式，也就沒轍啦！）
　
　　還有一個構想是‥利用「部首、筆畫」檢索！譬如‥
按一下木部，會檢出所有木字的字。
按一下木部、外畫三畫，即檢出所有木部外畫三畫的字。
按一下木部、總畫十畫，即檢出所有木部總畫十畫的字。
　　你有空的話，就研究研究吧！
　　蓋「部件檢索」，拆分字，真是拆分得頭昏腦脹——
有的字，真的是很難「拆」呀！
用「部首、筆畫」檢索，反而便利。
　　未來，這《部件檢索》，要改為《多功能漢字檢系統》——
才能方便快速地，在十七萬字中暢遊——
想要找哪個字，都能「信手拈來、手到擒來」。
回覆刪除
回覆
阿文2022年1月7日晚上10:41
WFG‥
　　《手寫字形》，目前進度，已輸入五千個「倉頡碼」。
　　新版的《部件檢索》，使用查詢，其反應速度，變得很慢，不知是啥問題？
（前一版的，雖然慢了些，但還算可以接受。）
　　回去找最初的《部件檢索(完拆比對)》來用——
哇勢……在「即時查詢」的狀態下，速度真的是飛快呀！
實在不禁要問‥怎麼新版的，就不行了呢？
　　或許你當試試看，把「資料檔」的部分另存，用呼叫的方式帶入，如檔案‥
　　　　　decompose_完拆.js　　　　1,710 KB
　　　　　部件檢索(完拆比對)．htm　　　　4 KB
　　《部件檢索(完拆比對)》網頁檔，僅有4 KB，
今之《部件檢索》（含資料），有　3,046　KB，
連用“EmEditor”開啟，都不是很暢快哩！（電腦8GB記憶體。）
前一版的(155070字， 2,687 KB)，開啟就很暢快。
　　資料檔外帶，修改資料時，是比較方便的呀！
　　
　　今天，想了個法子，寫了個「上下分割」的網頁，將《部件檢索》與《倉頡碼檢索》，給放在同一視窗中——呵呵！真是超級便利呀！
　　就算不會倉頡輸入法的，只要將「倉頡碼」給「複製～貼上」，也就能很快地，查看有無字啦！
　　　　　　　　＊　　　　　　＊　　　　　　＊　　　　　　＊
　　若你工作累了，想換個「姿勢」的話——需要你幫忙，將《倉頡碼檢索》，改成「資料檔外帶」的形式（一筆一行），以後整修，會比較方便。（如附錄。）
　　中間用「taB」隔開。
　　再者，同一字，不同的倉頡碼，是否能放在一起，中間用「;」號隔開？
可以的話，就不用列那麼多行。
　　以後要編「注音、拼音檢索」，也就可以將同音的注音、拼音，擺在一起——方便對照。
　　注音與拼音，可以檢索國台客語字，反向查詢其讀音。
　　蓋台客語用字很「多樣」——未知「正字」者，每每會以「同音字」替代，
用注音、拼音查詢出同音字，再去判斷，用哪個字才正確、才適合。
　　
　　　　　　　　　　　　　　　　　　阿文
　　　　　　　　　　　　　　　　　　　　
■附錄
一 M
乙 NU
丁 MN
七 JU;p
乂 K
乃 NHS
乜 PN
九 KN
�� hmvi;hmvk;hmvo;hmvp;hmvq;hqi;hqj;hqk;hqo
　
人ㄖㄣˊ
人 ㆢㄧㄣˊ;jin5
人ㄌㄧㄣˊ;lin5
人ㄌㄤˊ;lang5
人ㄌㄤ˙;lang0

◇附圖片
　https://www.facebook.com/groups/978821105480673/posts/5348597165169690/
回覆刪除
回覆
阿文2022年1月9日晚上10:22
WFG‥
　　使用者嘛！快速方便第一，一般人，哪會去理會「幕後」的……苦辛呢？
　　下載《部件檢索》解壓縮，就是個「資料夾」，沒另存的話，就會教人「選擇」是否覆蓋——都是在一個資料夾裡。（大概也沒幾個，會像阿文，會喜歡保留「舊版本」的。）
　　一般使用者，也不會去管那個資料檔啦！
　　到網上搜尋引用《部件檢索》者‥好市得、漢典……
使用起來，都是「頓頓」的，果真要使用「即時查詢」，那更是「自苦討吃」。
　　這十七萬字版的，輸入部件，按下「Enter」之，可以數個七、八、九秒，才會顯示查詢結果。（阿文以為是自己電腦的關係，還去朋友那裡，用較新的電腦、較大記憶體的，去試試看……也快不了多少，使用起來，就是會有「延遲感」，慢了好幾拍。）
　　阿文是不懂得，其中的「運作原理」啦！
只是想‥一個網頁裡，基本就十七萬三、四千字……
每次查詢，等於重新刷新頁面——十七萬多字，重新刷一次，不慢也得慢。
若是資料檔「外帶」的話，程式是跑到資料檔裡去，找到符合的，才叫出來，顯示在頁面——感覺這樣子，應該會比較順暢吧？
　　阿文每言‥「動動腦，萬事好；不動腦，費手腳。」
　　凡事「不會死人」的話——何妨嘗「嘗試」一下呢？
　　或許會更好呀——就算沒有更好，也只是浪費一些時間，換取一些「行不通、不成功的經驗」罷啦！
　　果真當使用者是「傻瓜」（只會使用傻瓜相機）的話，就用一個「單一網頁版」的；另一個，則是資料檔外帶的「專業版」好啦！
　　　　　　＊　　　　　　＊　　　　　　＊　　　　　　＊
　　《手寫字形》，輸入倉頡碼，已八千筆。
　　另外，今天，想法設法，將十七萬字的「倉頡碼」與「拆分碼」，整合為一，置於Excel中，一字一列，如是，可以利用倉頡、拆分來「排序」，查看字形是否重複，也可用「過濾」去查看——更便利大批新增字之拆分輸入作業。
　　改天，檢查無誤後，再寄給你——在Excel中整修，很方便的啦！
　　　　　　　　　　　　　　　　　　阿文
　　　　　　　　　　　　　　　　　　　　
　
　　如何判斷「@」有理拆分、「!」無理拆分？
　　
序　倉頡碼　字　拆分
94　c;ih 丷　!丶㇒
95　kni 丸　!九丶
96　by;bim 丹　@冂亠@󺪜丶!󰖶一
97　iksi 为　!𬼀𠃌丶!丶力丶
98　yg 主　@丶󵣀!丶王!亠土
99　tti 丼　@井丶
100 mbmbi;mmbib 丽　@󰊅󰖶󰖶
101 fcq 举　@兴𰀁
　
　　※保留＠！，方便複製到“EmEditor”中，取代為所需形式。
　　　　"丹@󺪜丶!󰖶一",
回覆刪除
回覆
阿文2022年1月13日凌晨12:36
WFG‥
　　先擱下整編《臺語詞海》，卯起勁來，整編《手寫字形》的倉頡碼，現已完成「一二五〇字」。
　　《部件檢索》（模糊），加上《倉頡碼檢索》（精確），對於阿文整編《手寫字形》（新增字）而言，可真是「相輔相成」，便利無比。
　　啊可惜就是《部件檢索》，反應慢好幾拍……真的只能耐著性子使用！
　　今日搜著利用《部件檢索》而改的《字嗨漢字部件檢索》，見其「說明」‥
「將十萬字的資料庫，切成100份，每50毫秒搜尋1000字，
　讓整個搜尋拉到最５秒完成，
　比起原先在我的電腦上，大約３秒比起來，是慢了點，但換來的好處很多。
　首先當觸發新的查詢時，舊的查詢，會即時結束，
　過時的查詢，不再拖延使用效能。
　…………」
　　程式運作的原理，阿文是一點也不懂啦！只是想‥
若將東西，全混在一個抽屜裡，要找就挺累的！
若一個抽屜裡，還有分格，能將東西，稍加分類，要找東西，當是容易些。
若用二個抽屜，乃至十個抽屜，將東西分類擺放，外頭標籤，要找也容易——
倘若未分類，只是隨便裝進十個抽屜裡，那可就跟全混在一個抽屜裡，沒啥兩樣，乃至開關抽屜，更加費時。
　　想起DOS、倚天、ＰＥ２的時代……
倚天中文，有《片語輸入法、詞庫輸入法》，真是超級便利好用！
《詞庫輸入法》，以「Ｃtrl＋ space」開啟，輸入一個詞之後，自動跳回之前輸入法（如倉頡輸入法），使用倉頡輸入法的人，可以自行編輯詞庫，至多打五個碼，即可輸入二字詞、三字詞、成語，乃至十個字一句，譬如‥
　　　　MMMHF　一石二鳥
　　　　NNNON　阿彌陀佛
　　　　THKTM　觀自在菩薩
還可以分成好幾個檔。（資料檔最後一行，有個連結下一個檔案的程式碼。）
　　用倉頡輸入法的人，要打成語，就切換為《詞庫輸入法》，打五個碼，即輸入四個字，然後，自動跳回倉頡輸入法——完全可以「盲打」。
　　阿文就分門別類的，做了好幾個檔‥成語、詩詞、佛學名相……
　　可奈何，進入「Windows」時代，記得倚天所用的倉頡、注音等輸入法，是被「Windows」給「繼承」了——但《片語輸入法、詞庫輸入法》，並沒有被延續下來。
　　因為「注音輸入」麻煩，阿文還搞了一套「用倉頡碼」打注音——
　　　　mk(天)　ㄊㄧㄢ
　　　　my(下)　ㄒㄧㄚˋ
　　　　otf(無)　ㄨˊ
　　　　toog(難)　ㄋㄢˊ
　　　　jlln(事)　ㄕˋ
　　阿文還整編了，當時Big５字集的《注音檢索》——
後來，因緣際會，免費給了 WD2（pe2的中文版）公司。
（那個還在用五吋、三．五吋軟碟片的時代。）
　　呵呵！原來，阿文老早就在「當傻瓜」啦！
　
　　　　　　＊　　　　　　＊　　　　　　＊　　　　　　＊
　
　　《倉頡碼檢索》，有個狀況，想麻煩你，看看是否能改善？
一、以字檢索結果倉頡、注音、拼音後的結果，
　　能否有「點擊複製」的功能？（如檢索出來的字。）
二、能否分開每個倉頡碼或讀音？以便於「點擊複製」？
　　如：hmvi;hmvk;hmvo;hmvp;hmvq;hqi;hqj;hqk;hqo
　　變成：hmvi　hmvk　hmvo　hmvp　hmvq　hqi　hqj　hqk　hqo
　
　　ㄖㄣˊ　ㆢㄧㄣˊ;jin5　ㄌㄧㄣˊ;lin5　ㄌㄤˊ;lang5
　　　　　　ㄌㄤ˙;lang0
　　ㄖㄣˊ　ㆢㄧㄣˊ　jin5　ㄌㄧㄣˊ　lin5　ㄌㄤˊ　lang5
　　　　　　ㄌㄤ˙ 　lang0
　
如此，可以「點擊複製」後，可貼到查尋框，方便尋找其它同碼字、同音字。
　　能做到，那就很方便啦！
　　若不能做到，也只好將就囉！
　　　　　　　　　　　　　　　　　　阿文
　　　　　　　　　　　　　　　　　　　　
※附圖
　https://www.facebook.com/groups/978821105480673/posts/5363297397033000/
　
◇字嗨漢字部件檢索
　https://zi-hi.com/sp/uni/CJKSeeker
◇漢字部件檢索修改說明
　https://github.com/ButTaiwan/hanseeker
回覆刪除
回覆
阿文2022年1月14日下午4:12
WFG‥
　　「倚天中文」的輸入法，是內定的，也不是一般人，可以去編輯，故有可以自定的《片語輸入法、詞庫輸入法》，做為輔助。
　　windows，有「自定輸入法編緝器」，故能增修自定輸入法——
大概因此故，所以沒再保留《片語輸入法、詞庫輸入法》。
（win７，居然就沒了，但能用WinXP的。
　所以‥有能力寫程式的，紛紛寫自定輸入法的程式。）
　　《片語輸入》，是利用二十六個英文字母鍵，可以隨時設定，比如寫小說的，一直要打「阿甘說：」，就可以將按鍵「ａ」，設為「阿甘說：」——
好像是按「Shift＋space」後，再按「ａ」鍵，也就能輸入「阿甘說：」，
輸入後，自動跳回原輸入法——等於是按「三個鍵」，即可輸入片語。
（阿文是用《片語輸入》，設定鍵盤上，打不出的標點符號，如‥「」『』《》……——等。）
　　使用《倉頡輸入法》，好處是‥
一、只用到二十六個鍵。
二、以字形取碼——不會讀音，也能輸入。
三、最多輸入五碼。（不限單字，也可設定詞、成語，乃至一長串句子。）
四、候選字率低。
　　出現候選字，除非常用，不然，就得「用眼睛」去看、去選啦！
　　《詞庫輸入法》所設定的碼與字詞句子，只要加入《倉頡碼》裡，一樣也能用。
　　《詞庫輸入法》的好處就是‥有用到時，才去開啟！
譬如‥冬天到了，要穿的衣服，就掛到衣樹裡，容易取放；夏天的衣物，暫時不用，就收到抽屜裡，久久不用再去動到。
　　想當年的Big字集，還得分「常用字、次常用字」的區塊呀！無非是擔心載入太多，記憶體不堪負荷，處理不來。
　　誰又料到‥電腦科技，飛速前進，unicode 字集，漢字越造越多？還得一直增加區域——還不知何時才能了結哩！
　　　　　　＊　　　　　　＊　　　　　　＊　　　　　　＊
　　《手寫字形》，已完成倉頡碼，也作了初步的比對。
　　接下來的日子，得逐字去檢查、拆分……
　　急也急不得，還是「別太認真」，要不然，會累死！
　　　　　　＊　　　　　　＊　　　　　　＊　　　　　　＊
　　收到修改後的《倉頡碼檢索》，效果很好，用「即時查詢」，也沒問題。
　　將《倉頡碼檢索》，改為《漢文檢索》——
　　　　輸入漢字、倉頡碼、國台語客注音、拼音檢索。
　　日前，也已整編好了「國語、台語、客語（待完善）注音、拼音」的資料檔。
　　問題是‥
一、可以共用一個檢索頁面嗎？（將四個分類的資料檔，互相連結。）
二、注音（方音符號）、拼音、調符，須要「輔助鍵盤」。
三、檢索結果，為區分「倉頡碼、國語、台語、客語注音拼音」，
　　大概要依資料檔的檢索結果，分類顯示。
　　（簡單的另行起，或加"hr"區隔線。）
四、輔助鍵盤的字，宜設為「標楷體」——
　　「注音調符」，才不會變「半型」的，好看些！
五、「較大字形」，開啟可內設為「關閉」——網頁用滑鼠滾輪，即可放大縮小。
　　
　　阿文想得太多，不會寫程式，終究有心無力。
　　有勞王兄費心了！
　　每當有網友問及‥「你的台語注音，是怎麼輸入的？」
　　阿文都得問他‥「你真的有心要玩嗎？真的有心，我再跟你說！」
　　得以完成這個《漢文檢索》，也算得上是一件利器啦！
　
※資料檔：
　　倉頡：decompose.js　　　（原檔，為省kb，上傳快些，未附。）
　　國語：decompose-1.js
　　台語：decompose-2.js
　　客語：decompose-3.js
　
　※輔助鍵盤參考：Ｅy.htm
　　昔日，為了輸入台語注音，模仿《教育部新編國語辭典》的注音輸入做的。
　　想當年，一鍵一符、一字、一詞地，初步整編了《臺語字詞海》……
還真的不得不佩服，自己的「毅力」呀！
後來，用〈彰化一整天〉的「 Exce批次轉換」，輸入拼音，再轉為注音。
如今，用「烏衣行」的「漢字轉閩南語拼音」，
再用“EmEditor”，的「批次取代」功能，轉為台語注音，也就更加便利啦！
　
　　　　　　　　　　　　　　　　　　阿文
　　　　　　　　　　　　　　　　　　　　
　
※漢文檢索.7z
　http://nas.taigubun.org:8080/share.cgi?ssid=0jnczux
回覆刪除
回覆
阿文2022年1月15日晚上8:46
WFG：
　　打拚了一天，《手寫字形》，逐步整編七百五十字。　
　　眼睛實在受不了，只好休息啦！（就說不要太認真，可是一旦投入，就沒完沒了。）
　　以一天五百字的話，「一三八二七字」……好吧！預計一個，可以完成。
　
　　由於新版《部件檢索》，使用起來，慢到實在很想放棄——
後來，想說利用《倉頡碼檢索》，來改個「精確檢索」的——
至少只要「拆對了」，就能找到字。（少了不對的，速度應該會加快吧！）
但嘗試之後，卻沒能成功——也不知問題出在哪裡？　這下也沒轍啦！
　
"不:一𡭔;丆卜",
"丑:彐丨;󰒈十;󺪡一",
"丒:刃一",
"专:󰔟丶",
"且:𠀇一;𠀃二;󰍂一",
"丕:不一",
"丘:𠂆丅一;𠀉丨",
　
　　一般倉頡碼的資料檔，是以「TAB」做區隔，比如‥
a 日
a 曰
a 𫩏
　　其實，也可以這麼編‥
ａ日曰𫩏　←中間空半格。
　　打「ａ」後，一樣出現候選字
　　　　1.日 2.曰 3.𫩏
當然，設定「詞、成語」等「字串」都行——只要以「空半格」做區分。
　　《部件精準檢索》無法作用，也只得煩你「修理」啦！
　　若可行的話，阿文還有個構想‥
整編一個「構字部件檢索」，比如‥
、:丶⺀冫 󰉾 丷𠁼氵 󰏴 灬 󺪤
亠:󰑻 󶅠 𰁜 󰑺 𣅀 󰊡 󰊞 󰊈 㐫 󰒖 𤣥玄 󰑜 󰓿 亯𨐌𤇯
丿:㇒𰀪彡𠂆⺁ 󰌏 𠂉龵𧰨𧘇𠂢
丩:𠁡𠁢𠂈 󰕯 󰐊 󰑚 𠂎乡乆𠃔 󰓠 丱 󱳓 󰑖 𤕰𣇓鼎
冂:𠔼𠔽冋𠔿冈𦉪𦉰罓冈网𦉯𦉳
⺈：⺈口比⺈囚八⺈𠔿比⺈𠔿冖⺈𠔿𠂡
　
　　也就是說‥以「起筆」來分類，或者是某個某個字為主，相似、相關的部件。
　　其實，從以前開始搞「拆分」，就建立了個《漢字拆分部件參考檔》——
雖然有稍加分類，但用「人眼掃瞄」，總不如用電腦檢索來得快嘛！
如是，打一個字，就找出相似的部件，同在一個頁面，要找就容易多啦！
　　
　　還有，沒「部件」可用的，看來也只好打「？」，做「萬用碼」了！
有的字，沒部件，無法拆呀！硬是拆得「離離落落」，真是挺「難看」的！
　　呵呵！看到‥
「國教院提供的《異體字字典》構形數據，並不完整，
　很多無法輸入、顯示的部件，都被直接略去，
　導致大部分的構形數據，都是『缺了胳膊，少了腿』……」
　　說真的，「拆字」挺累人的！所以‥除了「感謝前人的貢獻」之外，其它的任何話，都是「多餘」的啦！
　　如啦！休息了。
　　　　　　　　　　　　　　　　　　阿文
　　　　　　　　　　　　　　　　　　　　
　
◇《部件精準檢索》
　　http://nas.taigubun.org:8080/share.cgi?ssid=0DyB8pZ
回覆刪除
回覆
Mastameta2022年1月16日凌晨1:26
恭喜你，把異體字字典完成了。
字型優化了，看得出來。
F5947，光以美觀來講，我個人偏向於舊的字形。
https://imgur.com/aHHWueR
回覆刪除
回覆
阿文2022年1月17日晚上9:37
WFG‥
　　阿文還是喜歡說‥「動動腦，萬事好；不動腦，費手腳。」
　　動動腦嘛！可以增加「工作的樂趣」——
試得成，可以增加工作效率；試不成，也算是換得一個‥「不成功」的經驗啦！
　　《倉頡碼檢索》，好用得很哪！
（《倉頡碼檢索》，目的不在於「文章打字輸入」——目的只是為了‥方便找字。
　完成《手寫字形》後，也就會「擱置」啦！
　蓋平時打文章，沒事也用不到，那些「異體字」呀！）
　　你推薦給 suns99 兄用用看——保證他也會愛上的！
　　比如‥「nnmrb」這個碼，有「五十三」個同碼字——
想想‥有哪個輸入法，可以「同一頁面顯示」的？
「候選字」，大概要叫人翻個五、六面吧？
字形看不清楚，還可以隨時給它「放大放大放大……」
　
　　呵呵！來聊聊阿文對《手寫字形》的作業方式吧！（經驗花錢買不到，有興趣「整編」的人，就參考參考！）
一、把字形檔，複製～貼到 Excel裡。
二、努力編寫，完成所有字的倉頡碼。
三、編個批次取代檔，
　　利用將“EmEditor”的批次取代功能，
　　將《手寫字形》的倉頡碼，轉換為「既有漢字」。
　　（十七萬字，也不知電腦跑了多久？阿文去菜園除草、摘菜啦！
　　　同碼字，只會取代成第一個。圖片Ｊ欄中，即是。）
　　如此，就可以很方便地，與「手寫字形」對照了！
四、接下來，也不得不逐字查驗啦！
　　或有倉頡碼打錯、編錯、不同的取碼方式，也只能一一嘗試。
五、在Excel裡，還可以利用排序、篩選（過濾）、取代的功能，
　　將一些「拆分碼」給「優化」，如「彐彐」，全取代為「��」。
六、在Excel裡作業的缺點‥
　　各區段的字，無法全都顯現，還得去「選擇字型」，才能看到字形。
　
　　《手寫字形》，處理剩餘一萬字。
　　好啦！今天，早點「收工」啦！
　
　　　　　　　　　　　　　　　　　　阿文
　　　　　　　　　　　　　　　　　　　　
※附圖
　https://www.facebook.com/groups/978821105480673/posts/5385231924839547/
回覆刪除
回覆
阿文2022年1月21日凌晨12:13
WFG‥
　　《手寫字形》處理，剩餘九千字。
　　昨晚，躺到床上，有個構想，早上起來，也就趕緊「試試看」，想弄個《構字部件檢索》。
　　《倉頡碼檢索》，既然設定「非漢字與漢字」之間的檢索——
那就用「數字、英文字母（拼音）、注音」來檢索、反檢索吧！
　　結果‥
只能「單數」不能「十進位」，１至９可設，「０」則無效。
「10」以上就無敦。
英文、注音符號，也不能用二個字母、符號以上。
　　這個《構字部件檢索》的構想，其實就是傳統的「倉頡、注音、四角號碼檢索」的綜合——
反正「左側」隨自己的「慣用」的輸入法，或特定的分類，乃至隨「自己高興」，去設定「右側」想要檢索的「字、詞」結果，也就行啦！如‥
i：丶⺀冫 󰉾 丷𠁼氵 󰏴 灬乊爫爫⺤䒑
m：一丅丄𠃍𪛙乛 󰑶 󰍅 𠫔𠫓 󰊓 𠮛㔿𤓯帀𢁓厈
mm：二㠪𠄞𠄟𠄠 󰊅 󰻖 󱜰 󲭣
nxu：龜龟𪛉亀黾𠃾𠁴𤕣龜⻱龜⿔䶰𧑴𪚦𪚧 ……
ybysp：龍竜𦱉𢅛𠊋㰍𥫈龒䰱
hxvyv：鼠鼡𤔆 󰲔 󽞜 󽞝 􂢅 􂢄 󽞬 􂢈 􂢉 䑕𣆎
ㄕㄨˇ：鼠鼡𤔆 󰲔 󽞜 󽞝 􂢅 􂢄 󽞬 􂢈 􂢉 䑕𣆎
ㄘㄞˊ：財 􁶸 财㒲戝𧴶𧵤 􁶺 􁶻 􁶼 􁶹 𧸄 􁶽 ㊖
　
　　用倉頡輸入法的好處，就是可以盲打——
一邊聽音樂、一邊閉著眼睛打字，也沒問題——
但要是聽到「嗶」的一聲，那就表示「有重複」字，常用的，也能知道該按那個數字鍵去選字，要是不常用的，就得用眼睛去看、去選——
如果候選字太多，得「翻到第二頁、第三頁……」，那「效率」就變低了！
還得瞪大眼睛，仔細去「挑字」，真是折磨眼睛啊——阿文老花二百五十度啦！
　　《倉頡碼檢索、構字部件檢索》——
檢索結果，能一頁顯示，還可以隨時「放大」，找字多容易啊！
　　《構字部件檢索》，可以方便檢索所需部件（有的部件，實在是奇形怪狀），乃至可以做「異體字檢索」，就看使用者，怎麼去運用啦！
　　對於不會倉頡輸入法的人，就算用「注音、拼音」去設定——
除了得「複製貼上」（不能直接輸入）之外，在找字上，當是比任何輸入法，還要便利的。
　　勞你有空多費心，將之完善，利益世人也！
　
　　　　　　　　　　　　　　　　　　阿文
　　　　　　　　　　　　　　　　　　　　2022.01.20.四　
　
※右側當不限於檢索「字」，也能設檢索「詞、句」等。
※檢索結果，全都變成「其它」（深灰色），若無法修正，
　其字背景色，宜改為淡色，字才會明顯。
　
※請用這個去修改！↓
◇構字部件檢索.7Z
　https://onedrive.live.com/?id=3AB1CB8A20E303FE%218861&cid=3AB1CB8A20E303FE
回覆刪除
回覆
阿文2022年1月22日上午8:40
WFG‥
　　用「\」反查的版本，試用結果，不甚理想也！
　　本來還單純的，輸入「倉頡碼查漢字、輸入漢字查倉頡碼」，也就可以啦！現在得加個「\」去反查，感覺就是「多此一舉」，還常會「忘記加」哩！
　　本來，右手可以一直抓著滑鼠，還得回來鍵盤，加打個「\」，實也不便，
後來，想在輔助楗盤上，加個「\」，只要用滑鼠點擊就好，結果也加不了。
（輔助鍵盤，其實也用不到，總是將它關了，好讓出檢索顯示空間。
　想來，得恢復《部件檢索》，輸入查詢框旁的「\」，使用才會方便些。）
　　以「資料檔」編排而言，這個《構字部件檢索》，當是更加人性、更加便利呀！
　　同音字、同碼字，都歸於音、碼之右側，總比每個字，都去加注音、拼音、倉頡碼，來得「省容量」呀！如果能夠使用正則符號「|」(和，兩項之間，選擇一項)，那就不用「注音、拼音、倉頡碼」，各設一次，也就更加便利。譬如‥
　
nxu|ㄍㄨㄟ|ɡui|ㄍㄨ|ku1：龜龟𪛉亀黾𠃾𠁴𤕣龜⻱龜⿔䶰𧑴𪚦𪚧𪚨𪚿𮯛𮯜𮯝𮯞𮯟龜𥦣𪚺 󰌢 󰐕 󰓧 󰱗 󰲎 󲣪 󲤊 󲤋 󲤌 󲤎 󲤏 󲤗 󲤘 󲤙 󲤚 󲤧 󲤨 󲤯 󷏽 󷕔 󷙨 󷧕 󹐝 󹕬 󺮛 󽘶 􂤄 􂤅 􂤆 􂤈 􂤉 􂤎 􂤏 􂤝 􂤞 􂤡 􂤪 􂤴 􂤵 􂤸 􂥕
　　如是，不管輸入倉頡碼、國語注音、拼音，台語注音、拼音（會四角號碼的，也可加上），都可以檢索「龜」字，及其「異體」；再如《倉頡碼檢索》，不用加「\」，即可反查其「倉頡碼、國語注音、拼音，台語注音、拼音」——
這樣可真是太便利、太完美啦！
　　如是，將同部首的，歸於一列，即是「部首檢索」，比如‥
sqsf|ㄇㄚˇ|ma3|ㆠㆤˋ|e2:馬馭馮馯馱馲馳馴馵馹駁駃 ……
　　如是，將同筆畫的，歸於一列，即是「筆畫檢索」‥
5:玄玉瓜瓦甘生用田疋疒癶白皮皿目矛矢石示禸 ……
9:面革韋韭音頁風飛食首香
　　不好用「|」，那就各分一個資料檔，再予以「串連」——
用《行列輸入法》（王志攀就用行列輸入法）的人，可以編個《行列輸入法》檔；
用《大易輸入法》的人，可以編個《大易輸入法》檔；
只會《注音輸入法》的人，可以編個《注音輸入法》檔；
會用《四角號碼》的人，可以編個《四角號碼》檔。
…………
　　除了得「複製～貼上（到其它文件上）」之外，再多的候選字，都能「一頁顯示」，還能「隨時放大」，而「任君挑選」——真是太美啦！
　　這樣，就真的能成為《漢字多樣檢索系統》啦！
　　廣告說‥「科技始終來自於人性。」
　　或當說‥「科技始終服務於人性。」
　　程式嘛！可以改來改去，而能夠更符合「人性需求」，令使用者，更加便利，可真是美哉！善哉！樂哉！
　　有了這個《漢字多樣檢索》，還可成為《部件檢索》的「最佳助手」哩！
（其功用，當是比《部件檢索》的「輔助鍵盤」，更加強大而便利的。）
　　王兄要是工作累了，想「換個口味」時，再來「修善」這個《構字部件檢索》（要改名為《漢字多樣檢索》啦）就好！得以完成，那便是大眾之福也！
　　　　　　　　　　　　　　　　　　阿文
回覆刪除
回覆
阿文2022年1月23日凌晨1:51
WFG‥
　　從《部件檢索》成型之後，其實就想到要試試《倉頡碼檢索》的——
只是《倉頡輸入法》，平常打字，根本也用不著那麼多字——
前一版的《部件檢索》，還算便利，所以也就懶得去試。
　　阿文看你那一萬三千多字的《手寫字形》——既有的字，皆已編了「倉頡碼」，想想‥若將《手寫字形》，編好倉頡碼，再轉換為既有的字，來加以對照，應該也就能較快整編完成。
　　如今「十七萬字」，只因為《部件檢索》不給力——
只好嘗試《倉頡碼檢索》啦！果然效果很好！
《倉頡碼檢索》，找不到的字，只好用「拆分」去《部件檢索》查字啦！
（《手寫字形》所附的簡略拆分，往往得加以「優化」呀！）
　　《倉頡碼檢索》的資料檔，以阿文這個完全不會程式的人而言，當然就是仿造《部件檢索》資料檔的方式，去整編啦！（冒號左側漢字，右側倉頡碼‥二十六個英文字母。）
　　但一般倉頡輸入法、大易輸入法、注音輸入法等等，都是‥
左側「詞頭」（英文字母、數字、注音），右側「關聯項目」（漢字、詞、句）。
（全宋體所附倉頡碼，便是如此形式呀！）
　　所以，簡單的說‥這個《漢字多樣檢索》，
冒號左側「詞頭」，就是「英文字母、數字、注音符號」（非漢字），
右側「關聯項目」，就是‥漢字、漢詞、漢句。
四角號碼，字根是以「４個數字」，去檢索「一個字」。
倉頡碼碼，字根最多是「５個英文字母」。
注音輸入法，是四個全型注音符號，字根大概算是「８」吧！
　　本來，《構字部件檢索》，只是為了便利找到所需的部件罷啦！
只要打個簡單的「倉頡碼」（英文字母或數字），就可以列出所設的「關聯項目」，也就不用每個「部件」，都用倉頡碼去輸入（遇到候選字太多，翻頁就挺沒效率的。）比如‥
　　想找部件，有關「、（點）」的，就設「i」(倉頡「戈」)‥
i:、 󰏴 灬丷𠁼⺀冫 󰉾 氵乊爫爫⺤䒑
　　想找部件，有關「一（橫）」開始的，就設「m」(倉頡「一」‥
m:一丅丄𠃍𪛙乛 󰑶 󰍅 𠫔𠫓 󰊓 𠮛㔿𤓯帀𢁓厈𠨭 󰏔 𧰧𬺻豖
ki:㐅乂义 󰍏 󱏽 𠂭 󰐑　（㐅與、的。）
ei:又叉㕚 󲧙 󲧣 􀪰 󰌃 㕛㕛叒叕　（又與、的。）
（不會「倉頡」的，就用自己熟悉的「注音、拼音」去設，也行呀！
　呵呵！大概也沒幾個「傻子」，會願意做這種費時、傷眼、勞神的事吧！）
　　比如部首「食、金」的等等偏旁，也有好幾個，都可以設「C（金）、oiav(食）」，去列出「關聯項目」——
如是，要找想用的部件，也就更容易、更快啦！
　　這「網頁檢索」，一大的好處，就是‥
隨時增修「資料檔」，存檔之後，也就能用了——
遇到奇形怪狀的「部件」，按自己的方式，去分類加入，下次遇到，就可以快速地，檢索出來用了。
　　比如‥看到構字部件有「𡆵」的，倉頡碼？ｗ……（還真猜不出來。）沒關係！只要加入「W」列，也就行啦‥
w:田龱 󰋁 𡆵𡆪囬囙囧𡆫 󰎱
hw:󰒹 囟囪 󵟂 囱甶𠒇𫤘　（丿與󰒹的。）
yw:𠧚𠧪卤卥鹵　（⺊與󰒹的。）
　　倉頡輸入法之快，還在於「重複低」，倘若「候選字」多到得翻面去找，那其效率，這時也就跟注音輸入法，差不多啦！
　　如是《構字部件檢索》，就跟過去倚天的「詞庫輸入法」類似——
能自己設定「詞頭、關聯項目」。
　　《構字部件檢索》，待《手寫字形》，整編完之後，也就「功成身退」啦！
以後，再編個「台語注音、拼音檢索」的資料檔，便又能發揮其效用了。
　　
　　　　　　　　　　　　　　　　　　阿文
　　　　　　　　　　　　　　　　　　　　
　
　　整編《手寫字形》，剩餘八千三百字，一不經意，又超時加工，累到不行……
回覆刪除
回覆
阿文2022年1月23日上午11:37
WFG‥
　　台諺道‥「頭家一下指，工仔做𠇺死。」
　　阿文國中畢業，開始做水電（後來有換途）；當兵回來，也做水電（後來也換途），故對於這句俗諺，頗有感觸也！
　　遇到那種，很有想法的頭家（顧主），也是很頭大。
　　有次，是遇到一個設計師，翻修自己的房子——設計圖，畫了好幾張，今天這樣，明天又改個樣，一個插座位置，改來改去——電線管道，就得打來打去；做好了，不滿意，他筆畫一畫，又得重做。
木工釘好了衣櫃，他才想到要在下頭，加個插座（可以用來插電風扇，想得真周到），你就得想法子，去生給他。
廚房磁磚都貼好了，他才想到要做個烤箱專用插座（二百二的電）——牽明線，嫌不好看，只好敲掉幾片磁磚，做好插座，土水師，再來貼磁磚。
　　台諺又有話說‥「主順主人意，著是好師傅。」
　　有時，也真會被「主人家」給氣死！明明「甲樣不好、乙樣好」，他就偏偏要「甲樣」——真要順著他的意去做，以後，他肯定要後悔！
　　有次，主人家，要給孩子房間的書桌，加個插座。（房屋整修還沒完成，書桌還沒去買。）
　　阿文有經驗嘛！看他畫的位置，大概會被「抽屜」擋住，就給他建議‥
「要嘛！高一點（在桌面），要嘛！偏一點（在桌下放倚子的空間）——
　這樣，要插拔插頭，也就比較方便。」
　　他堅持‥「沒關係！就在那裡！」
　　阿文也懶得去「說服他」，牆壁管道，就給他敲下去；接線盒，就給他裝下去。
　　隔兩天，他便打電話來，要阿文去「修改」啦！（他想想，還是跑去賣場，量了桌書的尺寸——是那種上面附有書架的書桌。）
　　還好，牆壁還沒抹水泥粗胚，改改位置，也不至於太費工。
　
　　故知‥專業、非專業；有經驗、無經驗——總會有差別的！
　　事前若能充份了解雇主的意思、需求，不善之處，予以建議，彼此溝通，當能避免「做白工」吧！
　　阿文不會程式，也不懂那些程式的邏輯，是故只會「想當然耳」！
想是「廢話」講一堆，也沒講在「重點」上，故教人搞不清楚‥「你到底要怎樣」吧？
　　上篇拉拉雜雜，說了一堆，未知是否能讓你了解意思？
　　《倉頡碼檢索》的資料檔編輯方式是‥
左側　　　　：右側
詞頭（漢字）：關聯項目（非漢字）
　
　　而《構字部件檢索》的資料檔編輯方式，則是‥
左側　　　　　：右側
詞頭（非漢字）：關聯項目（漢字、詞、句）
　　非漢字，包含‥數字、英文字母、注音符號。
　
　　比如阿文的倉頡碼有設‥
eyi:潘文良　（eyi「潘文良」倉頡碼的首碼。）
og：台北市南港區研究院路……　（og「住址」的倉頡碼首碼。）
這樣的設定，是很「個人化」的——自己記得，自己用得方便而已。
　　如依各種輸入法去設，當然是也就人人可用——
ybysp：龍竜𦱉𢅛𠊋㰍𥫈龒䰱　（用倉頡的。）
long2：龍竜𦱉𢅛𠊋㰍𥫈龒䰱　（用拼音的。）
01211：龍竜𦱉𢅛𠊋㰍𥫈龒䰱　（用四角號碼的。）
　　若以《倉頡碼檢索》資料檔的編法，就得每個字去加「拼音」或「倉頡碼」等。
"龍：long2;ybysp,01211","竜：long2;ybysp,01211","𦱉：long2;ybysp,01211","𢅛：long2;ybysp,01211",…………
　　這樣，雖有其好處，但也有所不便，還會增加其容量。
　　希望這說，你能真的了解！
　　有勞你費心、費工，真心感謝你！
　
　　語謂‥「工欲善其事，必先利其器。」
　　《構字部件檢索》，得以完善，那整編《手寫字形》的「拆分」，也就得以更加便利。
（徜若《部件檢索》夠給力，阿文大概也不會這麼「想孔想縫」了！
　阿文用「振興券」，去買了兩顆「固態硬碟」——
　聽說用來安裝作業系統，速度會加快很多很多。
　只是裝上去，居然讀取不到新硬碟……還得安裝「補件」什麼的，沒能搞定。
　只得待友人有空來幫忙了。）
　　好啦！累了、餓了，準備午餐去。
　　　　　　　　　　　　　　　　　　阿文
　　　　　　　　　　　　　　　　　　　　
回覆刪除
回覆
阿文2022年1月25日上午8:54
WFG‥
　　真是太感謝你了！
　　人謂‥「上帝把你關了一扇門，也會幫你開一扇窗。」
　　因為不給力的《部件檢索》，反而讓阿文，賺到了二個超好用的網頁程式！
　　用《倉頡碼檢索》，做字形精準查詢——找不到字，再用《部件檢索》，試著找找看，（呵呵！雖然不給力，也還是得用啊！）真的沒字，再用《構字部件檢索》，快速地，找到所想要的部件，去整編字形拆分——這樣的搭配，真是太完美啦！（見圖。）
　　昨晚，一邊整編《手寫字形》、一邊整編《構字部件檢索》，搞到凌晨三點多，累到手腕疼、眼睛痛，想說休息一下再上（好完成《構字部件檢索》資料檔），躺到床上，結果就睡著了。
　
　　整編《手寫字形》，剩餘七千五百字。
　　去泡杯麥片粉，吃吃早餐，再繼續努力啦！
　　　　　　　　　　　　　　　　　　阿文
　　　　　　　　　　　　　　　　　　　　2022.01.25.二　
　
※附圖
　https://www.facebook.com/groups/978821105480673/posts/5419454858083920/
回覆刪除
回覆
阿文2022年1月28日晚上11:13
WFG‥
　　有疑處‥
𥥘󶬬　重複收錄，後者註銷（2022/01/01）
　　以字形風格而論，當收後字「󶬬」如（𥤲󽃇󽄤󽄷），而註銷「𥥘」。
　
󲭥󿯯　重複收錄，後者註銷（2022/01/17）
　　《集韻考證》‥巨󲭥
〔注〕《說文》䂓巨也！古作「󲭥」
〔案〕■从工，此作「巨」，非。
　　　注「䂓」當作「規」，古文作■（當作「󿯯」）。
※篆文形似「󿯯」。
　　看來「󿯯」才是正字，而「󲭥」方為別字——故可別「註銷」了！
　
　　建議設個《漢字回收桶》（字型），將有疑問的字、不同風格的字，全都丟進去！
　　如「󱳻、󵏒」，二字亦可視為異寫——
若數錄後字（󵏒），則前字（󱳻），就丟到《漢字回收桶》（字型）去！
　　書法家寫字，未必會寫「正字」——
若「思」字的「心」，少寫一點（丶乚丶），謂之「少點心思」；
文章的「章」，寫成「􂔝」，謂之「文章貫日月」——
於是‥明明寫了「錯別字」，後來也變成「異體字」啦！
　
　　　　　　　　　　　　　　　　　　阿文
　　　　　　　　　　　　　　　　　　　　
　
◇教育部異體字典。巨
　https://dict.variants.moe.edu.tw/variants/rbt/word_attribute.rbt?quote_code=QTAxMTQ5LTAwNw
回覆刪除
回覆
Ahsum2022年2月5日晚上10:38
請問 ⿱艹吐有加入最新的字型?
回覆刪除
回覆
Mastameta2022年2月27日凌晨3:04
我本來以為𡞋是類推簡化字，後來發現來自 TF(CNS 15)-3422；你的《說文》也當做異體字。教育部異體字字典，雖有有参，並沒有𡞋，我見到的字典都沒收這個字，讓我疑惑。這個字怎麼加入CNS?
回覆刪除
回覆
Mastameta2022年2月28日晚上8:29
我也想作個現代簡體字表，目的不在簡繁轉換，而在找出不可能出現在古書的字，方便糾正mdx錯誤。（比方說，帶“参”部件的字，經常出現在古漢語mdx字頭索引，甚至官方資料也有。）目前這個表有分類：新簡、古字等，不求完善，能用就夠了。
對於補充字，我理解你的立場。像那個私有區字轉成Extension G字的表很有用。我的處理方式，一個劣點是不能用這種批量更新的工具。
回覆刪除
回覆
Mastameta2022年3月3日上午10:23
這些拆分重出：
󸡄 @主󰐬
􀈘 @扌亠吅己爻衣
􀈙 @亠吅己爻衣攵
􁪧 @虫巛内用
􁪩 @虫八内用
􂥥 @亻二丨丷
􂥦 @亻丩一八
􃉜 @糹𠫓内
回覆刪除
回覆
Mastameta2022年3月5日上午10:22
目前有三十字拆分用龜F908 部件；部件適合換成龜9F9C。

異體改變功能，考慮加這些替換：
叟：叟
乗：乘
󰋂：肉
𤣥：玄
甾：甾
亜：亞

只有一個相關字，不知是否值得加：
𡯁：尢
𠄑：𡳾

𡯁尢
𠄑𡳾
回覆刪除
回覆
Mastameta2022年3月5日上午10:41
舎：舍
回覆刪除
回覆
Mastameta2022年3月5日上午10:57
才注意到 F908 、9F9C 字形稍微不同。那麼，加異體替換：
龜：龜
回覆刪除
回覆
Mastameta2022年3月5日上午11:13
拆分：“兓日”合併為“󵦣”。

󵦣：朁
回覆刪除
回覆
Mastameta2022年3月5日中午12:56
󰑱F0471 部件有58字。
󰐔F0414 部件有523字。

F0471組理應當包含F0414組，但兩組之間只有幾個字重疊。

免得費工調理拆分，方便的解決方式是加上異體替換：
󰑱：󰐔

回覆刪除
回覆
Mastameta2022年3月5日下午4:03
􁳥 @訁𢆶𫠠丿
􁳤 @訁𢆶𫠠󰊄
夫 @一大‖󰐴㇏
关 @丷天‖䒑大‖𦍍㇏
󽹞 @車兓貝𮚋
􂊌 @釒𮚋
󱰗 @亻󸨟𣄼
𱀲 @⻖兂兓

𣩳 @歹兓曰!歹朁？？？
糣 @米󸨟曰!米朁？？？

有些分式，部件未合併：
兓貝>𮚋
兂兂>兓
󸨟曰>朁
玄玄>玆
幺幺>𢆶
夫夫>㚘
先先>兟

我自己用的加了這些異體替換：
乗:乘
󸨟:兓
叟:叟
冏:囧
𡯁:尢
𡰣:尸
甾:甾
󰋂:肉
舎:舍
龜:龜
𡳾:𠄑
󰑱:󰐔（或許把“󰑱!󰐔一”換成“󰑱@󰐔一”）
𤮺:󰑈
𡔜:声
回覆刪除
回覆
Mastameta2022年3月6日下午2:24
謝謝指教。我昨天試探了 󰊓:丌異體替換，發現效果不良，󰋂:肉同樣不妥。（𡔜:声，校對中華大字典mdx時，碰到一個相關案子，現在想不起來，但也不值得追究。）
除了形義相通兩個條件，又要考慮具體搜尋結果，現在知道替換不能隨便加的呵呵。
我也考慮另一方面：多了一個異體替換，我用的‘部件鍵盤’也可以省略一個罕用的‘鈕’。

我常用“󰐔”部件，但偶爾找不到東西，所以也備份了“󰑱”。比方說，“𭭡”（應該是@󰑱止||󰐔正），“󰐔”部件查不到“𭭡”---除非勾選“無理拆分”。看來，我對“無理拆分”的功能不是很有把握，一方面使用者要理解字的具體分式狀況才能預測搜尋的效果。
回覆刪除
回覆
Mastameta2022年3月14日凌晨3:34
這兩個條件
門@𠁣𠃛
"𠁣":"戶"

讓“包容異體”行為怪怪的。如果勾選“包容異體”，然後查“戶”，所有“門”部件的字也都會冒出來。

也許“門”的分式該改成“!𠁣𠃛”。
回覆刪除
回覆
Mastameta2022年3月14日凌晨3:57
2F9CB 字形與台源字例不合，而且重複了278AE字形。
回覆刪除
回覆
Mastameta2022年3月14日凌晨4:41
𬿪𭯣𰣗𰻘，字形用奧，分式用奥
回覆刪除
回覆
Mastameta2022年3月14日下午3:22
好主意。2F9CB 字碼掛 4695 的 K 源字形，這樣康熙體可以展現出來了。
回覆刪除
回覆
Mastameta2022年3月15日下午4:36
𭳌@氵緒（非緖）
回覆刪除
回覆
Mastameta2022年3月23日下午6:58
䏞43DE 𦚜2669C
全宋體兩個字形幾乎重複。

43DE來自康熙字典；也許2669C該棄用。
回覆刪除
回覆
Mastameta2022年3月24日凌晨2:47
嗯嗯我之前已經揣測你的難處和處事用意。之所以我沒提起全宋體43DE與台源字例不合。
我碰到這個案子時，本來懷疑其中一個是否該从月，後來發現並不是，但从未的字形又不規範，哈哈真是難搞。
我說 2669C 該棄用，實際上是提醒自己，而不建議全宋體該怎樣。
回覆刪除
回覆
Mastameta2022年4月6日下午4:54
𦍉26349，也許Unicode後來改了字例。目前所有商業字型都跟規範字例不合。
回覆刪除
回覆
Mastameta2022年4月6日下午4:58
（其越南簡化字是𡚎2168E，右邊部件也是“奇”，不是“竒”。）
回覆刪除
回覆
Ahsum2022年4月11日下午2:10
請問穴角有加入最新的字型?
回覆刪除
回覆
Ahsum2022年4月13日下午1:50
請問竹口日隻有加入最新的字型?
台語聖經 https://imgur.com/a/W8RyJZu
回覆刪除
回覆

新增留言

訂閱：張貼留言 (Atom)

2021年12月28日 星期二

漢字使用環境的建置 ——十七萬漢字初稿登場

130 則留言:

2021年12月28日星期二