2022年6月10日 星期五

漢字使用環境的建置 ——十八萬漢字初稿登場

去年底我與 suns99 兄初步完成了《教育部異體字字典》宋體字頭的清理工作後(尚有 13830 個手寫字形待清理),本來打算休息一年,先把工作重點放在拆分數據的完善上。結果阿文兄硬是不讓我休息,跳出來說要幫忙清理手寫字形的部份,呵呵!計畫趕不上變化,於是只好牙根一咬繼續拼下去了。在經過波波折折、兩度重新編碼後,終於在半年後完成了全部的清理工作,共新增 8289 個手寫字形至字庫,《教育部異體字字典》的所有字頭全數「文字化」。至此「全宋體」這個大型字庫,收字正式突破了十八萬漢字,涵蓋了四大字典(《漢字海》、《教育部異體字字典》、《中華字海》、《漢語大字典》)的所有字頭,應該足供專業等級的漢字應用。