自制天然码输入法
这几个礼拜很忙,要跟踪的事情太多,部落格也好久没有更新了。这段时间抽空,用HW改造的输入法生成器生成了天然码输入法,方法如下:
1. 从天码网站下载的单字库(目前好像已经不能下载了)
2. 构建码表源文件,然后生成基本的码表
3. 从网络上找来一些五笔词库或者拼音词库,删除里面的数字和英文,去掉文本文件中的空格和单字,仅留下词语。这个方法很简单,会vi编辑器就行了。用vi编辑词语文件,然后进行替换。方法如下:
:%s/ //g
:%s/[0-9a-zA-Z]//g
要去掉单字就麻烦些了,要用到awk,并且在linux环境里面进行。先将文件转成unix格式,然后在console模式下,使用awk:
cat ci.txt | awk ‘{if(length($0)>2) print $0}’ > trm.txt
4. 后用TXT文本切割器将词语文件切割成7k大小的文本文件,利用输入法生成器的批量造词功能,将每个词文件生成词语码表源文件。输入法生成器无法处理大于10k(约1000行)的文件,必须要切割,不得已而为之,这个地方要麻烦点。
5. 将所有码表源文件合成一个码表源文件,这个很简单啦,用txt文件合成器,或者linux下的cat命令都是很容易做到的。
6. 对码表源文件进行处理,删除其中不常用的词语和重码,这个地方比较花时间。
7. 利用输入法生成器生成最终可以应用的码表和ime文件并进行安装。如果不能顺利生成码表,看看码表源文件里面是不是有些符号之类的,生成器无法辨认的,要进行删除才能继续进行。
8. 经过以上步骤,就可以使用自己生成的输入法了。
以上即为生成自己使用的天然码的方法。当前一套天然码智能输入法要365块一套,俺们穷人用不起,只有采用这样的方法了。并且官方的天然码输入法的字体是那种粗体黑体,候选字非常难以辨认,并且词库也不是很丰富。多亏有HW改造的输入法生成器,可以选择自己要使用的字体,所以字体好看得多,也可以使用自己编辑的词库,修正一些官方输入法里面的小毛病。以下为我生成的天然码输入法的选字候选框,是不是好看得多?

刚听闻HW的小宝宝刚出生了,在这里祝福HW的宝宝健康成长!
另,因此输入法涉及版权问题,请大家不要将它用于赢利用途,否则有可能遭到起诉!自己研究一下倒是不错,这可是俺的首选输入法呀,这么多年来一直用它,已经习惯了,离不开它了,呵呵。