TA的每日心情 | 奋斗 2022-7-4 09:45 |
---|
签到天数: 28 天 [LV.4]偶尔看看III
版主
- 积分
- 5491
|
楼主 |
发表于 2020-5-5 10:12:49
|
显示全部楼层
上面讲了如何使用有统计词频的数据制作启程输入法的词库原始文件。
这里再讲一下如何通过原始文件制作启程输入法词库。
首先确定你的词库是有词频信息的。
从菜单的工具中打开“词库编辑器”
界面左边是一个列表,右边是一个词频导入范围数据。
词频导入范围用来将词库根据词频来分组。
例如根据上面的词频分布数据,我将词频>50的词认为是高频词,可以在这里限定最大值为250,最小值为50, 再从原始文件导入。
程序自动过滤出在指定范围的词形成一组。
再将值调整为最大值49,最小值20,重新用这个文件再导入新组,形成常用词。
最后再将最大值调整为19, 最小值调整为0, 导入就获得了稀有词组。
最后按照自己的情况修改一下组信息保存就好了。
|
|