词库维护
如何造词?
类整句模式(默认模式、整句模式、辅筛模式)下,任何连续输入的文本都会被添加到用户词库中。
字词模式下,默认情况下只能打词库和用户词库中有的词。要添加新词到用户词库中,可以使用单引号快捷加词。
INFO
类整句模式的用户词库保存在用户目录下的 moran.userdb 中。该目录是 LevelDB 数据库文件,不能直接编辑修改,但可以用 Rime 提供的词库管理程序导出或导入 txt。
字词模式的用户词库保存在用户目录下的 moran_fixed.txt 或 moran_fixed_simp.txt 中,可以直接使用文本编辑器查看和修改。
如何把词语写入词库文件?
字词模式:编辑 moran_fixed.dict.yaml(传承字码表)或 moran_fixed_simp.dict.yaml(简化字码表)。
整句模式:编辑 moran.extended.dict.yaml,
# 用户自定义词库
# ^ 在此提示之后,按 <词> <tab> <编码> 的格式一行一个词。
# 可以不加编码,Rime 会自动生成编码
魔然说明书
# 编码可以任取,甚至字数和音节数不匹配也可以
# 通过这种方式可以使得整句中可以混入「简码」连打
什么 sm
为什么 wsm
如何导入其他词库文件?
对于类整句方案(默认模式、整句模式、辅筛模式),编辑 moran.extended.dict.yaml,在 import_tables
下输入自己的词库名。
WARNING
词库需是原生双拼词库。具体格式可参考 moran.base.dict.yaml。
词语编码可以没有辅码,但这样的词语在默认模式和整句模式中不能加辅(辅筛模式不受影响)。
我们提供词库格式转换工具。
作为一个用例,您可以把字词模式词库完全导入到整句词库中(虽然不建议这样的用法):
附录:有哪些词库文件?
词库文件分为两类:
- 整句词库,由类整句方案使用,包括默认模式、整句模式、辅筛模式
- 上述方案直接引用 moran.extended.dict.yaml,该文件中导入以下词库
- moran.chars.dict.yaml 单字全码定义
- moran.base.dict.yaml 核心词库
- moran.words.dict.yaml 本方案扩充词库
- moran.tencent.dict.yaml 腾讯词向量词库
- moran.computer.dict.yaml 计算机术语词库
- moran.moe.dict.yaml 萌娘百科词头
- moran.hanyu.dict.yaml 汉语大词典(默认未开启)
- 上述方案直接引用 moran.extended.dict.yaml,该文件中导入以下词库
- 字词和简码词库,由字词模式和默认模式使用
- moran_fixed.dict.yaml 传承字码表
- moran_fixed_simp.dict.yaml 简化字码表