Skip to content

词库维护

如何造词?

类整句模式(默认模式、整句模式、辅筛模式)下,任何连续输入的文本都会被添加到用户词库中。

字词模式下,默认情况下只能打词库和用户词库中有的词。要添加新词到用户词库中,可以使用单引号快捷加词

INFO

类整句模式的用户词库保存在用户目录下的 moran.userdb 中。该目录是 LevelDB 数据库文件,不能直接编辑修改,但可以用 Rime 提供的词库管理程序导出或导入 txt。

字词模式的用户词库保存在用户目录下的 moran_fixed.txt 或 moran_fixed_simp.txt 中,可以直接使用文本编辑器查看和修改。

如何把词语写入词库文件?

字词模式:编辑 moran_fixed.dict.yaml(传承字码表)或 moran_fixed_simp.dict.yaml(简化字码表)。

整句模式:编辑 moran.extended.dict.yaml,

# 用户自定义词库
# ^ 在此提示之后,按 <词> <tab> <编码> 的格式一行一个词。

# 可以不加编码,Rime 会自动生成编码
魔然说明书

# 编码可以任取,甚至字数和音节数不匹配也可以
# 通过这种方式可以使得整句中可以混入「简码」连打
什么	sm
为什么	wsm

如何导入其他词库文件?

对于类整句方案(默认模式、整句模式、辅筛模式),编辑 moran.extended.dict.yaml,在 import_tables 下输入自己的词库名。

WARNING

词库需是原生双拼词库。具体格式可参考 moran.base.dict.yaml。

词语编码可以没有辅码,但这样的词语在默认模式和整句模式中不能加辅(辅筛模式不受影响)。

我们提供词库格式转换工具

作为一个用例,您可以把字词模式词库完全导入到整句词库中(虽然不建议这样的用法):

附录:有哪些词库文件?

词库文件分为两类:

  • 整句词库,由类整句方案使用,包括默认模式整句模式辅筛模式
    • 上述方案直接引用 moran.extended.dict.yaml,该文件中导入以下词库
      • moran.chars.dict.yaml 单字全码定义
      • moran.base.dict.yaml 核心词库
      • moran.words.dict.yaml 本方案扩充词库
      • moran.tencent.dict.yaml 腾讯词向量词库
      • moran.computer.dict.yaml 计算机术语词库
      • moran.moe.dict.yaml 萌娘百科词头
      • moran.hanyu.dict.yaml 汉语大词典(默认未开启)
  • 字词和简码词库,由字词模式默认模式使用
    • moran_fixed.dict.yaml 传承字码表
    • moran_fixed_simp.dict.yaml 简化字码表