Skip to content

实例:替换辅助码

数据准备

将想要的辅助码按「一行一字、空格分隔」的格式写入 data/userdb.txt

我 ab
我 cd
你 ef

其中,一个字可以含有多个辅助码。第一个辅助码被称作「正码」,剩下的被视作容错码。

单字

涉及 moran.chars.dict.yaml

bash
python3 schemagen.py \
    --auxiliary-code=user \
  gen-chars

INFO

如果主要使用简化字,请设置相应拼音表。

bash
python3 schemagen.py \
    --pinyin-table=data/pinyin_simp.txt \
    --auxiliary-code=user \
  gen-chars

整句词库

涉及 chars 和 fixed 之外的 compact dict。compact dict 中所有词都有完整编码,比较易于识别。也可以查看 update-compact-dicts.sh 中的列表。

bash
python3 schemagen.py \
    --auxiliary-code=user \
  update-compact-dict \
    --rime-dict=../moran.foo.dict.yaml

简码词库

建议使用 gen-fixed 重新生成简码。

bash
python3 schemagen.py \
    --auxiliary-code=user \
  gen-fixed \
    --charset=data/trad_chars.txt \
    --input-dict=data/trad_words.txt