实例:替换辅助码
数据准备
将想要的辅助码按「一行一字、空格分隔」的格式写入 data/userdb.txt
:
我 ab
我 cd
你 ef
其中,一个字可以含有多个辅助码。第一个辅助码被称作「正码」,剩下的被视作容错码。
单字
涉及 moran.chars.dict.yaml
bash
python3 schemagen.py \
--auxiliary-code=user \
gen-chars
INFO
如果主要使用简化字,请设置相应拼音表。
bash
python3 schemagen.py \
--pinyin-table=data/pinyin_simp.txt \
--auxiliary-code=user \
gen-chars
整句词库
涉及 chars 和 fixed 之外的 compact dict。compact dict 中所有词都有完整编码,比较易于识别。也可以查看 update-compact-dicts.sh
中的列表。
bash
python3 schemagen.py \
--auxiliary-code=user \
update-compact-dict \
--rime-dict=../moran.foo.dict.yaml
简码词库
建议使用 gen-fixed
重新生成简码。
bash
python3 schemagen.py \
--auxiliary-code=user \
gen-fixed \
--charset=data/trad_chars.txt \
--input-dict=data/trad_words.txt