使用者:Xyb/轉換Unihan資料
< User:Xyb
經 Shizhao 提議,編寫了一個轉換 Unihan 資料的腳本。
http://xie.freezope.org/upload/Files/unihan-0.1.py
現在程序已經可以解析指定字符的所有信息。對這些信息的更深入使用正在探索中。下一步準備:
- 讀音轉換為 yā 的樣式
- 把詞組按照正序、逆序、其它分類
執行效果:
$ ./unihan.py 4e2b 字: 丫 ==编码== *十进制:20011 *UTF-8: E4 B8 AB *UTF-16: 4E2B *UTF-32: 00004E2B ==读音== *[[普通话]]: YA1 *[[粤语]]: A1 *Tang: *Japanese On: A *Japanese Kun: HUTAMATA AGEMAKI *Sino-Korean: A [[小丫钷]], xiao3yatou5, a little girl (expressing contempt or endearment); a young housemaid [[丫]], ya1, slave girl [[丫钷 丫鬟 丫鬟兒]], yatou5 yahuan5 yahuar5, (in old China) a slave girl; a bought maid; a maid; (丫钷 in; modern usage) a small girl, especially one's own daughter [[丫枝]], yazhi, a forked branch
程序還在編寫中,請提出您的寶貴意見。
該腳本可在 Windows 下直接使用(需要從[1]安裝Python程序)。