使用者:Xyb/轉換Unihan資料

維基詞典,自由的多語言詞典

經 Shizhao 提議,編寫了一個轉換 Unihan 資料的腳本。

http://xie.freezope.org/upload/Files/unihan-0.1.py

現在程序已經可以解析指定字符的所有信息。對這些信息的更深入使用正在探索中。下一步準備:

  • 讀音轉換為 yā 的樣式
  • 把詞組按照正序、逆序、其它分類

執行效果:

$ ./unihan.py 4e2b

字: 丫

==编码==
*十进制:20011
*UTF-8: E4 B8 AB 
*UTF-16: 4E2B
*UTF-32: 00004E2B

==读音==
*[[普通话]]: YA1
*[[粤语]]: A1
*Tang:    
*Japanese On: A
*Japanese Kun: HUTAMATA AGEMAKI
*Sino-Korean: A
[[小丫钷]], xiao3yatou5, a little girl (expressing contempt or endearment); a young housemaid 
[[丫]], ya1, slave girl
[[丫钷 丫鬟 丫鬟兒]], yatou5 yahuan5 yahuar5, (in old China) a slave girl; a bought maid; a maid; (丫钷 in; modern usage) a small girl, especially one's own daughter 
[[丫枝]], yazhi, a forked branch 

程序還在編寫中,請提出您的寶貴意見。

該腳本可在 Windows 下直接使用(需要從[1]安裝Python程序)。