1. 程式人生 > >python中文按拼音排序

python中文按拼音排序

bash中要對中文排序,只需:
LC_COLLATE="zh_CN.UTF8" sort /tmp/a就可以。
同樣的,python中只需:
import locale
locale.setlocale('LC_COLLATE', 'zh_CN.UTF8')
a = ['中國人', '啊', '你好', '臺灣人']
b = sorted(a, cmp = locale.strcoll)
locale本身不是執行緒安全的,根據下面這篇討論,可以使用contextmanager解決。

http://stackoverflow.com/questions/11121636/sorting-list-of-string-with-specific-locale-in-python

有的伺服器不能locale不能設定成功,需要安裝語言包:

sudo apt-get install language-pack-zh*