Tuesday, November 14, 2006

UTF-8と文字数カウント

UTF-8環境であることを前提とする。

>>>s = "あいうえおかきくけこさしすせそ"
>>>len(s)
45
>>> len(unicode(s,'utf-8'))
15
>>>len(unicode(s,'utf-8').encode('euc-jp','replace'))
30

0 Comments:

Post a Comment

<< Home