2013年7月6日土曜日

Igo-python 0.9.3リリースしました

igo-python 0.9.3をリリースしました。前のエントリのとおり拡張領域にある文字を扱えるようにしたものです。この対応で、Unicode文字列として持っていたデータをunsigned shortのarrayとして持つようになりました。そのせいか少しだけ高速化されたようです。このような対応を行った理由は前のエントリにあるとおり、辞書内の文字列がUTF-16(Javaのchar)であるためです。

timeitで簡単に測ってみました。青空文庫の夏目漱石、吾輩は猫であるを解析するのにかかった秒数です。

この後の予定は、パッケージングなどの見直し、その後にmmap対応を考えています。

0 件のコメント:

コメントを投稿