2007年11月30日金曜日

pythonとmecabでchasendもどき

python+cmecabを使って、chasen server(chasend?)もどきを書きました。
LuceneでJapaneseAnalyzer+ChasenTokenizerで使う事しか考えてないけど、とりあえず使える。

いまいち仕様がわからないので、ChasenTokenizerのソースとmecab -Ochasenの出力を見て書いてみた。



ubuntu7.10をcoLinuxで

いろいろWindows用にポーティングしたりするのに疲れたので、ubuntu7.10をノートに入れたcoLinux(Snapshot 20071105 of version 0.8.0 with kernel 2.6.22,compiled with gcc 4.1.2)で使えるようにしてみた。
coLinuxでUbuntu 7.04をネットワークインストールを参考に、7.10のファイルを使うようにしただけ。
ネットワークはslirpにした。

初めてubuntuつかうけどdebian使ってた(まだ残ってるけど)から、まあなんとなく勝手はわかる。
メイン機以外だとビルドしまくるgentooは厳しいし、メモリが多くないノートだとOpenSolarisをVMWareで動かすのも厳しい。
deibanのsidとか、gentooの~みたいなのはないのかな?experimentalってやつかな?



excelで文字列をセル参照として使う

頼まれたので簡単に調べてみた。

  • 文字列の連結は&
  • 文字列をセル参照指定としてつかうには、INDIRECT
2つの値の組み合わせによって値を変えたかったので、
  1. 1つ目の値を列指定文字に変換(IFでやった)
  2. 2つ目の値を行指定文字に変換(IFで)
  3. 連結(&で)
  4. INDIRECTで参照
でおわり。



2007年11月22日木曜日

sorting a dictionary by value

pythonで辞書の値でソートしたかったので適当に考えてみたけど、検索したら普通の方法っぽい。


>>> d = {"a": 9, "b":5, "c":10, "d":0}
>>> for i in sorted([(v, k) for k, v in d.items()]):
    print i
  
(0, 'd')
(5, 'b')
(9, 'a')
(10, 'c')
>>>