Saturday, June 20, 2009
ひらがなをローマ字に変換(python)
googleのbloggerのように記事のタイトルを使ってアルファベットだけで構成された文字列に 変換するメソッド(kana_to_romaji)を書いたのでメモ。
やっていることは、ひらがなをローマ字表記に変換しているだけ。
漢字を含んだ文字列は処理できないので、いったん YahooWebAPI"日本語形態素解析"を使ってひらがなだけの文字列に 変換したあと、kana_to_romaji メソッドを呼び出す。
(こんなことは、
KAKASIなどを使えば簡単にできるだろうに・・・
Google App Engine上で使いたいので、KAKASIを呼び出すことはできない。)
単にひらがなをローマ字に変換するだけなら、辞書は必要ないのだから、
標準のpythonモジュールに含まれているかも。
とりあえず書いてしまったので、ここにコードをメモ。
