Wednesday, June 17, 2009
濁音を清音に変換(python)
データベースを作成しているのだが、 タイトルを50音順に並べる必要がある。
そのためには...
- 漢字かな混じりを読み(かな)に変換
- よみの濁音を清音に変換
- 長音を修正(きーほるだ→きいほるだ)
- ソート
とりあえず濁音を清音に変換
漢字かな混じりをよみに変換するのは、YahooWebAPIのお世話になることとして、 とりあえず、よみの濁音の清音への変換コード。
class MyUtil(object) :
def fixDakuon(self,str):
r=''
for char in str:
r = r+self.__fixDakuon(char)
return r
def __fixDakuon(self,str):
dakuons=u'がぎぐげござじずぜぞだぢづでどばびぶべぼぱぴぷぺぽ'
seions =u'かきくけこさしすぜそたちつてとはひふへほはひふへほ'
for i in range( len(dakuons) ) :
dakuon = dakuons[i]
if dakuon == str:
return seions[i]
return str
使い方
str=u'がんばって'
util=MyUtil()
print util.fixDakuon(str)
