Python去掉拼音的音调

xiaohai 2019-01-03 21:21:24 2005人围观 标签: Python  拼音 
简介在做一些爬虫的时候,有些网站上的文字带有拼音,并且还有音调,在数据库中为了更好的体现排序,所以需要将音调去掉。所以一下就想到了Python来进行处理,确实很方便。

环境:Windows10 + Python 2.7.15

直接上代码:

#!/usr/bin/python # -*- coding: utf-8 -*- import unicodedata mystr=u"lā bāng jié pài" print(unicodedata.normalize('NFKD', mystr).encode('ascii','ignore'))

运行结果:

E:\python\chengyu\venv\Scripts\python.exe E:/python/chengyu/run.py la bang jie pai Process finished with exit code 0