Python去掉拼音的音调
简介在做一些爬虫的时候,有些网站上的文字带有拼音,并且还有音调,在数据库中为了更好的体现排序,所以需要将音调去掉。所以一下就想到了Python来进行处理,确实很方便。
环境:Windows10 + Python 2.7.15
直接上代码:
#!/usr/bin/python
# -*- coding: utf-8 -*-
import unicodedata
mystr=u"lā bāng jié pài"
print(unicodedata.normalize('NFKD', mystr).encode('ascii','ignore'))
运行结果:
E:\python\chengyu\venv\Scripts\python.exe E:/python/chengyu/run.py la bang jie pai Process finished with exit code 0