python中文分字英文分词程序

python中文分字英文分词程序,第1张

def wordSeg(str):
   english = 'abcdefghijklmnopqrstuvwxyz0123456789'
   output = []
   buffer = ''
   #str=str.lower()
   for s in str:
      if s in english or s in english.upper(): #英文或数字
         buffer += s
      else: #中文
         if buffer:
            output.append(buffer)
         buffer = ''
         output.append(s)
   if buffer:
      output.append(buffer)
   return output

str = '我叫Xiaoming,来自山东,今年2岁了,今天星期一,大家早上好,Good morning'
print(wordSeg(str))

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/738122.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-04-28
下一篇 2022-04-28

发表评论

登录后才能评论

评论列表(0条)

保存