u'\\uff0c\\u73b0\\u573aRose\\u732e\\u6b4c\\u906d\\u4f17\\u4eba\\u56f4\\u89c2'我有一段汉字很长,这里是一部分,是unicode编码,但是因为是\\u不是\u所以无法解析成汉字。请问如何...
u'\\uff0c\\u73b0\\u573aRose\\u732e\\u6b4c\\u906d\\u4f17\\u4eba\\u56f4\\u89c2'
我有一段汉字很长,这里是一部分,是unicode编码,但是因为 是\\u 不是\u所以无法解析成汉字。请问如何替换\\u ---->\u
变成u'\uff0c\u73b0\u573aRose\u732e\u6b4c\u906d\u4f17\u4eba\u56f4\u89c2'
使用replace没有效果。谁有办法么???求解
我有一个比较变态的解决方法----利用json来解析。因为json在编码时会被转化为unicode字符串,将这个字符串拼接到一个json中,再解析,就可以达到目的。
import json
s = u'\\uff0c\\u73b0\\u573aRose\\u732e\\u6b4c\\u906d\\u4f17\\u4eba\\u56f4\\u89c2'
ss = s.encode('utf8')
x = json.loads('{"foo":"%s"}' % ss)
print x['foo']
这时,x['foo']已经是正常的unicode对象了。
其实你看到的双斜杠\\只是一个斜杠,因为斜杠是转义字符。