该页面似乎是用iso-8859-1编码的。您需要
request通过传递
encoding: null并使用诸如node-
iconv之类的东西来告诉您退回未编码的缓冲区。
如果要编写通用搜寻器,则必须弄清楚如何检测遇到的每个页面的编码以正确对其进行解码,否则以下情况应适用于您的情况:
var request = require('request'); var iconv = require('iconv');request.get({ url: 'http://www.relaisentrecote.fr', encoding: null, }, function(err, res, body) { var ic = new iconv.Iconv('iso-8859-1', 'utf-8'); var buf = ic.convert(body); var utf8String = buf.toString('utf-8'); // .. do something with utf8String ..});
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)