Node.JS刮擦编码?

Node.JS刮擦编码?,第1张

Node.JS刮擦编码

页面似乎是用iso-8859-1编码的。您需要

request
通过传递
encoding: null
并使用诸如node-
iconv之
类的东西来告诉您退回未编码的缓冲区。

如果要编写通用搜寻器,则必须弄清楚如何检测遇到的每个页面的编码以正确对其进行解码,否则以下情况应适用于您的情况:

var request = require('request');   var iconv = require('iconv');request.get({   url: 'http://www.relaisentrecote.fr',          encoding: null,        }, function(err, res, body) {         var ic = new iconv.Iconv('iso-8859-1', 'utf-8');          var buf = ic.convert(body);         var utf8String = buf.toString('utf-8');    // .. do something with utf8String ..});


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/4909950.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-11-12
下一篇 2022-11-12

发表评论

登录后才能评论

评论列表(0条)

保存