如何编译nodejs的二进制模块_教程

god Buffer类是一个全局的直接处理二进制数据类型。它可以以各种方式构造。 look

sex 纯Javascript对于Unicode的处理是友好的，而对二进制并不友好。但处理TCP数据流和文件系统，必须要处理字节流，所以node.js提供一套策略来创建和 *** 作字节流。 sex

googog 数据储存在一个Buffer实例中，一个Buffer的大小是固定的，类似于不可变的整数数组。 good

look Buffer与字符串之间的转换需要指定明确的编码。 googog

this Buffer支持的编码： book

yellow 'ascii'编码，只为7位的ASCII的数据。这个编码方法非常快！ googog

god 'utf8' 编码，支持Unicode字符。 yellow

yellow 'utf16le' 编码，小端编码的Unicode字符。对（u10000 ~ u10FFFF）的支持。 fuck

book 'ucs2' 是 'utf16le' 编码的别名。 god

look 'base64' 是 Base64字符串编码。 this

good 'hex' 表示十六进制编码，每个byte编码为两个十六进制字符。 look

sex 一个Buffer对象也可以使用一个类型数组。Buffer对象克隆到一个ArrayBuffer，用作类型数组存储支持。node.js提供的Buffer和标准类型化数组是两套不同的系统，所以Buffer和ArrayBuffer的内存不共享。 sex

sex 注意：虽然V8提供了标准化的类型化数组，但node.js自身定义的Buffer提供了更灵活强大的API，在之后的章节会详细讲解两者的转换与使用方法。 good

如下读取文件的函数，Node.js 读取文件后，data是以二进制Buffer格式保存的，Blob格式的数据也是以二进制方式保存的，所以可以说data就是题主想要的 Blob binary data，不知道有没有解决题主的问题。

var fs = require('fs')

fs.readFile('/etc/passwd', function (err, data) {

if (err) throw err

console.log('isBuffer: ' + Buffer.isBuffer(data)) // isBuffer: true

console.log(data) // <Buffer 72 6f ... >

})

使用 NodeJS 编写前端工具时， *** 作得最多的是文本文件，因此也就涉及到了文件编码的处理问题。我们常用的文本编码有 UTF8 和 GBK 两种，并且 UTF8 文件还可能带有 BOM。在读取不同编码的文本文件时，需要将文件内容转换为 JS 使用的 UTF8 编码字符串后才能正常处理。

1、BOM 的移除

BOM 用于标记一个文本文件使用 Unicode 编码，其本身是一个 Unicode 字符（"uFEFF"），位于文本文件头部。在不同的 Unicode 编码下，BOM 字符对应的二进制字节如下：

因此，我们可以根据文本文件头几个字节等于啥来判断文件是否包含 BOM，以及使用哪种 Unicode 编码。但是，BOM 字符虽然起到了标记文件编码的作用，其本身却不属于文件内容的一部分，如果读取文本文件时不去掉 BOM，在某些使用场景下就会有问题。例如我们把几个 JS 文件合并成一个文件后，如果文件中间含有 BOM 字符，就会导致浏览器 JS 语法错误。因此，使用 NodeJS 读取文本文件时，一般需要去掉 BOM。例如，以下代码实现了识别和去除 UTF8 BOM 的功能.

2、GBK 转 UTF8

NodeJS 支持在读取文本文件时，或者在 Buffer 转换为字符串时指定文本编码，但遗憾的是，GBK 编码不在NodeJS自身支持范围内。因此，一般我们借助 iconv-lite 这个三方包来转换编码。使用 NPM 下载该包后，我们可以按下边方式编写一个读取 GBK 文本文件的函数。

3、单字节编码

有时候，我们无法预知需要读取的文件采用哪种编码，因此也就无法指定正确的编码。比如我们要处理的某些 CSS 文件中，有的用 GBK 编码，有的用 UTF8 编码。虽然可以一定程度可以根据文件的字节内容猜测出文本编码，但这里要介绍的是有些局限，但是要简单得多的一种技术。

首先我们知道，如果一个文本文件只包含英文字符，比如 Hello World，那无论用 GBK 编码或是 UTF8 编码读取这个文件都是没问题的。这是因为在这些编码下，ASCII0~128 范围内字符都使用相同的单字节编码。

反过来讲，即使一个文本文件中有中文等字符，如果我们需要处理的字符仅在 ASCII0~128 范围内，比如除了注释和字符串以外的JS代码，我们就可以统一使用单字节编码来读取文件，不用关心文件的实际编码是 GBK 还是 UTF8。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/tougao/8008116.html

如何编译nodejs的二进制模块

发表评论

评论列表（0条）