零知识证明将如何重新定义区块链的运作方式_技术

用最简单方式说透「精简区块链」实现方式和巨大价值。

关于零知识证明（ZKP）的技术类博客文章很多，最近我也写了一篇文章，比较各种新的通用目的的 zk-SNARK。我发现，关于零知识证明的用例，很少有用非技术语言表述的文章。事实上，零知识证明不仅可用在隐私方面，还有许多其他用途。它功能如此丰富，甚至有可能重新定义区块链的运作方式。

精简区块链，从GB压缩到KB

区块链的区块可能会很大，而且其大小在不断增长。这源于其最初的设计。我们也渐渐接受了这个现实。但是，Coda 项目最近发布的测试网却不同。

首先，Coda的区块链是固定大小的，且不会增长；其次，它只有22KB！即便是上世纪 80 年代的 8 位机家用电脑 Commodore 64 或 ZX Spectrum，也能把它塞进去。而且，与传统的区块链相比，Coda 的安全性差不多，甚至更高。

类似但功能更多的「精简区块链」项目越来越多，比如 Mir 和 Starling（我本人也参与了 Starling 项目）。

这到底是如何做到的呢？

只要尝试部署过一个区块链节点，你就会知道这个过程有多痛苦：同步一个节点需要好几个小时、甚至数天时间。区块链如此之大，以至于大多数的家用计算设备的磁盘空间和带宽都达不到基本要求。结果就是中心化。即便像以太坊这样广受欢迎的区块链，其节点数量也就 10，000 个，大多数都托管在亚马逊 AWS 上，由少数几个实体所拥有。区块链并不像许多人以为的那么去中心。

为什么同步一个区块链要这么长时间呢？主要有两个原因：

· 第一个原因很明显：下载几百 GB 或更多数据需要很长时间；

· 第二，下载完之后区块链要完成验证，因为恶意节点可能会向你发送不正确的数据。

若要验证一个区块链，必须从创世区块开始重放（replay）整条链：执行第一个交易，并确保计算出的状态等于下载得到的状态。然后转到下一个交易，直到你把区块链的所有交易都查一遍。这不仅耗时，也浪费资源。在你之前，成千上万的节点做着完全相同的计算工作。

为什么要这么做呢？因为在传统计算学里，要知道一个计算是否正确的执行，唯一办法就是重做一次这个计算。如果小规模的计算，那就还好，但像重放一条区块链这种「慢运算」（slow calculaTIon），情况就完全不同了。

可提高效率和带宽的零知识证明

事实上，有一种方法可以低成本地验证一个计算结果，而又无需重做该计算，那就是零知识证明（ZKP），其中最著名的可能要数 zk-SNARK。

它是如何工作的呢？我们需要将区块链的重放函数改写为一个 zk-SNARK。这个 zk-SNARK 将输出两个东西：原初的输出（就跟原来的重放函数一样）；一个很小的数学「证明」，证明这个结果计算正确。这个「证明」可以小到只有 200 字节（没错，还不到 1KB）。

这样一来，我们就不需要所有（或是多台）计算机跑一遍重放函数了。由一台计算机去创建这个「证明」，其他不限数量的计算机可以在它们认为合适的时间再进行验证。无论原初的计算要花费多长时间（即使是几小时、几天、甚至几年都没有关系），验证却只需几毫秒即可搞定。这个「证明」可以通过线上分发，也可以存储在 U 盘里，甚至可以印在 T 恤上。

如果有恶意节点更改了某个交易的余额，那么这个「证明」就会和结果不同，所有验证者都会拒绝这个状态。如果有恶意节点更改了 zk-SNARK 代码，结果也会被拒绝。（有一个「第三参数」、一个公开共享的字符串，会把这个「证明」绑到这个 zk-SNARK 代码。如果代码被修改，那么这个「证明」和共享的字符串将不匹配，于是验证者就会拒绝该结果。）

我们不再需要重做昂贵的计算，也不需要下载区块链（因为我们已经有了关于该区块链存在且有效的数学证明）。你需要的，只是当前状态（比如最后一个区块），加上能够证明当前状态是一个有效区块链的一部分的少量「证明」，再花费几毫秒验证一下结果。

递归性的组合

验证一个「证明」的速度很快，但创建这个「证明」怎样呢？其实时间不固定，与传统计算相比，在计算和和内存方面它的效率要低不少。实际上，虽然一个重放函数的 zk-SNARK 版本听起来不错，但在实践中这个解决方案并不好。和以往的非 zk-SNARK 的重放函数相比，它需要更大的内存，速度甚至更慢。

不过，还有另一个优雅的方案。我们发现，用一点点小技巧，其实可以使用递归性 zk-SNARKs 。有了递归，我们就不必从头开始验证这个区块链，可以在前一个状态的基础上来构建。速度会快得多。

需要注意的是，递归性 zk-SNARK 的效率依然不如非递归的 zk-SNARK ，不过，最近 zk-SNARK 的构造取得了长足的进步。

一个递归性的 zk-SNARK 程序，会用属于「前一个状态」（previous state）的「证明」和新的交易作为输入。它会（用已被提供的证明）验证前一个状态，并检查新状态中的交易是否有效。如果没问题，它会输出新的状态和一个「证明」。

一旦新的状态和「证明」被分发到网络中，所有节点可以直接丢弃先前的状态，这么做不会有任何负面影响。新的节点只需要下载最新的状态和「证明」即可。这也就是Coda、Mir 和 Starling 这些项目可以实现小的、大小固定的区块的秘诀。

在上面说的这个例子里，只需要一个节点来创建新的区块和「证明」。显然，我们没必要让同一个节点来生成所有的区块。举个例子，可以从许多节点中随机选择一个节点（用「可验证随机函数」，众多节点甚至可以随机自我选择而不会有欺骗行为）。我们甚至可以做得更好：将区块的生成逻辑分为多个 zk-SNARK。

最终结果就是：区块生产者不需要完整的区块链，它只需要前一个状态。这会让区块大小降到多少呢？一个常规的 Coda 节点仅需要 22 KB 即可存储「证明」、当前状态以及某个账户余额的 Merkle 路径。只需要 22KB，一个节点就能验证整个区块链、查询余额并创建交易。但是，如果要生成区块，这个节点需要更多：它需要先前状态的全部余额的 Merkle 树。而 Merkle 树的大小取决于钱包的数量。如果 Coda 拥有和以太坊一样多的钱包，那么，Coda 区块生产者也只需要大约 1 GB 的容量。而以太坊上最小的完整节点是 230 GB（2019 年 12 月的数据）。差距巨大。

利用零知识证明，区块链网络将有更多活跃节点，这就提升了去中心化程度，并让各种程序有更多可能与区块链进行交互，而无需像 Infura 或 Metamask 这样的方案。想想看，99% 的新用户在安装 Metamask 时选择了放弃。所以，这种变化将带来巨大的影响。
责任编辑；zl

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/dianzi/2474169.html