Arweave网络采用了一种新颖的存储捐赠形式,以确保所存储信息的永久性。在这篇文章中,我们将详细讨论该存储捐赠的工作原理,然后通过马尔可夫链模拟来研究其特性和风险概况。这篇文章深入探讨了该主题。如果你想了解其基础知识,建议你先浏览一下 Arweave 的官方网站。
让我们深入了解吧!
在2019年的Arweave黄皮书草案中,我们描述了Arweave的存储捐赠结构(见第3.2.2节)。Arweave存储捐赠的核心逻辑如下:
自信息编码诞生以来,存储成本一直在以强劲的指数速度下降。从纸莎草纸到古腾堡印刷机,再到磁鼓存储器、软盘和闪存,信息编码和检索的成本已经在数千年的时间里不断降低。在数字时代,我们称之为Kryder速率。 虽然成本下降的确切速度存在变化,但这种模式是可靠的,并且有很大的增长空间:单是理论上的数据密度极限就比我们目前的成就高出10^51倍。此外,我们预计对更高效存储数据的需求不会减缓,因为人类和机器往往在能够访问和处理更多信息时更加高效。鉴于这些因素,我们观察到,通过极为保守的Kryder速率进行推断,我们能够以单一费用定价永久存储。我们通过向用户收取相当于现行成本下200年存储费用的基础费用来实现这一目标,随后随着存储成本的下降,这一捐赠的存储购买力将会增加。只要Kryder速率保持在0.5%以上,年末的捐赠存储购买力将比年初更大。 当协议接近生命周期的终点时,数据集的大小和成本将下降到极低的水平。由于其小巧的规模,我们预期它将被无偿“导入”到下一个永久性信息存储系统中,从而继续复制数据。这与Gopher档案在现代网络上的再现模式相同。你可以在这里查阅了解该方法的完整细节和数学原理。
实际上,Arweave 网络使用了一种经过修改的 Kryder 速率,我们在本文中将其称为“Kryder+”速率。Kryder+ 速率不仅包括原始数据存储成本,还包括维持像 Arweave 这样的网络在线运行所需的其他因素:副本存储、电力和运营成本。我们注意到,这些因素都受到存储成本基础下降的影响:
在当前版本的 Arweave 网络(2.5.3)中,Kryder+ 速率的目标是45个数据集副本,同时考虑到运营和电力费用的2倍存储冗余(具体定义见此处)。
在 Arweave 2.6 升级后,网络将通过响应矿工愿意提供存储的价格来自动推导 Kryder+ 速率。由于矿工之间的竞争会促使他们尽量降低价格,网络可以为此价格构建一个去信任的预言机系统。
值得注意的是,Arweave 的 Kryder+ 速率计算中没有包括带宽成本。Arweave 通过另一套基于业力的激励机制来覆盖这部分成本——详见此处。
在了解了 Arweave 存储捐赠的理论背景及其在实际网络中的应用后,我们可以通过模拟这一机制来观察可能的现实世界结果。为此,我们使用了一种基于马尔可夫链的模拟技术。该模型逐年运行多个潜在未来的单次迭代,并汇总结果。你可以在页面末尾找到执行和修改此模拟的代码链接。
在 Arweave 存储捐赠机制的任何模拟中,Kryder+ 速率是一个主要因素。在这个模型中,我们使用了硬盘成本随时间变化的数据集(见此处)作为基础。根据这些数据,我们观察到平均 Kryder 速率约为 38%。在现实数据的基础上,我们增加了一个“悲观”层面,以预测未来相较于过去的进步,从而进行压力测试,以观察在不利条件下存储捐赠的运作情况。我们将这种“悲观”因素描述为我们预计未来将延续过去存储成本下降的百分比。例如,10%的悲观速率意味着我们认为未来在降低存储成本方面的有效性仅为过去的10%。
Arweave 存储捐赠机制模拟的另一个重要因素是其代币价格的波动性。Arweave 采用浮动价格的代币来支撑其存储捐赠,主要原因有两个:
然而,浮动价格代币的一个影响是存储捐赠的“法币价值”会波动。为了在模拟中体现这一点,我们假设存储捐赠的价值呈现悲观的价格中性波动。即所有模拟的捐赠价值波动在总体上平均为零,但在个体上会导致价格上下波动。
为了确保每次模拟在合理时间内完成,一旦模拟运行超过10,000年或存储捐赠降为零,便会自动停止。
存储捐赠的生命周期 理解存储捐赠行为的最简单方法是查看在各种外部条件下存储捐赠存续的平均年数。
上图展示了在不同年度最大代币价格波动(横轴)与不同 Kryder+ 速率(纵轴,包含与真实世界数据相比的“悲观”值)的条件下,存储捐赠的生命周期。每种组合运行20次,如果每次运行结果都超过10,000年,图中将其标注为深绿色。
在这个图表中,第一个需要注意的关键点是0%波动率和0%悲观值。0%的悲观/Kryder+ 速率意味着我们假设存储成本将永远不会再下降。在这种情况下,网络仍然可以通过有效的经济运作,至少在未来200年内保存用户数据。这个参数的设定是为了确保即使那些对未来技术进步深表怀疑的人也能相信,他们的数据至少在大约三代人的时间内是经济可行的,在此之后才可能需要无偿存储。
另一个重要的观察点来自30%波动率和2/4% Kryder+ 区域。在我们的模拟中,30%的最大价格波动意味着代币价格平均每年变化15%,这与标普500指数在1950年至2015年间的年均波动率14.4%非常接近。在假设网络代币价格波动率为这个平均水平的情况下,我们看到仅约2%的 Kryder+ 速率就可以使存储捐赠的存续时间接近2,000年,而稍高的 Kryder+ 速率则可以使存续时间超过10,000年。
此外,如果假设代币价格波动最终趋于类似商品的平均水平(根据世界银行估计约为2-5%),我们观察到即使 Kryder+ 速率低于0.76%,也能使存储捐赠的运行时间超过10,000年。
通缩概率 \ 如上所示,在大量情境中,存储捐赠在10,000年模拟结束后仍然包含代币,可以继续激励数据存储。如果我们深入研究每次模拟的执行情况,可以看到绝大多数代币在存储的早期就被提取了:
鉴于这种行为,我们可以注意到,当用户将代币放入存储捐赠以支持他们存储的数据时,其中某些代币很可能永远不会再被释放。
上图显示了在对未来存储成本下降持不同程度悲观态度的情况下,存储捐赠中可能永远不会被释放的代币数量。
自己运行模拟
本文中使用的模拟器可以在此处找到。您可查看、学习该模型并分享您自己修改后的模拟!它可以在单线程上几分钟内运行大约10,000次全长模拟,因此可以快速用于模拟许多不同的场景。
Arweave网络采用了一种新颖的存储捐赠形式,以确保所存储信息的永久性。在这篇文章中,我们将详细讨论该存储捐赠的工作原理,然后通过马尔可夫链模拟来研究其特性和风险概况。这篇文章深入探讨了该主题。如果你想了解其基础知识,建议你先浏览一下 Arweave 的官方网站。
让我们深入了解吧!
在2019年的Arweave黄皮书草案中,我们描述了Arweave的存储捐赠结构(见第3.2.2节)。Arweave存储捐赠的核心逻辑如下:
自信息编码诞生以来,存储成本一直在以强劲的指数速度下降。从纸莎草纸到古腾堡印刷机,再到磁鼓存储器、软盘和闪存,信息编码和检索的成本已经在数千年的时间里不断降低。在数字时代,我们称之为Kryder速率。 虽然成本下降的确切速度存在变化,但这种模式是可靠的,并且有很大的增长空间:单是理论上的数据密度极限就比我们目前的成就高出10^51倍。此外,我们预计对更高效存储数据的需求不会减缓,因为人类和机器往往在能够访问和处理更多信息时更加高效。鉴于这些因素,我们观察到,通过极为保守的Kryder速率进行推断,我们能够以单一费用定价永久存储。我们通过向用户收取相当于现行成本下200年存储费用的基础费用来实现这一目标,随后随着存储成本的下降,这一捐赠的存储购买力将会增加。只要Kryder速率保持在0.5%以上,年末的捐赠存储购买力将比年初更大。 当协议接近生命周期的终点时,数据集的大小和成本将下降到极低的水平。由于其小巧的规模,我们预期它将被无偿“导入”到下一个永久性信息存储系统中,从而继续复制数据。这与Gopher档案在现代网络上的再现模式相同。你可以在这里查阅了解该方法的完整细节和数学原理。
实际上,Arweave 网络使用了一种经过修改的 Kryder 速率,我们在本文中将其称为“Kryder+”速率。Kryder+ 速率不仅包括原始数据存储成本,还包括维持像 Arweave 这样的网络在线运行所需的其他因素:副本存储、电力和运营成本。我们注意到,这些因素都受到存储成本基础下降的影响:
在当前版本的 Arweave 网络(2.5.3)中,Kryder+ 速率的目标是45个数据集副本,同时考虑到运营和电力费用的2倍存储冗余(具体定义见此处)。
在 Arweave 2.6 升级后,网络将通过响应矿工愿意提供存储的价格来自动推导 Kryder+ 速率。由于矿工之间的竞争会促使他们尽量降低价格,网络可以为此价格构建一个去信任的预言机系统。
值得注意的是,Arweave 的 Kryder+ 速率计算中没有包括带宽成本。Arweave 通过另一套基于业力的激励机制来覆盖这部分成本——详见此处。
在了解了 Arweave 存储捐赠的理论背景及其在实际网络中的应用后,我们可以通过模拟这一机制来观察可能的现实世界结果。为此,我们使用了一种基于马尔可夫链的模拟技术。该模型逐年运行多个潜在未来的单次迭代,并汇总结果。你可以在页面末尾找到执行和修改此模拟的代码链接。
在 Arweave 存储捐赠机制的任何模拟中,Kryder+ 速率是一个主要因素。在这个模型中,我们使用了硬盘成本随时间变化的数据集(见此处)作为基础。根据这些数据,我们观察到平均 Kryder 速率约为 38%。在现实数据的基础上,我们增加了一个“悲观”层面,以预测未来相较于过去的进步,从而进行压力测试,以观察在不利条件下存储捐赠的运作情况。我们将这种“悲观”因素描述为我们预计未来将延续过去存储成本下降的百分比。例如,10%的悲观速率意味着我们认为未来在降低存储成本方面的有效性仅为过去的10%。
Arweave 存储捐赠机制模拟的另一个重要因素是其代币价格的波动性。Arweave 采用浮动价格的代币来支撑其存储捐赠,主要原因有两个:
然而,浮动价格代币的一个影响是存储捐赠的“法币价值”会波动。为了在模拟中体现这一点,我们假设存储捐赠的价值呈现悲观的价格中性波动。即所有模拟的捐赠价值波动在总体上平均为零,但在个体上会导致价格上下波动。
为了确保每次模拟在合理时间内完成,一旦模拟运行超过10,000年或存储捐赠降为零,便会自动停止。
存储捐赠的生命周期 理解存储捐赠行为的最简单方法是查看在各种外部条件下存储捐赠存续的平均年数。
上图展示了在不同年度最大代币价格波动(横轴)与不同 Kryder+ 速率(纵轴,包含与真实世界数据相比的“悲观”值)的条件下,存储捐赠的生命周期。每种组合运行20次,如果每次运行结果都超过10,000年,图中将其标注为深绿色。
在这个图表中,第一个需要注意的关键点是0%波动率和0%悲观值。0%的悲观/Kryder+ 速率意味着我们假设存储成本将永远不会再下降。在这种情况下,网络仍然可以通过有效的经济运作,至少在未来200年内保存用户数据。这个参数的设定是为了确保即使那些对未来技术进步深表怀疑的人也能相信,他们的数据至少在大约三代人的时间内是经济可行的,在此之后才可能需要无偿存储。
另一个重要的观察点来自30%波动率和2/4% Kryder+ 区域。在我们的模拟中,30%的最大价格波动意味着代币价格平均每年变化15%,这与标普500指数在1950年至2015年间的年均波动率14.4%非常接近。在假设网络代币价格波动率为这个平均水平的情况下,我们看到仅约2%的 Kryder+ 速率就可以使存储捐赠的存续时间接近2,000年,而稍高的 Kryder+ 速率则可以使存续时间超过10,000年。
此外,如果假设代币价格波动最终趋于类似商品的平均水平(根据世界银行估计约为2-5%),我们观察到即使 Kryder+ 速率低于0.76%,也能使存储捐赠的运行时间超过10,000年。
通缩概率 \ 如上所示,在大量情境中,存储捐赠在10,000年模拟结束后仍然包含代币,可以继续激励数据存储。如果我们深入研究每次模拟的执行情况,可以看到绝大多数代币在存储的早期就被提取了:
鉴于这种行为,我们可以注意到,当用户将代币放入存储捐赠以支持他们存储的数据时,其中某些代币很可能永远不会再被释放。
上图显示了在对未来存储成本下降持不同程度悲观态度的情况下,存储捐赠中可能永远不会被释放的代币数量。
自己运行模拟
本文中使用的模拟器可以在此处找到。您可查看、学习该模型并分享您自己修改后的模拟!它可以在单线程上几分钟内运行大约10,000次全长模拟,因此可以快速用于模拟许多不同的场景。