A rede Arweave utiliza uma forma inovadora de dotação de armazenamento para garantir a permanência das informações que armazena. Neste post, detalharemos e discutiremos como funciona a dotação de armazenamento, em seguida, estudaremos suas propriedades e perfil de risco usando simulações de cadeias de Markov de sua execução. Este post aprofunda-se nos pormenores. Se procura material introdutório, pode querer consultar o site principal da Arweave.
Vamos mergulhar!
No rascunho do livro amarelo da Arweave de 2019, descrevemos a estrutura de endosso da Arweave (ver secção 3.2.2). A lógica central do endosso da Arweave é a seguinte:
O custo da provisão de armazenamento tem vindo a diminuir a um ritmo forte e exponencial desde o início da codificação de informações. Do papiro, à imprensa de Gutenberg, à memória de tambor magnético, aos disquetes e às pen drives, o custo de codificar e recuperar informações tem vindo a cair há milhares de anos. Na era digital, chamamos a isto a taxa de Kryder.
Embora a taxa exata de redução de custos seja variável, o padrão é confiável e tem um grande potencial de crescimento: os limites teóricos de densidade de dados sozinhos são 10^51 maiores do que nossas conquistas atuais. Além disso, não prevemos que haverá uma desaceleração no desejo de armazenar dados de forma mais eficiente, já que humanos e máquinas sempre tendem a ser mais eficazes se puderem acessar e processar mais informações.
Dadas essas condições, observamos que, ao extrapolar uma taxa de Kryder extremamente conservadora, somos capazes de precificar o armazenamento permanente com uma única taxa. Conseguimos isso cobrando do usuário uma taxa base de 200 anos de armazenamento a custos atuais, e à medida que o custo de armazenamento diminui, o poder de compra de armazenamento dessa contribuição de dote aumenta. Desde que a taxa de Kryder permaneça acima de 0,5%, o poder de compra de armazenamento no dote no final do ano será maior do que no início.
Uma vez que o protocolo se aproxima do fim de sua vida, o tamanho e o custo do conjunto de dados cairão para um nível extremamente baixo. Devido ao seu tamanho pequeno, esperamos que ele seja 'importado' de forma altruísta para o próximo sistema de armazenamento de informações permanente, continuando a replicação dos dados. Isso segue o mesmo padrão que levou aos arquivos do Gopher serem encontrados na web moderna, etc.
Pode verificar todos os detalhes completos e as fórmulas subjacentes a esta abordagem aqui.
Na prática, a rede Arweave utiliza uma modificação da taxa bruta de Kryder, que vamos chamar de taxa 'Kryder+' neste documento. A taxa Kryder+ inclui não apenas o armazenamento bruto de dados, mas também outros fatores necessários para manter uma rede como a Arweave online: replicação, eletricidade e custos operacionais. Observamos que cada um desses fatores é afetado pelo mesmo declínio subjacente nos custos de armazenamento:
Replicações: Cada nova réplica do conjunto de dados herda os mesmos custos de armazenamento decrescentes que o primeiro.
Utilização de energia: As alterações na densidade de dados e na fiabilidade (os fatores que afetam mais proeminentemente a taxa de Kryder) raramente, se alguma vez, são acompanhadas por aumentos no consumo de energia. Posteriormente, à medida que os meios de armazenamento aumentam em capacidade, o custo relativo de energia para armazenar uma determinada quantidade de dados também diminui.
Despesas operacionais: Tal como acontece com o consumo de energia, à medida que a eficiência dos meios de armazenamento digital individuais aumenta, o número de dispositivos necessários para armazenar um pedaço de dados (e, portanto, os custos operacionais para os manter) diminui.
Na versão atual da rede Arweave (2.5.3), são visadas 45 réplicas do conjunto de dados na taxa Kryder+ (definida aqui), juntamente com uma sobrecarga de armazenamento 2x para despesas operacionais e de energia (ver aqui).
Após a atualização 2.6 do Arweave, a rede automaticamente derivará a taxa Kryder+ reagindo ao preço ao qual os mineradores estão dispostos a fornecer armazenamento. A rede pode orquestrar um oráculo sem confiança para este preço, porque os mineradores são incentivados a minimizá-lo, em competição uns com os outros.
Notavelmente ausentes da formulação da taxa Kryder+ da Arweave estão os custos de largura de banda. A Arweave cobre isso usando um conjunto separado de incentivos baseados em karma - veja aqui.
Agora que cobrimos o fundo teórico do endowment da Arweave, bem como a sua implementação prática na rede ao vivo, podemos considerar uma simulação deste mecanismo para observar os prováveis resultados do mundo real. Para ajudar neste esforço, utilizamos uma técnica de simulação baseada em cadeias de Markov. Este modelo executa muitas iterações individuais de futuros potenciais ano a ano, e depois compila os resultados. O código para executar e modificar esta simulação por si mesmo está ligado no final desta página.
A taxa Kryder+ é um fator primário em qualquer simulação do patrimônio da Arweave. Neste modelo, utilizamos um conjunto de dados sobre os custos de unidades de disco rígido ao longo do tempo (encontrados aqui) como base. A partir desses dados, observamos uma taxa Kryder média de ~38%. Além dos dados do mundo real, adicionamos a capacidade de criar uma camada de 'pessimismo' em relação ao futuro em comparação com os avanços passados, a fim de permitir que testemos como o patrimônio operaria em períodos menos afortunados. Descrevemos esse fator de 'pessimismo' como a % de declínios de custo de armazenamento anteriores que antecipamos que continuarão no futuro. Por exemplo, uma taxa de pessimismo de 10% implica que acreditamos que o futuro será apenas 10% tão eficiente em reduzir o custo de armazenamento quanto o passado foi.
Outro fator importante na simulação do endowment da Arweave é a volatilidade do preço de seu token. A Arweave usa um token de preço flutuante para seu endowment por duas razões principais:
As stablecoins centralizadas têm uma probabilidade muito elevada de colapsar ou cessar a operação muito antes do último bloco na rede Arweave ser minerado. Além disso, uma arquitetura de stablecoin descentralizada construída no próprio protocolo Arweave seria suscetível à subcolateralização em caso de extrema volatilidade do mercado.
Por outro lado, o token nativo da Arweave tem uma forte reivindicação de utilidade e opera independentemente de quaisquer cadeias ou serviços externos. Essa falta de interdependência ajuda a garantir que o protocolo Arweave possa continuar sem ser afetado por fatores externos por períodos extremamente longos de tempo.
Um dos efeitos da natureza flutuante do preço do token, no entanto, é que o 'valor fiduciário' da doação é volátil. Para modelar isso em nossa simulação, assumimos uma volatilidade pessimista e neutra em relação ao preço do valor da doação. Ou seja, todas as flutuações simuladas do valor da doação devem ter uma média total de zero, mas individualmente moverão o preço para cima e para baixo no ínterim.
Para permitir que cada simulação individual termine em um período razoável, a execução é interrompida uma vez que 10.000 anos tenham decorrido ou que o endowment tenha atingido zero.
A forma mais simples de entender o comportamento do endowment é observar o número médio de anos que o endowment sobrevive sob várias condições externas.
Acima vemos um gráfico de vidas de endowment com níveis variados de volatilidade máxima do preço do token anual (horizontal), em comparação com mudanças na taxa efetiva de Kryder+ (vertical, também listada com seus valores de 'pessimismo' em relação aos dados do mundo real). Os cenários em que cada execução operada (20 por combinação) resultou em uma vida útil superior a 10.000 são denotados com uma cor verde escura.
A primeira célula importante a ser observada nesta representação é com volatilidade de 0% e pessimismo de 0%. Uma taxa de 0% para pessimismo/Kryder+ implica que assumimos que o custo de armazenamento nunca diminuirá novamente. Neste caso, a rede deve manter os dados do usuário por pelo menos 200 anos com economia funcionando. Este parâmetro foi escolhido de modo que mesmo aqueles que são profundamente céticos em relação aos avanços tecnológicos futuros possam confiar que seus dados serão economicamente viáveis para serem armazenados por pelo menos ~3 gerações antes de exigir armazenamento altruísta.
Outra observação importante desta renderização vem da volatilidade de 30% e da zona Kryder+ de 2/4%. Na nossa simulação, a volatilidade máxima de 30% no preço do token implica uma mudança média anual de 15% - extremamente próxima da volatilidade média do S&P500 de 14,4% ao ano de 1950 a 2015. Pressupondo esta taxa média de volatilidade no preço do token da rede, vemos que uma taxa Kryder+ de apenas ~2% resultará numa duração de execução do fundo de quase 2.000 anos, e uma taxa ligeiramente mais alta resultará numa duração de execução superior a 10.000 anos.
Além disso, se eventualmente forem assumidas volatilidades médias semelhantes às das commodities (aproximadamente 2-5%, de acordo com estimativas do Banco Mundial), observamos que mesmo uma taxa Kryder+ inferior a 0,76% resultará em um tempo de execução do endowment superior a 10.000 anos.
Como pode ser visto acima, em um grande número de cenários, o patrimônio ainda contém tokens para continuar incentivando o armazenamento de dados após a simulação terminar em 10.000 anos. Se aprofundarmos na execução de cada execução individual, vemos que a grande maioria dos tokens é retirada do patrimônio nos primeiros anos de armazenamento:
Dado esse comportamento, podemos observar que quando os usuários colocam tokens no fundo para respaldar os dados que estão armazenando, existe uma grande probabilidade de que alguns desses tokens nunca sejam liberados novamente.
Acima, vemos um gráfico da quantidade provável de tokens que nunca são liberados do endowment em vários níveis de pessimismo sobre as futuras reduções de custo de armazenamento em relação ao presente.
O simulador usado neste caso pode ser encontrado aqui. Por favor, confira, aprenda sobre o modelo e compartilhe suas próprias simulações modificadas! Ele pode lidar com a execução de aproximadamente 10.000 execuções completas em alguns minutos em uma única thread, então pode ser usado para simular muitos cenários diferentes rapidamente.
A rede Arweave utiliza uma forma inovadora de dotação de armazenamento para garantir a permanência das informações que armazena. Neste post, detalharemos e discutiremos como funciona a dotação de armazenamento, em seguida, estudaremos suas propriedades e perfil de risco usando simulações de cadeias de Markov de sua execução. Este post aprofunda-se nos pormenores. Se procura material introdutório, pode querer consultar o site principal da Arweave.
Vamos mergulhar!
No rascunho do livro amarelo da Arweave de 2019, descrevemos a estrutura de endosso da Arweave (ver secção 3.2.2). A lógica central do endosso da Arweave é a seguinte:
O custo da provisão de armazenamento tem vindo a diminuir a um ritmo forte e exponencial desde o início da codificação de informações. Do papiro, à imprensa de Gutenberg, à memória de tambor magnético, aos disquetes e às pen drives, o custo de codificar e recuperar informações tem vindo a cair há milhares de anos. Na era digital, chamamos a isto a taxa de Kryder.
Embora a taxa exata de redução de custos seja variável, o padrão é confiável e tem um grande potencial de crescimento: os limites teóricos de densidade de dados sozinhos são 10^51 maiores do que nossas conquistas atuais. Além disso, não prevemos que haverá uma desaceleração no desejo de armazenar dados de forma mais eficiente, já que humanos e máquinas sempre tendem a ser mais eficazes se puderem acessar e processar mais informações.
Dadas essas condições, observamos que, ao extrapolar uma taxa de Kryder extremamente conservadora, somos capazes de precificar o armazenamento permanente com uma única taxa. Conseguimos isso cobrando do usuário uma taxa base de 200 anos de armazenamento a custos atuais, e à medida que o custo de armazenamento diminui, o poder de compra de armazenamento dessa contribuição de dote aumenta. Desde que a taxa de Kryder permaneça acima de 0,5%, o poder de compra de armazenamento no dote no final do ano será maior do que no início.
Uma vez que o protocolo se aproxima do fim de sua vida, o tamanho e o custo do conjunto de dados cairão para um nível extremamente baixo. Devido ao seu tamanho pequeno, esperamos que ele seja 'importado' de forma altruísta para o próximo sistema de armazenamento de informações permanente, continuando a replicação dos dados. Isso segue o mesmo padrão que levou aos arquivos do Gopher serem encontrados na web moderna, etc.
Pode verificar todos os detalhes completos e as fórmulas subjacentes a esta abordagem aqui.
Na prática, a rede Arweave utiliza uma modificação da taxa bruta de Kryder, que vamos chamar de taxa 'Kryder+' neste documento. A taxa Kryder+ inclui não apenas o armazenamento bruto de dados, mas também outros fatores necessários para manter uma rede como a Arweave online: replicação, eletricidade e custos operacionais. Observamos que cada um desses fatores é afetado pelo mesmo declínio subjacente nos custos de armazenamento:
Replicações: Cada nova réplica do conjunto de dados herda os mesmos custos de armazenamento decrescentes que o primeiro.
Utilização de energia: As alterações na densidade de dados e na fiabilidade (os fatores que afetam mais proeminentemente a taxa de Kryder) raramente, se alguma vez, são acompanhadas por aumentos no consumo de energia. Posteriormente, à medida que os meios de armazenamento aumentam em capacidade, o custo relativo de energia para armazenar uma determinada quantidade de dados também diminui.
Despesas operacionais: Tal como acontece com o consumo de energia, à medida que a eficiência dos meios de armazenamento digital individuais aumenta, o número de dispositivos necessários para armazenar um pedaço de dados (e, portanto, os custos operacionais para os manter) diminui.
Na versão atual da rede Arweave (2.5.3), são visadas 45 réplicas do conjunto de dados na taxa Kryder+ (definida aqui), juntamente com uma sobrecarga de armazenamento 2x para despesas operacionais e de energia (ver aqui).
Após a atualização 2.6 do Arweave, a rede automaticamente derivará a taxa Kryder+ reagindo ao preço ao qual os mineradores estão dispostos a fornecer armazenamento. A rede pode orquestrar um oráculo sem confiança para este preço, porque os mineradores são incentivados a minimizá-lo, em competição uns com os outros.
Notavelmente ausentes da formulação da taxa Kryder+ da Arweave estão os custos de largura de banda. A Arweave cobre isso usando um conjunto separado de incentivos baseados em karma - veja aqui.
Agora que cobrimos o fundo teórico do endowment da Arweave, bem como a sua implementação prática na rede ao vivo, podemos considerar uma simulação deste mecanismo para observar os prováveis resultados do mundo real. Para ajudar neste esforço, utilizamos uma técnica de simulação baseada em cadeias de Markov. Este modelo executa muitas iterações individuais de futuros potenciais ano a ano, e depois compila os resultados. O código para executar e modificar esta simulação por si mesmo está ligado no final desta página.
A taxa Kryder+ é um fator primário em qualquer simulação do patrimônio da Arweave. Neste modelo, utilizamos um conjunto de dados sobre os custos de unidades de disco rígido ao longo do tempo (encontrados aqui) como base. A partir desses dados, observamos uma taxa Kryder média de ~38%. Além dos dados do mundo real, adicionamos a capacidade de criar uma camada de 'pessimismo' em relação ao futuro em comparação com os avanços passados, a fim de permitir que testemos como o patrimônio operaria em períodos menos afortunados. Descrevemos esse fator de 'pessimismo' como a % de declínios de custo de armazenamento anteriores que antecipamos que continuarão no futuro. Por exemplo, uma taxa de pessimismo de 10% implica que acreditamos que o futuro será apenas 10% tão eficiente em reduzir o custo de armazenamento quanto o passado foi.
Outro fator importante na simulação do endowment da Arweave é a volatilidade do preço de seu token. A Arweave usa um token de preço flutuante para seu endowment por duas razões principais:
As stablecoins centralizadas têm uma probabilidade muito elevada de colapsar ou cessar a operação muito antes do último bloco na rede Arweave ser minerado. Além disso, uma arquitetura de stablecoin descentralizada construída no próprio protocolo Arweave seria suscetível à subcolateralização em caso de extrema volatilidade do mercado.
Por outro lado, o token nativo da Arweave tem uma forte reivindicação de utilidade e opera independentemente de quaisquer cadeias ou serviços externos. Essa falta de interdependência ajuda a garantir que o protocolo Arweave possa continuar sem ser afetado por fatores externos por períodos extremamente longos de tempo.
Um dos efeitos da natureza flutuante do preço do token, no entanto, é que o 'valor fiduciário' da doação é volátil. Para modelar isso em nossa simulação, assumimos uma volatilidade pessimista e neutra em relação ao preço do valor da doação. Ou seja, todas as flutuações simuladas do valor da doação devem ter uma média total de zero, mas individualmente moverão o preço para cima e para baixo no ínterim.
Para permitir que cada simulação individual termine em um período razoável, a execução é interrompida uma vez que 10.000 anos tenham decorrido ou que o endowment tenha atingido zero.
A forma mais simples de entender o comportamento do endowment é observar o número médio de anos que o endowment sobrevive sob várias condições externas.
Acima vemos um gráfico de vidas de endowment com níveis variados de volatilidade máxima do preço do token anual (horizontal), em comparação com mudanças na taxa efetiva de Kryder+ (vertical, também listada com seus valores de 'pessimismo' em relação aos dados do mundo real). Os cenários em que cada execução operada (20 por combinação) resultou em uma vida útil superior a 10.000 são denotados com uma cor verde escura.
A primeira célula importante a ser observada nesta representação é com volatilidade de 0% e pessimismo de 0%. Uma taxa de 0% para pessimismo/Kryder+ implica que assumimos que o custo de armazenamento nunca diminuirá novamente. Neste caso, a rede deve manter os dados do usuário por pelo menos 200 anos com economia funcionando. Este parâmetro foi escolhido de modo que mesmo aqueles que são profundamente céticos em relação aos avanços tecnológicos futuros possam confiar que seus dados serão economicamente viáveis para serem armazenados por pelo menos ~3 gerações antes de exigir armazenamento altruísta.
Outra observação importante desta renderização vem da volatilidade de 30% e da zona Kryder+ de 2/4%. Na nossa simulação, a volatilidade máxima de 30% no preço do token implica uma mudança média anual de 15% - extremamente próxima da volatilidade média do S&P500 de 14,4% ao ano de 1950 a 2015. Pressupondo esta taxa média de volatilidade no preço do token da rede, vemos que uma taxa Kryder+ de apenas ~2% resultará numa duração de execução do fundo de quase 2.000 anos, e uma taxa ligeiramente mais alta resultará numa duração de execução superior a 10.000 anos.
Além disso, se eventualmente forem assumidas volatilidades médias semelhantes às das commodities (aproximadamente 2-5%, de acordo com estimativas do Banco Mundial), observamos que mesmo uma taxa Kryder+ inferior a 0,76% resultará em um tempo de execução do endowment superior a 10.000 anos.
Como pode ser visto acima, em um grande número de cenários, o patrimônio ainda contém tokens para continuar incentivando o armazenamento de dados após a simulação terminar em 10.000 anos. Se aprofundarmos na execução de cada execução individual, vemos que a grande maioria dos tokens é retirada do patrimônio nos primeiros anos de armazenamento:
Dado esse comportamento, podemos observar que quando os usuários colocam tokens no fundo para respaldar os dados que estão armazenando, existe uma grande probabilidade de que alguns desses tokens nunca sejam liberados novamente.
Acima, vemos um gráfico da quantidade provável de tokens que nunca são liberados do endowment em vários níveis de pessimismo sobre as futuras reduções de custo de armazenamento em relação ao presente.
O simulador usado neste caso pode ser encontrado aqui. Por favor, confira, aprenda sobre o modelo e compartilhe suas próprias simulações modificadas! Ele pode lidar com a execução de aproximadamente 10.000 execuções completas em alguns minutos em uma única thread, então pode ser usado para simular muitos cenários diferentes rapidamente.