TL;DR
🔹 IPFS es un protocolo de servidor hipermedia utilizado para compartir y almacenar datos.
🔹 IPFS son las siglas de InterPlanetary File System, que utiliza el direccionamiento de contenidos en lugar del acceso basado en la ubicación de los datos y archivos.
🔹 Los contenidos relevantes se identifican mediante un hash criptográfico para obtener contenidos de varias fuentes.
🔹 Cada vez que un contenido se actualiza con nuevos materiales, se crea un nuevo archivo con su propio hash nuevo, conservando IPFS la versión anterior.
Introducción
Internet se compone de toneladas y toneladas de datos. Desde los vídeos de TikTok hasta los flujos de YouTube, las fotos de Instagram, las publicaciones de Facebook, las páginas de Wikipedia y los continuos quintillones de bytes de datos que se comparten a diario en Internet, cabe preguntarse dónde almacenamos todos estos datos.
El proceso de almacenamiento de datos que utiliza Internet se basa principalmente en servidores, que pueden ser físicos o virtuales.
Se utilizan instalaciones elaboradas llamadas plataformas en la nube o granjas de servidores. Estas instalaciones albergan miles de equipos de almacenamiento y computación dispuestos y conectados a un servidor central.
Un usuario de Internet que necesite información en esos servidores realizará una conexión HTTPS desde su navegador al servidor correspondiente, que sirve la solicitud de acceso, recupera los datos adecuados y los carga en su navegador.
Este proceso de acceso a los archivos mediante la conexión a servidores que localizan el lugar de Internet se denomina "direccionamiento basado en la ubicación". Sin embargo, el método del servidor central para almacenar y acceder a los datos tiene varias deficiencias.
La innovación de los sistemas sin confianza no podía llegar en mejor momento. Estos sistemas eliminan la necesidad de un tercero importante, y uno de ellos es el Sistema de Archivos Interplanetarios (IPFS).
¿Qué es IPFS?
IPFS, la forma abreviada de InterPlanetary file system, es un sistema de almacenamiento que permite guardar archivos y hacer un seguimiento de sus versiones a lo largo del tiempo.
IPFS utiliza el modelo de sistema de almacenamiento distribuido y hace todo lo que hacen los servidores centrales, pero sin depender de un sistema central. Esto lo hace más seguro y resistente a los ataques, las caídas y la censura, al tiempo que permite una Internet más descentralizada.
Creado por Juan Benet y presentado en 2016, el IPFS ha sido testigo de varias mejoras. Individuos y organizaciones lo han adoptado para compartir archivos e información sin barreras.
¿Cómo funciona el IPFS?
Hay tres principios básicos con los que funciona el IPFS:
Direccionamiento de contenidos
Vinculación de contenidos mediante gráficos acíclicos dirigidos (DAG)
Descubrimiento de contenidos mediante tablas hash distribuidas (DHT)
Estos tres principios contribuyen a la habilitación del ecosistema IPFS. Vamos a explicarlos brevemente uno tras otro:
Direccionamiento del contenido
El IPFS utiliza el direccionamiento de contenido, es decir, la capacidad de identificar los datos requeridos por su contenido y no por su ubicación.
Por ejemplo, si tu amigo está en la tienda y le dices que te coja un paquete de caramelos de menta muy conocido (que, casualmente, suele estar colocado en el lado izquierdo más cercano a la caja). Ese es un ejemplo de direccionamiento de contenido porque estás pidiendo explícitamente lo que es.
En cambio, si pidieras los caramelos de menta utilizando la ubicación, dirías: "Por favor, coge lo que suele estar más cerca del cajero, a la izquierda, a unos centímetros de su brazo".
Si los caramelos de menta se sustituyeran ese día por, por ejemplo, hilo dental, no sería culpa de tu amigo con qué vuelve.
Ese escenario puede ocurrir entre tu ordenador e Internet. Ahora mismo, el Contenido se encuentra mayoritariamente por su ubicación.
Por otro lado, cada pieza de Contenido que utiliza IPFS tiene un identificador de contenido (CID), es decir, su hash. Cada hash es único para el contenido del que procede, y cada vez que se añaden nuevos datos, se crea un nuevo archivo con un nuevo CID, mientras que la versión anterior se conserva en IPFS. Esto permite el almacenamiento inmutable de todo el historial de un archivo en IPFS.
Muchos sistemas distribuidos utilizan el direccionamiento de contenidos mediante hashes para identificar el contenido y vincularlo. Cabe destacar que las estructuras de datos básicas de estos sistemas no son necesariamente interoperables.
Aquí es donde el proyecto Interplanetary Linked Data (IPLD) salva el día. IPLD proporciona varios enlaces a los datos, y a los usuarios también se les da la opción de hacer sus enlaces utilizando estructuras de datos fundamentales que pueden mantenerse en IPFS. Los datos pueden unificarse a través de sistemas distribuidos gracias a la traducción de IPLD entre estructuras de datos vinculadas por hash.
Gráficos acíclicos dirigidos (DAG)
Los sistemas distribuidos como IPFS utilizan una estructura de datos denominada grafos acíclicos dirigidos (DAG). Utilizan los Merkle DAG, en los que cada nodo tiene un identificador único, un hash del contenido del nodo.
Aunque los Merkle DAG pueden estructurarse de forma diferente, IPFS utiliza uno optimizado para representar directorios y archivos.
Para construir una representación Merkle DAG de tu contenido, IPFS suele dividir primero tu contenido en bloques. Esto permite la unión de diferentes partes del archivo de varias fuentes permitiendo una autenticación más rápida.
Tablas hash distribuidas (DHTs)
IPFS utiliza una tabla hash distribuida (DHT) para encontrar qué pares poseen el contenido que buscas. Una tabla hash es simplemente una base de datos de claves a valores relevantes. Una tabla hash distribuida es una tabla hash dividida entre todos los pares participantes en una red distribuida. Para encontrar el contenido, se "pregunta" a esos pares.
Una vez que se ha recibido la confirmación de qué pares almacenan los bloques que componen el Contenido que se busca, se vuelve a utilizar la DHT para descubrir la ubicación actual de esos pares a través de un proceso llamado enrutamiento.
Después de descubrir la ubicación del contenido mediante el uso del direccionamiento del contenido, estás listo para conectarte al contenido y obtenerlo.
Cuando obtienes el Contenido, éste se almacena en la caché de tu ordenador, y también te conviertes en un proveedor de ese Contenido hasta que decidas borrar tu caché.
Si lo deseas, puedes elegir almacenar una copia del archivo y convertirte en colaborador y proveedor permanente del mismo. Puedes mantenerlo todo el tiempo posible y con todo el contenido que elijas.
Ventajas de IPFS
1 Simplicidad peer-to-peer - IPFS utiliza una DHT, o tabla de hash distribuida, para almacenar los datos. Cuando un usuario tiene un hash, pregunta a la red de pares qué nodo contiene el contenido de ese hash y descarga el contenido directamente de ese nodo sin recurrir a un tercero.
2 Mejora de la seguridad - Debido a la naturaleza descentralizada de los nodos, es difícil adivinar qué datos se almacenan en cada nodo de IPFS.
Los servidores centrales pueden ser fácilmente objetivo de los hackers para robar o corromper datos, algo que se puede evitar con IPFS. Los gobiernos también pueden censurar fácilmente la información y las plataformas de Internet, algo que ya se está haciendo en todo el mundo. No hace mucho, Turquía censuró Wikipedia y Nigeria prohibió la plataforma de medios sociales Twitter. Todo esto fue posible porque todos ellos sabían dónde estaban exactamente los datos y a dónde debían dirigirse.
3 Inmutable - La transformación y actualización total de un contenido puede ser rastreada gracias a la naturaleza inmutable del IPFS. En la medida en que cualquier acción sobre un contenido es indeleble, da un gran nivel de transparencia al contenido y de garantía a los usuarios.
Desventajas del IPFS
1. Difícil de configurar - El proceso de configuración del IPFS es muy técnico y requiere un cierto nivel de conocimientos técnicos. Esto puede desanimar a la mayoría de los profanos y mantener la tecnología restringida a los técnicos, limitando su potencial y popularidad.
2 Caro de mantener - La ejecución de procesos IPFS en tu ordenador consume una gran cantidad de ancho de banda y espacio de almacenamiento. Almacenar copias de contenidos que servirán a otros buscadores también requiere mucho ancho de banda. Sin un fuerte incentivo económico, esto podría no ser atractivo o asequible para todos.
3 Fiabilidad de los datos - Permitir el almacenamiento de datos privados no es uno de los puntos fuertes de IPFS. Estos datos son difíciles de des duplicar de forma eficiente o de almacenar en caché de forma inteligente. La afirmación de un compañero de poseer un contenido tampoco se verifica, lo que lleva a preocuparse por la fiabilidad de los datos cuando se obtienen.
Conclusión
Unas pocas grandes empresas que controlen de forma centralizada la mayor parte de los datos del mundo ya no es una opción viable, ya que nuestras vidas están cada vez más digitalizadas.
Se necesita una alternativa más fiable y segura para el almacenamiento de datos. A medida que pasamos de la atmósfera de la web2 a la más descentralizada de la web3, tecnologías como IPFS son una parte necesaria del cambio.
Aunque todavía necesita algunas mejoras aquí y allá, especialmente en su economía, su capacidad para proporcionar un sistema inmutable, descentralizado y fiable que te proteja de la censura, la pérdida de acceso a los datos necesarios y la manipulación de los datos lo convierte en un ganador.
La reducción y distribución del control que los gigantes tecnológicos tienen hoy en día sobre Internet y los datos, dando lugar a una Internet más centrada en el usuario y democrática, pone la guinda al pastel.
Autor: M. Olatunji, investigador de Gate.io. Traductor: Jose E.
*Este artículo representa únicamente las opiniones de los observadores y no constituye ninguna sugerencia de inversión.
*Gate.io se reserva todos los derechos de este artículo. Se permitirá la reproducción del artículo siempre que se haga referencia a Gate.io. En todos los demás casos, se emprenderán acciones legales por infracción de los derechos de autor