Chú ý: Đây là phần 2 trong loạt bài viết 'Tương lai phát triển của giao thức Ethereum' của Vitalik, người sáng lập ETH, với tiêu đề 'Các tương lai có thể của giao thức Ethereum, phần 2: Sự bùng nổ'. Phần 1 đã được đăng trên trang Kinh tế và Vàng với tiêu đề 'Những cải tiến tiềm năng khác cho ETH PoS'. Bài viết này được dịch bởi Đặng Thông của Kinh tế và Vàng, dưới đây là toàn bộ nội dung phần 2:
Ban đầu, Ethereum có hai chiến lược mở rộng trong bản đồ con đường.
Một trong số đó là “Phân mảnh(sharding)”:Mỗi Nút chỉ cần xác minh và lưu trữ một phần nhỏ giao dịch, thay vì xác minh và lưu trữ tất cả giao dịch trên chuỗi. Điều này cũng là cách thức hoạt động của bất kỳ mạng ngang hàng nào khác (ví dụ BitTorrent), vì vậy chúng ta có thể làm cho blockchain hoạt động theo cùng cách.
Một trong số đó là giao thức lớp 2: Mạng sẽ được xây dựng trên Ethereum để cho họ có thể tận dụng đầy đủ tính an toàn của nó, đồng thời làm cho hầu hết dữ liệu và tính toán rời xa Chuỗi chính. Thuật ngữ “giao thức lớp 2” ám chỉ đến Kênh trạng thái năm 2015, Plasma năm 2017 và Rollups năm 2019. Rollup mạnh mẽ hơn Kênh trạng thái hoặc Plasma, nhưng chúng cần băng thông dữ liệu on-chain lớn.
May mắn thay, đến năm 2019, nghiên cứu Phân mảnh đã giải quyết được vấn đề xác minh "tính sẵn có của dữ liệu" trên quy mô lớn. Kết quả là, hai con đường đã hợp nhất và chúng tôi đã kết thúc với một lộ trình tập trung vào Rollup vẫn là chiến lược mở rộng quy mô của Ethereum ngày nay.
The Surge, bản đồ tuyến đường năm 2023.
Lộ trình tập trung vào Rollup đưa ra một phân công đơn giản: ETH L1 tập trung vào việc trở thành một lớp cơ sở mạnh mẽ và Phi tập trung, trong khi L2 đảm nhận nhiệm vụ hỗ trợ mở rộng hệ sinh thái. Điều này là một mô hình tái diễn khắp nơi trong xã hội: hệ thống tòa án (L1) không phải để đạt tốc độ siêu nhanh và hiệu quả, mà là để bảo vệ hợp đồng và quyền sở hữu, trong khi doanh nhân (L2) cần xây dựng một lớp cơ sở vững chắc trên cơ sở này và đưa con người đến sao Hỏa (ẩn dụ và đen trắng).
Năm nay, lộ trình tập trung vào Rollup đã đạt được những thành công quan trọng: băng thông dữ liệu L1 của ETH Place đã được tăng lên đáng kể với các đốm EIP-4844 và nhiều EVM Rollups hiện đang trong giai đoạn đầu tiên. Việc triển khai rất không đồng nhất và đa nguyên, trong đó mỗi L2 hoạt động như một "mảnh vỡ" với các quy tắc và logic nội bộ riêng, giờ đây đã trở thành hiện thực. Nhưng như chúng ta đã thấy, đi theo con đường này có những thách thức độc đáo của riêng nó. Vì vậy, bây giờ nhiệm vụ của chúng tôi là hoàn thành lộ trình tập trung vào Rollup và giải quyết những vấn đề này trong khi vẫn giữ được sự mạnh mẽ và phân cấp khiến ETH Workshop L1 trở nên khác biệt. **
Surge: Mục tiêu chính
L1+L2 trên 100.000+ TPS
Giữ tính phi tập trung và ổn định của L1
Ít nhất một số L2 hoàn toàn thừa kế các thuộc tính cốt lõi của Ethereum (Không đáng tin cậy、mở、chống kiểm duyệt)
Tương tác tối đa giữa L2. Ethereum nên cảm thấy như một hệ sinh thái, chứ không phải là 34 chuỗi khối khác nhau.
Ba khó khăn về khả năng mở rộng
Khả năng mở rộng Bộ ba tàn ác là một ý tưởng được đưa ra vào năm 2017, nó cho rằng có một mối quan hệ căng thẳng giữa ba thuộc tính của blockchain: Phi tập trung (cụ thể hơn: chi phí thấp của việc vận hành Nút), khả năng mở rộng (cụ thể hơn: xử lý một lượng lớn giao dịch) và bảo mật (cụ thể hơn: kẻ tấn công cần phá hủy hầu hết Nút trong toàn bộ mạng lưới mới có thể làm cho một giao dịch thất bại).
Cần lưu ý rằng trilemma không phải là một định lý, và bài viết giới thiệu trilemma không đi kèm với một chứng minh toán học. Nó đưa ra một lập luận toán học heuristic: nếu một Nút thân thiện với Phi tập trung (ví dụ: máy tính xách tay tiêu dùng) có thể xác minh N giao dịch mỗi giây và bạn có một chuỗi xử lý k * N giao dịch mỗi giây, thì (i) mỗi giao dịch chỉ có thể được nhìn thấy ở 1 / k của Nút, có nghĩa là kẻ tấn công chỉ cần phá vỡ một vài Nút để đẩy các giao dịch xấu hoặc (ii) Nút của bạn sẽ trở nên mạnh mẽ và chuỗi của bạn không phải là Phi tập trung. Mục đích của bài viết này chưa bao giờ là để chỉ ra rằng phá vỡ trilemma là không thể; Thay vào đó, nó có nghĩa là để cho thấy rằng thoát ra khỏi tình trạng tiến thoái lưỡng nan là khó khăn - nó đòi hỏi phải suy nghĩ bên ngoài chiếc hộp mà lập luận gợi ý theo một cách nào đó.
Trong nhiều năm qua, một số chuỗi hiệu suất cao thường tuyên bố rằng họ đã giải quyết được ba khó khăn mà không áp dụng bất kỳ biện pháp thông minh nào ở mức cơ sở hạ tầng, thường là thông qua việc tinh chỉnh Nút bằng các kỹ thuật kỹ thuật phần mềm. Điều này luôn luôn gây hiểu lầm và việc chạy Nút trên các chuỗi như vậy luôn khó hơn rất nhiều so với ETH. Bài viết này khám phá nhiều khía cạnh tinh tế về tại sao tình huống này xảy ra (và tại sao kỹ thuật phần mềm L1 của khách hàng không thể mở rộng ETH một mình).
Tuy nhiên, sự kết hợp giữa việc lấy mẫu khả dụng dữ liệu (DAS) và SNARK thực sự giải quyết ba khó khăn: nó cho phép khách hàng xác minh xem một số lượng dữ liệu có sẵn và liệu có thực hiện đúng một số lượng bước tính toán nhất định hay không, đồng thời chỉ tải xuống một phần nhỏ dữ liệu đó và lượng tính toán chạy được cũng nhỏ hơn rất nhiều. SNARK không đáng tin cậy. Lấy mẫu khả dụng dữ liệu có mô hình tin cậy N nhỏ tinh vi, nhưng nó giữ lại các thuộc tính cơ bản của chuỗi không mở rộng, ngay cả khi tấn công 51% cũng không thể buộc mạng chấp nhận các khối xấu.
Một phương pháp khác để giải quyết vấn đề khó khăn là kiến trúc Plasma, nó sử dụng công nghệ thông minh để chuyển trách nhiệm theo dõi tính khả dụng dữ liệu cho người dùng một cách khéo léo. Trước đây, từ năm 2017-2019, khi mở rộng tính toán chỉ cần bằng chứng gian lận, tính năng bảo mật của Plasma rất hạn chế, nhưng sự phổ biến của SNARK đã làm cho kiến trúc Plasma phù hợp hơn với các trường hợp sử dụng rộng hơn trước đây.
Tiến triển tiếp theo của DAS
Chúng ta đang giải quyết vấn đề gì?
Kể từ ngày 13 tháng 3 năm 2024, khi bản nâng cấp Dencun đi vào hoạt động, blockchain ETHFANG sẽ có 3 "blob" khoảng 125 kB mỗi khoảng thời gian 12 giây, hoặc khoảng 375 kB băng thông dữ liệu trong khoảng thời gian 12 giây. Giả sử rằng dữ liệu giao dịch được đăng trực tiếp lên chuỗi, truyền ERC20 là khoảng 180 byte, do đó, TPS tối đa của các bản tổng hợp trên ô vuông ETH là:
375000 / 12 / 180 = 173.6 TPS
Nếu chúng tôi thêm calldata của Ethereum (giá trị tối đa lý thuyết: mỗi khe 30 triệu Gas / mỗi byte 16 Gas = mỗi khe 1.875.000 byte), điều này sẽ trở thành 607 TPS. Đối với PeerDAS, kế hoạch làm tăng mục tiêu đếm blob lên 8-16, điều này sẽ cung cấp cho chúng tôi 463-926 TPS của calldata.
Điều này đối với Ethereum L1 là một bước ngoặt lớn, nhưng chưa đủ. Chúng tôi muốn có thêm tính mở rộng. Mục tiêu trung hạn của chúng tôi là mỗi khe cắm 16 MB, nếu kết hợp với cải tiến nén dữ liệu, sẽ cung cấp khoảng 58.000 TPS.
PeerDAS là gì và nó hoạt động như thế nào?
PeerDAS là một cài đặt tương đối đơn giản của 'mẫu một chiều'. Mỗi khối trong ETH là đa thức bậc 4096 trên trường số nguyên tố 253 bit. Chúng tôi phát tán 'cổ phiếu' của đa thức, trong đó mỗi cổ phiếu chứa 16 đánh giá liên tiếp tại 16 tọa độ liên tiếp được lấy từ tổng cộng 8192 tập tọa độ. Bất kỳ 4096 đánh giá nào trong 8192 đánh giá (sử dụng các tham số được đề xuất hiện tại: 64 trong số 128 mẫu có thể khả thi) đều có thể khôi phục khối đó.
**Nguyên lý hoạt động của PeerDAS là để mỗi client lắng nghe một số lượng mạng con ít ỏi, trong đó mạng con thứ i phát sóng bất kỳ mẫu Blob thứ i nào và bổ sung bằng cách yêu cầu các Blob cần thiết trên các mạng con khác thông qua việc hỏi các đối tác trong mạng p2p toàn cầu (ai sẽ lắng nghe các mạng con khác nhau).**Phiên bản cẩn trọng hơn SubnetDAS chỉ sử dụng cơ chế mạng con mà không có yêu cầu bổ sung tầng đối tác.Đề xuất hiện tại là các Nút tham gia Bằng chứng về cổ phần sử dụng SubnetDAS, các Nút khác (tức là "client") sử dụng PeerDAS.
Lý thuyết, chúng ta có thể mở rộng lấy mẫu 1D khá xa: nếu chúng ta tăng giá trị tối đa của số lượng blob lên 256 (do đó, mục tiêu là 128), chúng ta sẽ đạt được mục tiêu 16 MB, trong khi việc lấy mẫu sẵn có chỉ cần mất 16 mẫu mỗi Nút * 128 blob * mỗi blob mỗi mẫu 512 byte = băng thông dữ liệu 1 MB mỗi khe. Điều này vừa nằm trong phạm vi dung sai của chúng tôi: nó khả thi, nhưng điều này có nghĩa là các máy khách bị hạn chế bởi băng thông không thể lấy mẫu. Chúng ta có thể tối ưu hóa điều này bằng cách giảm số lượng blob và tăng kích thước blob, nhưng điều này sẽ làm cho việc xây dựng lại trở nên đắt đỏ hơn.
Do đó, cuối cùng chúng tôi muốn tiến xa hơn bằng cách thực hiện lấy mẫu 2D, không chỉ thông qua việc lấy mẫu ngẫu nhiên trong blob mà còn lấy mẫu ngẫu nhiên giữa các blob. Tính chất tuyến tính mà KZG cam kết được sử dụng để "mở rộng" tập hợp blob trong Khối thông qua danh sách blob "ảo" mới được mã hóa dư thừa từ thông tin giống nhau.
Lấy mẫu 2D. Nguồn: a16z
Quan trọng nhất là, việc mở rộng cam kết tính toán không cần blob, do đó giải pháp này về cơ bản là thân thiện với việc xây dựng khối phân tán. Việc xây dựng thực tế của Nút khối chỉ cần có Cam kết Blob KZG và có thể phụ thuộc vào DAS để xác minh tính khả dụng của Blob. 1D DAS cũng thân thiện với việc xây dựng khối phân tán.
Có những mối liên hệ nào với nghiên cứu hiện có?
Bài viết gốc về tính khả dụng dữ liệu (2018):
Bài báo tiếp theo:
Bài giải thích của DAS, mẫu:
Cam kết sẵn có 2D của KZG:
PeerDAS trên ethresear.ch: và bài báo:
EIP-7594:
SubnetDAS trên ethresear.ch:
Các sắc thái của khả năng phục hồi trong lấy mẫu 2D:
Còn cần làm gì, cần cân nhắc điều gì?
Bước tiếp theo là hoàn thành và triển khai PeerDAS. Từ đó, việc tăng số lượng blob trên PeerDAS sẽ là một công việc tiến bộ, đồng thời quan sát mạng cẩn thận và cải tiến phần mềm để đảm bảo an toàn. Trong khi đó, chúng tôi hy vọng sẽ tiến hành nhiều nghiên cứu học thuật liên quan đến PeerDAS và các dạng DAS phiên bản khác cũng như vấn đề an ninh với quy tắc lựa chọn fork.
Trong tương lai, chúng ta cần phải làm nhiều việc hơn để tìm ra phiên bản lý tưởng của DAS 2D và chứng minh các tính năng bảo mật của nó. Chúng tôi cũng muốn cuối cùng chuyển từ KZG sang một giải pháp thay thế chống lượng tử, không tin cậy. **Tại thời điểm này, chúng tôi không biết bất kỳ ứng cử viên nào thân thiện với bản dựng khối phân tán. Ngay cả kỹ thuật "brute" đắt tiền của việc sử dụng STARK đệ quy để tạo ra bằng chứng hợp lệ của các hàng và cột được tái tạo là không đủ, bởi vì về mặt kỹ thuật kích thước băm của STARK là O (log (n) * log (log (n)) (với STIR), trong khi thực tế STARK gần như lớn bằng toàn bộ blob.
Trong tương lai xa, tôi nghĩ con đường thực tế là:
Công cụ 2D DAS lý tưởng;
Tiếp tục sử dụng 1D DAS, để đơn giản hóa và tăng tính ổn định, hiệu suất băng thông mẫu được hi sinh và giới hạn dữ liệu được chấp nhận thấp hơn;
(trục cứng) Từ bỏ DA và hoàn toàn ủng hộ Plasma là kiến trúc tầng 2 chính của chúng tôi theo dõi.
Chúng ta có thể đánh giá những điều này bằng cách cân nhắc phạm vi:
Vui lòng lưu ý rằng sự lựa chọn này vẫn tồn tại ngay cả khi chúng tôi quyết định mở rộng thực hiện trực tiếp trên L1. Điều này bởi vì nếu L1 phải xử lý một lượng lớn TPS, các khối L1 sẽ trở nên rất lớn và khách hàng sẽ cần một cách hiệu quả để xác minh chúng có đúng hay không, do đó chúng tôi phải sử dụng cùng một công nghệ hỗ trợ Rollup (ZK-EVM và DAS) và L1.
Nó tương tác như thế nào với các phần khác của lộ trình?
Nếu triển khai nén dữ liệu (xem bên dưới), nhu cầu của 2D DAS sẽ giảm đi một chút, hoặc ít nhất là sẽ Trễ, nếu Plasma được sử dụng rộng rãi, nhu cầu của 2D DAS sẽ giảm thêm. DAS cũng đối mặt với thách thức của việc xây dựng giao thức và cơ chế Khối phân tán: mặc dù trong lý thuyết, DAS thân thiện với việc tái cấu trúc phân tán, nhưng trong thực tế cần phối hợp với cơ chế lựa chọn fork bao gồm danh sách đề xuất và xung quanh nó.
Nén dữ liệu (Data compression)
Chúng ta đang giải quyết vấn đề gì?
Mỗi giao dịch trong Rollup đều sẽ chiếm một lượng không gian dữ liệu on-chain lớn: Việc chuyển đổi ERC20 cần khoảng 180 byte. Ngay cả khi sử dụng mẫu sẵn có lý tưởng cho sự có sẵn của dữ liệu, điều này cũng sẽ hạn chế tính mở rộng của giao thức lớp 2. Mỗi khe 16 MB, chúng ta có được: 01928374656574839201
16000000 / 12 / 180 = 7407 TPS
Nếu chúng ta không chỉ giải quyết vấn đề về tử số mà còn làm cho mỗi giao dịch trong Rollup chiếm ít byte hơn on-chain thì sao?
Nó là gì và làm việc như thế nào?
Tôi cho rằng giải thích tốt nhất là bức tranh hai năm trước đây:
Phương pháp nén đơn giản nhất là nén zero-byte: thay thế mỗi chuỗi zero-byte dài bằng hai byte biểu diễn số lượng zero-byte bằng cách sử dụng.
Tập hợp Chữ ký - Chúng tôi chuyển từ chữ ký ECDSA sang chữ ký BLS, chữ ký BLS có thuộc tính cho phép kết hợp nhiều chữ ký thành một chữ ký duy nhất có thể chứng minh tính hợp lệ của tất cả các chữ ký gốc. L1 không xem xét điều này vì chi phí tính toán cho việc xác minh (ngay cả khi sử dụng tập hợp) cũng cao hơn, nhưng trong môi trường dữ liệu khan hiếm như L2, chúng có thể coi là có ý nghĩa. Chức năng tập hợp của ERC-4337 cung cấp một phương pháp để thực hiện mục đích này.
Thay thế Địa chỉ bằng con trỏ - Nếu đã sử dụng Địa chỉ trước đây, chúng ta có thể thay thế 20 byte Địa chỉ bằng con trỏ 4 byte trỏ đến vị trí lịch sử. Điều này là cần thiết để đạt được lợi ích tối đa, mặc dù nó đòi hỏi nỗ lực để thực hiện, vì nó cần (ít nhất một phần) lịch sử của blockchain để có thể hiệu quả trở thành một phần của quốc gia.
Serialization tùy chỉnh giá trị giao dịch - Hầu hết các giá trị giao dịch chỉ có một số rất nhỏ, ví dụ như 0,25 ETH được biểu thị dưới dạng 250,000,000,000,000,000 wei. Gas max-basefees và phí ưu tiên ưu tiên cũng hoạt động tương tự. Do đó, chúng ta có thể sử dụng định dạng thập phân tùy chỉnh hoặc thậm chí là từ điển các giá trị phổ biến đặc biệt để biểu thị các giá trị tiền tệ phổ biến một cách rất gọn nhẹ.
Có những mối liên hệ nào với nghiên cứu hiện có?
Khám phá từ sequence.xyz:
Đối với hợp đồng tối ưu hóa Calldata của L2, từ ScopeLift:
Một chiến lược khác - Rollup dựa trên bằng chứng hợp lệ (còn gọi là ZKRollup) phát hành sự khác biệt trạng thái thay vì giao dịch: Dấu chân dữ liệu trên l2.
BLS Ví tiền - 通过 ERC-4337 实现 BLS 聚合:
Còn cần làm gì, cần cân nhắc điều gì?
Công việc chính còn lại là đưa kế hoạch trên thành hiện thực. Sự cân nhắc chính là:
Chuyển sang chữ ký BLS đòi hỏi nỗ lực lớn và sẽThả sự tương thích với chip phần cứng tin cậy có thể nâng cao tính an toàn. Bạn có thể sử dụng gói ZK-SNARK bọc cho các lựa chọn chữ ký khác.
Nén động (ví dụ như thay thế Địa chỉ bằng con trỏ) làm cho mã khách hàng trở nên phức tạp.
Nó tương tác như thế nào với các phần khác của lộ trình?
Việc áp dụng ERC-4337 và cuối cùng đưa một phần nội dung của nó vào L2 EVM có thể làm tăng tốc độ triển khai công nghệ gom nhóm. Việc đưa một phần nội dung của ERC-4337 vào L1 có thể làm tăng tốc độ triển khai trên L2.
Plasma rộng
Chúng ta đang giải quyết vấn đề gì?
Ngay cả khi sử dụng blob 16 MB và nén dữ liệu, 58,000 TPS cũng không đủ để hoàn toàn tiếp quản thanh toán của người tiêu dùng, mạng xã hội Phi tập trung hoặc các lĩnh vực có băng thông cao khác. Đặc biệt là khi chúng ta bắt đầu xem xét vấn đề riêng tư, điều này có thể làm giảm khả năng mở rộng từ 3-8 lần. Đối với các ứng dụng có dung lượng lớn và giá trị thấp, một lựa chọn hiện tại là validium, nó giữ dữ liệu ở trạng thái off-chain và có mô hình bảo mật thú vị, các nhà điều hành không thể ăn cắp tiền của người dùng, nhưng họ có thể biến mất và tạm thời hoặc vĩnh viễn đóng băng tất cả số tiền của người dùng. Nhưng chúng ta có thể làm tốt hơn được.
Nó là gì và làm việc như thế nào?
Plasma là một giải pháp mở rộng quy mô liên quan đến việc các toán tử xuất bản Khối off-chain và đặt các gốc Merkle của các Khối đó trên chuỗi (không giống như Rollups, rollups đặt toàn bộ Khối trên chuỗi). Đối với mỗi Khối, nhà điều hành gửi một nhánh Merkle cho mỗi người dùng, chứng minh điều gì đã xảy ra hoặc không xảy ra với tài sản của người dùng đó. Người dùng có thể rút tài sản bằng cách cung cấp chi nhánh Merkle. Điều quan trọng là chi nhánh không phải bắt nguồn từ trạng thái mới nhất - vì vậy ngay cả khi tính khả dụng của dữ liệu không thành công, người dùng vẫn có thể khôi phục tài sản của họ bằng cách rút lại trạng thái mới nhất có sẵn. Nếu người dùng gửi một fork không hợp lệ (ví dụ: thoát khỏi tài sản mà họ đã gửi cho người khác hoặc nhà điều hành tạo ra một tài sản từ không khí), cơ chế thách thức trên chuỗi có thể quy định tài sản đó thuộc về ai.
Plasma Cash chain diagram. The transaction spending coin i is put into the i-th position in the tree. In this example, assuming all previous trees are valid, we know that Eve currently owns hard coin 1, David owns hard coin 4, George owns hard coin 6.
Phiên bản sớm của Plasma chỉ xử lý các trường hợp thanh toán và không thể mở rộng một cách hiệu quả. Tuy nhiên, nếu chúng ta yêu cầu mỗi gốc được xác minh bằng SNARK, thì Plasma sẽ mạnh mẽ hơn. Mọi trò chơi thách thức đều có thể được đơn giản hóa đáng kể vì chúng ta loại bỏ hầu hết các con đường gian lận của người vận hành. Những con đường mới cũng được mở ra, cho phép công nghệ Plasma mở rộng đến nhiều loại tài sản hơn. Cuối cùng, trong trường hợp người vận hành không gian lận, người dùng có thể rút tiền ngay lập tức mà không cần phải chờ đợi một tuần thời hạn thách thức.
Một phương pháp để tạo ra một chuỗi EVM Plasma (không phải là phương pháp duy nhất): sử dụng ZK-SNARK để xây dựng cây UTXO song song, phản ánh sự thay đổi cân bằng được thực hiện bởi EVM và xác định điểm khác biệt duy nhất của lịch sử ánh xạ "cùng loại tiền". Sau đó, có thể xây dựng cấu trúc Plasma dựa trên điều này.
Một quan điểm quan trọng là hệ thống Plasma không cần hoàn hảo. Ngay cả khi bạn chỉ có thể bảo vệ một phần tài sản (ví dụ, chỉ là các Token không di chuyển trong tuần qua), bạn đã cải thiện đáng kể tình trạng hiện tại của EVM siêu mở rộng, điều này là một sự xác minh.
Một loại cấu trúc khác là cấu trúc Plasma/rollups hỗn hợp, ví dụ như Intmax. Những cấu trúc này đặt một lượng dữ liệu rất nhỏ của mỗi người dùng trên on-chain (ví dụ như 5 byte), qua đó có thể đạt được tính chất giữa Plasma và Rollup: trong trường hợp Intmax, bạn có thể đạt được khả năng mở rộng và riêng tư cực kỳ cao, thậm chí trong thế giới 16 MB, giới hạn về dung lượng lý thuyết cũng chỉ khoảng 16.000.000 / 12 / 5 = 266.667 TPS.
Có những mối liên hệ nào với nghiên cứu hiện có?
Giấy plasma gốc:
Plasma现金:
Luồng tiền mặt Plasma:
Intmax(2023):
Còn cần làm gì, cần cân nhắc điều gì?
Nhiệm vụ chính còn lại là đưa hệ thống Plasma vào sản xuất. Như đã đề cập ở trên, 'plasma và validium' không phải là một đối tác nhị phân: bất kỳ validium nào cũng có thể cải thiện ít nhất một chút hiệu suất an toàn bằng cách thêm tính năng Plasma vào cơ chế rút lui. Phần nghiên cứu là để đạt được các thuộc tính tốt nhất của EVM (trong yêu cầu đáng tin cậy, chi phí Gas L1 xấu nhất và sự dễ bị tấn công DoS) cũng như cấu trúc cụ thể cho ứng dụng thay thế. Ngoài ra, khái niệm Plasma phức tạp hơn so với rollups, cần được giải quyết trực tiếp thông qua nghiên cứu và xây dựng khung tổng quát tốt hơn.
Một nhược điểm chính của việc sử dụng thiết kế Plasma là chúng phụ thuộc nhiều hơn vào người điều hành và khó khăn hơn để "dựa vào", mặc dù thiết kế Plasma/rollup kết hợp thường có thể tránh điểm yếu này.
Nó tương tác như thế nào với các phần khác của lộ trình?
Khi giải pháp Plasma hoạt động hiệu quả hơn, áp lực đối với tính sẵn có của dữ liệu hiệu suất cao trên L1 cũng nhỏ hơn. Việc chuyển hoạt động sang L2 cũng giúp giảm áp lực MEV trên L1.
Hệ thống chứng minh L2 đã trưởng thành
Chúng ta đang giải quyết vấn đề gì?
Ngày nay, hầu hết các Bản tổng hợp chưa thực sự Chưa đáng tin cậy; Có một Hội đồng Bảo an có khả năng lật ngược (lạc quan hoặc hiệu quả) các hành động của hệ thống đã được chứng minh. Trong một số trường hợp, hệ thống chứng thực thậm chí không tồn tại, hoặc thậm chí nếu có, nó chỉ có chức năng "tư vấn". Tiên tiến nhất là (i) một số Bản tổng hợp dành riêng cho ứng dụng, chẳng hạn như Nhiên liệu, Không đáng tin cậy và (ii) tính đến thời điểm viết bài, Optimism và Arbitrum, hai Bản tổng hợp EVM hoàn chỉnh đã đạt được các mốc quan trọng một phần không đáng tin cậy được gọi là "Giai đoạn 1". Lý do Rollups không đi xa hơn là vì sợ lỗi trong mã. Chúng ta cần Rollup của Không đáng tin cậy, vì vậy chúng ta cần phải giải quyết vấn đề này.
Nó là gì và làm việc như thế nào?
Đầu tiên, hãy xem lại hệ thống 'stage' được giới thiệu ban đầu trong bài viết này. Có yêu cầu chi tiết hơn, nhưng tóm lại như sau:
Giai đoạn 0: Người dùng phải có khả năng chạy Nút và đồng bộ chuỗi. Nếu xác minh hoàn toàn đáng tin cậy / tập trung, nó ổn.
Giai đoạn 1: Hệ thống chứng thực (Không đáng tin cậy) phải tồn tại để đảm bảo chỉ chấp nhận các giao dịch hợp lệ. Cho phép tồn tại một ủy ban an ninh có thể lật đổ hệ thống chứng thực, nhưng chỉ với ngưỡng bỏ phiếu là 75%. Ngoài ra, số lượng pháp định của Hội đồng cản trở phải nằm ngoài các công ty chính xây dựng Rollup (tức là trên 26%). Cho phép sử dụng cơ chế nâng cấp yếu hơn (ví dụ như DAO), nhưng phải có độ trễ đủ dài để người dùng có thể rút vốn trước khi nâng cấp độc hại được phê duyệt và triển khai.
**Vòng 2: ** Phải có một hệ thống chứng minh (không đáng tin cậy) để đảm bảo chỉ chấp nhận giao dịch hợp lệ. Chỉ khi có lỗi có thể chứng minh trong mã nguồn, Hội đồng An ninh mới được phép can thiệp, ví dụ. Nếu hai hệ thống chứng minh dư lý không nhất quán với nhau, hoặc nếu một hệ thống chứng minh chấp nhận hai trạng thái gốc khác nhau của cùng một khối (hoặc không chấp nhận bất kỳ nội dung nào trong một khoảng thời gian đủ lâu, ví dụ một tuần). Cơ chế nâng cấp được phép, nhưng phải có Trễ rất lớn.
Mục tiêu của chúng tôi là đạt được giai đoạn thứ hai. Thách thức chính ở giai đoạn thứ hai là có đủ niềm tin, chứng minh rằng hệ thống thực sự đáng tin cậy. Có hai phương pháp chính có thể làm được điều này:
Xác minh hình thức: Chúng ta có thể sử dụng toán học hiện đại và công nghệ tính toán để chứng minh (tích cực hoặc hiệu quả) hệ thống chỉ chấp nhận Khối theo đúng quy định EVM. Công nghệ này đã tồn tại trong vài thập kỷ, nhưng những tiến bộ gần đây (ví dụ như Lean 4) đã khiến chúng trở nên hữu ích hơn, và sự tiến bộ trong việc chứng minh được hỗ trợ bởi trí tuệ nhân tạo có thể tiếp tục thúc đẩy xu hướng này.
Đa chữ ký chứng minh đa người chứng minh: Xây dựng hệ thống chứng minh đa người chứng minh và cung cấp tiền vào các hệ thống chứng minh này và ủy ban an ninh (và/hoặc các công cụ nhỏ khác có giả định tin cậy như TEE) giữa 2 trong số 3 (hoặc nhiều hơn) Đa chữ ký. Nếu hệ thống chứng minh đồng ý, ủy ban an ninh không có quyền lực. Nếu họ không đồng ý, ủy ban an ninh chỉ có thể chọn một trong số họ, không thể áp đặt câu trả lời của mình một mình.
Sơ đồ thiết kế của nhiều chứng minh kết hợp một hệ thống chứng minh lạc quan, một hệ thống bằng chứng hợp lệ và một ủy ban an toàn.
Có những mối liên hệ nào với nghiên cứu hiện có?
EVM K Semantics (Công việc xác thực chính thức bắt đầu từ năm 2017):
Bài thuyết trình về ý tưởng của người chứng minh nhiều (2022):
Kế hoạch Taiko sử dụng chứng thực đa yếu tố:
Còn cần làm gì, cần cân nhắc điều gì?
Đối với việc xác minh hình thức, có rất nhiều cách. Chúng ta cần tạo phiên bản xác minh chính thức của người chứng minh SNARK toàn bộ của EVM. Đây là một dự án cực kỳ phức tạp, mặc dù chúng tôi đã bắt đầu. Có một mẹo có thể đơn giản hóa nhiệm vụ đáng kể: chúng ta có thể tạo người chứng minh SNARK chính thức cho máy ảo tối thiểu, ví dụ. RISC-V hoặc Cairo, sau đó viết triển khai của EVM trong máy ảo tối thiểu đó (và chứng minh chính thức tính tương đương của nó với một số quy cách EVM khác).
Đối với người chứng thực đa chữ ký, còn hai phần chính cần được xem xét. Thứ nhất, chúng ta cần có đủ niềm tin vào ít nhất hai hệ thống chứng thực khác nhau, mỗi hệ thống đều đảm bảo an toàn và nếu xảy ra sự cố, chúng sẽ gặp sự cố vì các nguyên nhân khác nhau và không liên quan (vì vậy chúng sẽ không cùng lúc gặp sự cố). Thứ hai, chúng ta cần có mức đảm bảo rất cao trong logic cơ bản của việc kết hợp các hệ thống chứng thực. Đây là một đoạn mã nhỏ. Có nhiều cách để làm cho nó rất nhỏ - chỉ cần lưu trữ tài sản trong hợp đồng đa chữ ký an toàn, người ký là hợp đồng đại diện cho hệ thống chứng thực cá nhân - nhưng điều này đòi hỏi phải trả một khoản phí gas trên-chain cao. Cần tìm một sự cân bằng giữa hiệu quả và an toàn.
Nó tương tác như thế nào với các phần khác của lộ trình?
Việc di chuyển hoạt động đến L2 có thể giảm áp lực MEV trên L1.
Cải tiến tương tác giữa các L2
Chúng ta đang giải quyết vấn đề gì?
Một thách thức lớn của hệ sinh thái L2 hiện nay là người dùng khó thao tác. Hơn nữa, cách đơn giản nhất thường đòi hỏi sự giả định về sự tin cậy: cầu nối tập trung, khách hàng RPC, v.v. Nếu chúng ta coi L2 là một phần của Ethereum, chúng ta cần làm cho hệ sinh thái L2 trở nên dễ sử dụng giống như hệ sinh thái thống nhất của Ethereum.
Một ví dụ cực kỳ tồi tệ (thậm chí nguy hiểm: tôi mất 100 đô la cá nhân vì lựa chọn chuỗi ở đây sai) qua trải nghiệm người dùng L2 - mặc dù điều này không phải là lỗi của Polymarket, nhưng tính tương tác qua L2 nên là trách nhiệm của cộng đồng Ethereum (ERC). Trong hệ sinh thái Ethereum hoạt động tốt, việc gửi Token từ L1 đến L2 hoặc từ L2 này sang L2 khác nên giống như việc gửi Token trong cùng một L1.
Nó là gì và làm việc như thế nào?
Cải thiện tương tác L2 có nhiều loại khác nhau. Nhìn chung, cách tiếp cận vấn đề này là nhận thấy lý thuyết, trung tâm của Ethereum sử dụng Rollup và việc thực hiện Phân mảnh trên L1 là tương tự nhau, sau đó hỏi xem phiên bản L2 của Ethereum hiện tại thực tế có khác biệt như thế nào so với lý tưởng. Dưới đây là một số điểm:
Địa chỉ cụ thể của chuỗi: Chuỗi (L1, Optimism, Arbitrum...) nên là một phần của Địa chỉ. Khi đã triển khai, chỉ cần đặt Địa chỉ vào trường "Gửi" để thực hiện quá trình gửi qua L2, lúc này Ví tiền có thể xác định cách thức thực hiện gửi (bao gồm cả sử dụng giao thức cầu).
Yêu cầu thanh toán cụ thể trên chuỗi: Tạo thông điệp trong dạng "Gửi cho tôi Z on-chain loại X Token" nên đơn giản và chuẩn hóa. Điều này có hai trường hợp sử dụng chính: (i) thanh toán, cho dù là cá nhân đến cá nhân hoặc cá nhân đến dịch vụ của cửa hàng, và (ii) dapp yêu cầu quỹ, ví dụ như ví dụ của Polymarket ở trên.
**Tương tác chuỗi chéo交换和 gas 支付:**应该有一个标准化的开放giao thức来表达Tương tác chuỗi chéo操作,例如“我在 Optimism 上发送 1 ETH 给在 Arbitrum 上发送 0.9999 ETH 的人”,以及“我在 Optimism 上发送 0.0001 ETH”任何人在 Arbitrum 上包含此交易。 ERC-7683 是对前者的尝试,而 RIP-7755 是对后者的尝试,尽管两者都比这些特定用例更通用。
**khách hàng ánh sáng:**Người dùng nên có khả năng xác minh thực tế rằng họ đang tương tác với chuỗi mạng, chứ không chỉ là tin tưởng nhà cung cấp RPC. Helios của Tiền điện tử A16z đã làm được điều này cho Ethereum, nhưng chúng ta cần mở rộng tính không tin cậy này sang L2. ERC-3668 (CCIP-read) là một chiến lược để thực hiện mục tiêu này.
Làm thế nào để cập nhật Chủ đề ETH của khách hàng ánh sáng. Khi có Chủ đề, bạn có thể sử dụng chứng minh Merkle để xác minh bất kỳ đối tượng trạng thái nào. Khi bạn có đối tượng trạng thái L1 chính xác, bạn có thể sử dụng chứng minh Merkle (nếu bạn muốn kiểm tra trước xác nhận, bạn cũng có thể sử dụng chữ ký) để xác minh bất kỳ đối tượng trạng thái nào trên L2.Helios đã làm được điều đầu tiên. Mở rộng đến điều sau là một thách thức chuẩn hóa.
Ví tiền Chìa khoá bảo mật thư viện: Hiện nay, nếu bạn muốn cập nhật Chìa khoá bảo mật kiểm soát Hợp đồng thông minh Ví tiền, bạn phải thực hiện thao tác này trên tất cả N on-chain mà Ví tiền đó đang có. Thư viện Chìa khoá bảo mật Ví tiền là một công nghệ cho phép Chìa khoá bảo mật tồn tại tại một vị trí (trên L1 hoặc có thể sau đó trên L2), sau đó được đọc từ bất kỳ L2 nào có bản sao của Ví tiền. Điều này có nghĩa là chỉ cần cập nhật một lần. Để tăng hiệu quả, thư viện Chìa khoá bảo mật Ví tiền yêu cầu L2 có một cách chuẩn hóa để đọc L1 mà không tốn phí; hai đề xuất cho điều này là L1SLOAD và REMOTESTATICCALL.
Ví tiền如何工作的程式化图表。
Ý tưởng 'cầu Token chia sẻ' táo bạo hơn: Hãy tưởng tượng một thế giới với tất cả các L2 đều là bằng chứng hợp lệ Rollup, với mỗi khe cắm được cam kết cho Ethereum. Ngay cả trong thế giới này, việc chuyển tài sản 'địa phương' từ một L2 sang L2 khác cũng đòi hỏi rút và gửi tiền, đòi hỏi phải trả một khoản Gas L1 lớn. Một cách để giải quyết vấn đề này là tạo ra một Rollup tối thiểu chia sẻ, chức năng duy nhất của nó là giữ số dư của các loại Token mà mỗi L2 sở hữu và cho phép cập nhật số dư này thông qua một loạt các giao dịch chéo được khởi động bởi bất kỳ L2 nào. Điều này sẽ cho phép chuyển tiền giữa các L2 mà không cần thanh toán Gas L1 mỗi lần chuyển tiền và không cần sử dụng công nghệ cung cấp Thanh khoản (như ERC-7683).
Tính kết hợp đồng bộ: Cho phép cuộc gọi đồng bộ xảy ra giữa các L2 cụ thể và giữa nhiều L2. Điều này có thể giúp cải thiện hiệu suất tài chính của giao thức defi. Đối với trường hợp đầu tiên, nó có thể hoàn thành mà không cần điều phối giữa các L2; đối với trường hợp sau, nó yêu cầu chia sẻ trình tự. Dựa trên Rollup tự động hóa cho tất cả các công nghệ này.
Có những mối liên hệ nào với nghiên cứu hiện có?
Địa chỉ đặc biệt của chuỗi: ERC-3770:
ERC-7683:
RIP-7755:
Thiết kế Ví tiền cho Thư viện Khóa cuộn
Helios:
ERC-3668(đôi khi được gọi là CCIP-read):
Đề xuất 'Xác nhận trước (Chia sẻ)' của Justin Drake:
L1SLOAD (RIP-7728):
Gọi từ xa trong tâm trạng lạc quan:
AggLayer, bao gồm cả ý tưởng cầu nối mã thông báo chia sẻ:
Còn cần làm gì, cần cân nhắc điều gì?
Nhiều ví dụ trên phải đối mặt với tình trạng tiến thoái lưỡng nan về tiêu chuẩn hóa khi nào và lớp nào cần tiêu chuẩn hóa. Nếu bạn chuẩn hóa quá sớm, bạn có nguy cơ gặp phải các giải pháp kém chất lượng. Nếu bạn chuẩn hóa quá muộn, bạn có nguy cơ bị phân mảnh không cần thiết. Trong một số trường hợp, có những giải pháp ngắn hạn ít hiệu quả hơn nhưng dễ thực hiện hơn và các giải pháp dài hạn "cuối cùng đúng" nhưng mất một lượng thời gian đáng kể để thực hiện.
Điều đặc biệt ở phần này là những nhiệm vụ không chỉ là vấn đề kỹ thuật: chúng cũng là (có lẽ chủ yếu là!) vấn đề xã hội. Chúng cần sự hợp tác giữa L2 và Ví tiền cũng như L1. Khả năng giải quyết vấn đề này thành công là bài kiểm tra về khả năng của chúng ta như một cộng đồng đoàn kết.
Nó tương tác như thế nào với các phần khác của lộ trình?
Hầu hết các đề xuất trong này đều là cấu trúc 'tầng cao' nên sẽ không ảnh hưởng nhiều đến việc xem xét L1. Một ngoại lệ là sắp xếp chia sẻ, nó ảnh hưởng lớn đến MEV.
Thực thi trên L1 mở rộng
Chúng ta đang giải quyết vấn đề gì?
Nếu L2 trở nên rất có thể mở rộng và thành công, nhưng L1 vẫn chỉ có thể xử lý rất ít giao dịch, thì Ethereum có thể đối mặt với nhiều rủi ro:
Tình trạng kinh tế của tài sản ETH trở nên nguy hiểm hơn, ảnh hưởng đến an ninh dài hạn của mạng.
Nhiều nền tảng L2 hưởng lợi từ việc liên kết chặt chẽ với hệ sinh thái tài chính phát triển mạnh trên L1, nếu hệ sinh thái này suy yếu nghiêm trọng, sức mạnh của L2 (thay vì là L1 độc lập) sẽ giảm đi.
L2 cần mất rất nhiều thời gian để có được bảo đảm an toàn hoàn toàn giống như L1.
Nếu L2 gặp sự cố (ví dụ như do hoạt động xấu xa hoặc nhà cung cấp mất tích), người dùng vẫn cần phải thông qua L1 để khôi phục tài sản của họ. Do đó, L1 cần đủ mạnh mẽ, ít nhất là có thể xử lý đôi khi các sự kết thúc phức tạp và lộn xộn của L2.
Vì những lý do này, việc mở rộng L1 và đảm bảo rằng nó có thể tiếp tục thích nghi với ngày càng nhiều ứng dụng là rất có giá trị.
Nó là gì và làm việc như thế nào?
Phương pháp mở rộng đơn giản nhất là tăng giới hạn gas. Tuy nhiên, điều này mang theo rủi ro tập trung của L1, làm suy yếu một thuộc tính quan trọng khác của ETH là tính tin cậy của nền tảng mạnh mẽ này. Câu hỏi về việc tăng giới hạn gas đơn giản đến mức nào là bền vững luôn gây tranh cãi, và điều này cũng sẽ thay đổi tùy thuộc vào việc triển khai các công nghệ khác nhau, để làm cho việc xác minh các khối lớn hơn trở nên dễ dàng hơn (ví dụ: lịch sử hết hạn, statelessness, bằng chứng hợp lệ L1 EVM). Một điều quan trọng khác cần phải được cải thiện liên tục là hiệu suất của phần mềm khách hàng ETH ngày nay được tối ưu hóa hơn so với năm năm trước. Chiến lược tăng giới hạn gas L1 hiệu quả sẽ liên quan đến việc tăng tốc các công nghệ xác minh này.
Một chiến lược mở rộng khác liên quan đến việc xác định các chức năng và loại tính toán cụ thể mà có thể trở nên rẻ hơn mà không làm tổn thương tính phân tán của mạng hoặc tính an toàn của nó. Các ví dụ trong lĩnh vực này bao gồm:
EOF - Định dạng mã byte EVM mới thân thiện hơn với phân tích tĩnh và cho phép triển khai nhanh hơn. Với những hiệu quả này, mã bytecode EOF có thể được cung cấp chi phí gas thấp hơn.
Định giá Gas đa chiều - Việc thiết lập một phí cơ bản riêng biệt và giới hạn tính toán, dữ liệu và lưu trữ có thể tăng dung lượng trung bình của ETH L1 mà không tăng dung lượng tối đa (do đó tạo ra các rủi ro bảo mật mới).
Thả特定操作码和预编译的 gas 成本 - Từ quan điểm lịch sử, chúng tôi đã tăng chi phí gas cho một số hoạt động có giá quá thấp qua một số vòng để tránh tấn công từ chối dịch vụ. Chúng tôi đã làm ít nhưng có thể làm nhiều hơn, đó là giảm chi phí gas cho những hoạt động giá quá cao. Ví dụ, phép cộng rẻ hơn so với phép nhân, nhưng chi phí của các mã hoạt động ADD và MUL hiện tại là như nhau. Chúng tôi có thể làm cho phép cộng rẻ hơn, thậm chí làm cho các mã hoạt động đơn giản hơn (ví dụ như PUSH) rẻ hơn. EOF tổng thể có nhiều hơn.
EVM-MAX và SIMD: EVM-MAX ("Mở rộng số học modular") là một đề xuất cho phép toán học số lớn native hiệu quả hơn như một module riêng của EVM. Các giá trị tính toán bằng EVM-MAX chỉ có thể được truy cập bởi các opcode EVM-MAX khác, trừ khi được xuất khẩu cố ý; điều này cho phép có nhiều không gian hơn để lưu trữ các giá trị này theo định dạng tối ưu. SIMD ("Đa dữ liệu một chỉ thị") là một đề xuất cho phép thực hiện cùng một chỉ thị trên mảng giá trị một cách hiệu quả. Cả hai cùng nhau có thể tạo ra một bộ xử lý phụ mạnh mẽ cùng với EVM, được sử dụng để thực hiện mã hóa hiệu quả hơn. Điều này đặc biệt hữu ích đối với giao thức bảo mật và hệ thống chứng minh L2, do đó nó sẽ giúp mở rộng L1 và L2.
Những cải tiến này sẽ được thảo luận cụ thể hơn trong các bài viết sau về Splurge.
Cuối cùng, chiến lược thứ ba là Rollup nguyên sinh (hoặc "Rollup tích hợp sẵn"): Theo bản chất, tạo nhiều bản sao của EVM chạy song song, tạo ra một mô hình tương đương với mô hình mà Rollup có thể cung cấp, nhưng tích hợp một cách nguyên sinh hơn vào giao thức.
Có những mối liên hệ nào với nghiên cứu hiện có?
Lộ trình mở rộng L1 của Polynya ETH:
Định giá Gas đa chiều:
EIP-7706:
EOF:
EVM-MAX:
SIMD:
Rollup cấp cao:
Phỏng vấn Max Resnick về giá trị mở rộng L1:
Justin Drake về việc mở rộng bằng cách sử dụng SNARK và Rollup nguyên bản:
Còn cần làm gì, cần cân nhắc điều gì?
L1 mở rộng có ba chiến lược, có thể thực hiện độc lập hoặc song song:
Cải thiện công nghệ (ví dụ: mã khách hàng, khách hàng không trạng thái, lịch sử hết hạn) làm cho L1 dễ xác minh hơn, sau đó tăng giới hạn gas
Thả成本 của các hoạt động cụ thể, tăng trung bình dung lượng mà không tăng nguy cơ tình huống tồi nhất
Rollup gốc (tức là "tạo ra N bản sao song song của EVM", mặc dù có thể cung cấp sự linh hoạt lớn đối với các tham số triển khai bản sao của các nhà phát triển)
Điều đáng hiểu là đây là những công nghệ khác nhau với những sự cân nhắc khác nhau. Ví dụ, Rollup gốc có nhiều điểm yếu tương tự như Rollup thông thường về khả năng tương tác: bạn không thể gửi một giao dịch duy nhất để thực hiện các hoạt động đồng bộ qua nhiều giao dịch như bạn có thể xử lý hợp đồng trên cùng một L1 (hoặc L2). Tăng giới hạn Gas sẽ tước đi những lợi ích khác có thể đạt được bằng cách làm cho L1 dễ dàng xác minh, chẳng hạn như tăng tỷ lệ người dùng kiểm tra Nút và tăng số người thế chấp độc lập. Làm cho các hoạt động cụ thể trong EVM rẻ hơn (phụ thuộc vào cách thức thực hiện) có thể làm tăng độ phức tạp tổng thể của EVM.
Một trong những vấn đề lớn mà bất kỳ lộ trình mở rộng L1 nào cũng cần trả lời là: Tầm nhìn cuối cùng của L1 và L2 là gì? Rõ ràng, việc thực hiện tất cả mọi thứ trên L1 là vô lí: Có hàng trăm nghìn giao dịch mỗi giây có thể xảy ra, điều này sẽ khiến cho L1 không thể xác minh hoàn toàn (trừ khi chúng ta áp dụng lộ trình Rollup nguyên sinh). Nhưng chúng ta thực sự cần một số nguyên tắc chỉ đạo để đảm bảo rằng chúng ta không gây ra tình huống như thế này: Chúng ta tăng giới hạn Gas lên 10 lần, gây thiệt hại nghiêm trọng cho tính tập trung của ETH và phát hiện ra rằng chúng ta chỉ đang bước vào một thế giới, trong đó không gần như 99% hoạt động đều diễn ra trên L2, 90% hoạt động đều diễn ra trên L2, do đó kết quả trông gần như giống nhau, ngoại trừ sự mất mát không thể đảo ngược của đặc tính đặc biệt của ETH L1.
Một quan điểm đề xuất về "phân công" giữa L1 và L2
Nó tương tác như thế nào với các phần khác của lộ trình?
Thu hút nhiều người dùng hơn vào L1 có nghĩa là cải thiện không chỉ quy mô, mà cả các khía cạnh khác của L1. Điều này có nghĩa là nhiều MEV sẽ vẫn còn trên L1 (thay vì chỉ trở thành một vấn đề đối với L2), vì vậy có một nhu cầu cấp thiết để giải quyết nó một cách rõ ràng. Nó làm tăng đáng kể giá trị của thời gian khe cắm nhanh trên L1. Nó cũng phụ thuộc rất nhiều vào việc xác nhận trơn tru của L1 ("The Verge").
Đặc biệt cảm ơn Justin Drake, Francesco, Hsiao-wei Wang, @antonttc và Georgios Konstantopoulos
Vitalik: Cách thức phát triển giao thức Ethereum trong giai đoạn Surge
Chú ý: Đây là phần 2 trong loạt bài viết 'Tương lai phát triển của giao thức Ethereum' của Vitalik, người sáng lập ETH, với tiêu đề 'Các tương lai có thể của giao thức Ethereum, phần 2: Sự bùng nổ'. Phần 1 đã được đăng trên trang Kinh tế và Vàng với tiêu đề 'Những cải tiến tiềm năng khác cho ETH PoS'. Bài viết này được dịch bởi Đặng Thông của Kinh tế và Vàng, dưới đây là toàn bộ nội dung phần 2:
Ban đầu, Ethereum có hai chiến lược mở rộng trong bản đồ con đường.
Một trong số đó là “Phân mảnh(sharding)”:Mỗi Nút chỉ cần xác minh và lưu trữ một phần nhỏ giao dịch, thay vì xác minh và lưu trữ tất cả giao dịch trên chuỗi. Điều này cũng là cách thức hoạt động của bất kỳ mạng ngang hàng nào khác (ví dụ BitTorrent), vì vậy chúng ta có thể làm cho blockchain hoạt động theo cùng cách.
Một trong số đó là giao thức lớp 2: Mạng sẽ được xây dựng trên Ethereum để cho họ có thể tận dụng đầy đủ tính an toàn của nó, đồng thời làm cho hầu hết dữ liệu và tính toán rời xa Chuỗi chính. Thuật ngữ “giao thức lớp 2” ám chỉ đến Kênh trạng thái năm 2015, Plasma năm 2017 và Rollups năm 2019. Rollup mạnh mẽ hơn Kênh trạng thái hoặc Plasma, nhưng chúng cần băng thông dữ liệu on-chain lớn.
May mắn thay, đến năm 2019, nghiên cứu Phân mảnh đã giải quyết được vấn đề xác minh "tính sẵn có của dữ liệu" trên quy mô lớn. Kết quả là, hai con đường đã hợp nhất và chúng tôi đã kết thúc với một lộ trình tập trung vào Rollup vẫn là chiến lược mở rộng quy mô của Ethereum ngày nay.
The Surge, bản đồ tuyến đường năm 2023.
Lộ trình tập trung vào Rollup đưa ra một phân công đơn giản: ETH L1 tập trung vào việc trở thành một lớp cơ sở mạnh mẽ và Phi tập trung, trong khi L2 đảm nhận nhiệm vụ hỗ trợ mở rộng hệ sinh thái. Điều này là một mô hình tái diễn khắp nơi trong xã hội: hệ thống tòa án (L1) không phải để đạt tốc độ siêu nhanh và hiệu quả, mà là để bảo vệ hợp đồng và quyền sở hữu, trong khi doanh nhân (L2) cần xây dựng một lớp cơ sở vững chắc trên cơ sở này và đưa con người đến sao Hỏa (ẩn dụ và đen trắng).
Năm nay, lộ trình tập trung vào Rollup đã đạt được những thành công quan trọng: băng thông dữ liệu L1 của ETH Place đã được tăng lên đáng kể với các đốm EIP-4844 và nhiều EVM Rollups hiện đang trong giai đoạn đầu tiên. Việc triển khai rất không đồng nhất và đa nguyên, trong đó mỗi L2 hoạt động như một "mảnh vỡ" với các quy tắc và logic nội bộ riêng, giờ đây đã trở thành hiện thực. Nhưng như chúng ta đã thấy, đi theo con đường này có những thách thức độc đáo của riêng nó. Vì vậy, bây giờ nhiệm vụ của chúng tôi là hoàn thành lộ trình tập trung vào Rollup và giải quyết những vấn đề này trong khi vẫn giữ được sự mạnh mẽ và phân cấp khiến ETH Workshop L1 trở nên khác biệt. **
Ba khó khăn về khả năng mở rộng
Khả năng mở rộng Bộ ba tàn ác là một ý tưởng được đưa ra vào năm 2017, nó cho rằng có một mối quan hệ căng thẳng giữa ba thuộc tính của blockchain: Phi tập trung (cụ thể hơn: chi phí thấp của việc vận hành Nút), khả năng mở rộng (cụ thể hơn: xử lý một lượng lớn giao dịch) và bảo mật (cụ thể hơn: kẻ tấn công cần phá hủy hầu hết Nút trong toàn bộ mạng lưới mới có thể làm cho một giao dịch thất bại).
Cần lưu ý rằng trilemma không phải là một định lý, và bài viết giới thiệu trilemma không đi kèm với một chứng minh toán học. Nó đưa ra một lập luận toán học heuristic: nếu một Nút thân thiện với Phi tập trung (ví dụ: máy tính xách tay tiêu dùng) có thể xác minh N giao dịch mỗi giây và bạn có một chuỗi xử lý k * N giao dịch mỗi giây, thì (i) mỗi giao dịch chỉ có thể được nhìn thấy ở 1 / k của Nút, có nghĩa là kẻ tấn công chỉ cần phá vỡ một vài Nút để đẩy các giao dịch xấu hoặc (ii) Nút của bạn sẽ trở nên mạnh mẽ và chuỗi của bạn không phải là Phi tập trung. Mục đích của bài viết này chưa bao giờ là để chỉ ra rằng phá vỡ trilemma là không thể; Thay vào đó, nó có nghĩa là để cho thấy rằng thoát ra khỏi tình trạng tiến thoái lưỡng nan là khó khăn - nó đòi hỏi phải suy nghĩ bên ngoài chiếc hộp mà lập luận gợi ý theo một cách nào đó.
Trong nhiều năm qua, một số chuỗi hiệu suất cao thường tuyên bố rằng họ đã giải quyết được ba khó khăn mà không áp dụng bất kỳ biện pháp thông minh nào ở mức cơ sở hạ tầng, thường là thông qua việc tinh chỉnh Nút bằng các kỹ thuật kỹ thuật phần mềm. Điều này luôn luôn gây hiểu lầm và việc chạy Nút trên các chuỗi như vậy luôn khó hơn rất nhiều so với ETH. Bài viết này khám phá nhiều khía cạnh tinh tế về tại sao tình huống này xảy ra (và tại sao kỹ thuật phần mềm L1 của khách hàng không thể mở rộng ETH một mình).
Tuy nhiên, sự kết hợp giữa việc lấy mẫu khả dụng dữ liệu (DAS) và SNARK thực sự giải quyết ba khó khăn: nó cho phép khách hàng xác minh xem một số lượng dữ liệu có sẵn và liệu có thực hiện đúng một số lượng bước tính toán nhất định hay không, đồng thời chỉ tải xuống một phần nhỏ dữ liệu đó và lượng tính toán chạy được cũng nhỏ hơn rất nhiều. SNARK không đáng tin cậy. Lấy mẫu khả dụng dữ liệu có mô hình tin cậy N nhỏ tinh vi, nhưng nó giữ lại các thuộc tính cơ bản của chuỗi không mở rộng, ngay cả khi tấn công 51% cũng không thể buộc mạng chấp nhận các khối xấu.
Một phương pháp khác để giải quyết vấn đề khó khăn là kiến trúc Plasma, nó sử dụng công nghệ thông minh để chuyển trách nhiệm theo dõi tính khả dụng dữ liệu cho người dùng một cách khéo léo. Trước đây, từ năm 2017-2019, khi mở rộng tính toán chỉ cần bằng chứng gian lận, tính năng bảo mật của Plasma rất hạn chế, nhưng sự phổ biến của SNARK đã làm cho kiến trúc Plasma phù hợp hơn với các trường hợp sử dụng rộng hơn trước đây.
Tiến triển tiếp theo của DAS
Chúng ta đang giải quyết vấn đề gì?
Kể từ ngày 13 tháng 3 năm 2024, khi bản nâng cấp Dencun đi vào hoạt động, blockchain ETHFANG sẽ có 3 "blob" khoảng 125 kB mỗi khoảng thời gian 12 giây, hoặc khoảng 375 kB băng thông dữ liệu trong khoảng thời gian 12 giây. Giả sử rằng dữ liệu giao dịch được đăng trực tiếp lên chuỗi, truyền ERC20 là khoảng 180 byte, do đó, TPS tối đa của các bản tổng hợp trên ô vuông ETH là:
375000 / 12 / 180 = 173.6 TPS
Nếu chúng tôi thêm calldata của Ethereum (giá trị tối đa lý thuyết: mỗi khe 30 triệu Gas / mỗi byte 16 Gas = mỗi khe 1.875.000 byte), điều này sẽ trở thành 607 TPS. Đối với PeerDAS, kế hoạch làm tăng mục tiêu đếm blob lên 8-16, điều này sẽ cung cấp cho chúng tôi 463-926 TPS của calldata.
Điều này đối với Ethereum L1 là một bước ngoặt lớn, nhưng chưa đủ. Chúng tôi muốn có thêm tính mở rộng. Mục tiêu trung hạn của chúng tôi là mỗi khe cắm 16 MB, nếu kết hợp với cải tiến nén dữ liệu, sẽ cung cấp khoảng 58.000 TPS.
PeerDAS là gì và nó hoạt động như thế nào?
PeerDAS là một cài đặt tương đối đơn giản của 'mẫu một chiều'. Mỗi khối trong ETH là đa thức bậc 4096 trên trường số nguyên tố 253 bit. Chúng tôi phát tán 'cổ phiếu' của đa thức, trong đó mỗi cổ phiếu chứa 16 đánh giá liên tiếp tại 16 tọa độ liên tiếp được lấy từ tổng cộng 8192 tập tọa độ. Bất kỳ 4096 đánh giá nào trong 8192 đánh giá (sử dụng các tham số được đề xuất hiện tại: 64 trong số 128 mẫu có thể khả thi) đều có thể khôi phục khối đó.
**Nguyên lý hoạt động của PeerDAS là để mỗi client lắng nghe một số lượng mạng con ít ỏi, trong đó mạng con thứ i phát sóng bất kỳ mẫu Blob thứ i nào và bổ sung bằng cách yêu cầu các Blob cần thiết trên các mạng con khác thông qua việc hỏi các đối tác trong mạng p2p toàn cầu (ai sẽ lắng nghe các mạng con khác nhau).**Phiên bản cẩn trọng hơn SubnetDAS chỉ sử dụng cơ chế mạng con mà không có yêu cầu bổ sung tầng đối tác.Đề xuất hiện tại là các Nút tham gia Bằng chứng về cổ phần sử dụng SubnetDAS, các Nút khác (tức là "client") sử dụng PeerDAS.
Lý thuyết, chúng ta có thể mở rộng lấy mẫu 1D khá xa: nếu chúng ta tăng giá trị tối đa của số lượng blob lên 256 (do đó, mục tiêu là 128), chúng ta sẽ đạt được mục tiêu 16 MB, trong khi việc lấy mẫu sẵn có chỉ cần mất 16 mẫu mỗi Nút * 128 blob * mỗi blob mỗi mẫu 512 byte = băng thông dữ liệu 1 MB mỗi khe. Điều này vừa nằm trong phạm vi dung sai của chúng tôi: nó khả thi, nhưng điều này có nghĩa là các máy khách bị hạn chế bởi băng thông không thể lấy mẫu. Chúng ta có thể tối ưu hóa điều này bằng cách giảm số lượng blob và tăng kích thước blob, nhưng điều này sẽ làm cho việc xây dựng lại trở nên đắt đỏ hơn.
Do đó, cuối cùng chúng tôi muốn tiến xa hơn bằng cách thực hiện lấy mẫu 2D, không chỉ thông qua việc lấy mẫu ngẫu nhiên trong blob mà còn lấy mẫu ngẫu nhiên giữa các blob. Tính chất tuyến tính mà KZG cam kết được sử dụng để "mở rộng" tập hợp blob trong Khối thông qua danh sách blob "ảo" mới được mã hóa dư thừa từ thông tin giống nhau.
Lấy mẫu 2D. Nguồn: a16z
Quan trọng nhất là, việc mở rộng cam kết tính toán không cần blob, do đó giải pháp này về cơ bản là thân thiện với việc xây dựng khối phân tán. Việc xây dựng thực tế của Nút khối chỉ cần có Cam kết Blob KZG và có thể phụ thuộc vào DAS để xác minh tính khả dụng của Blob. 1D DAS cũng thân thiện với việc xây dựng khối phân tán.
Có những mối liên hệ nào với nghiên cứu hiện có?
Bài viết gốc về tính khả dụng dữ liệu (2018):
Bài báo tiếp theo:
Bài giải thích của DAS, mẫu:
Cam kết sẵn có 2D của KZG:
PeerDAS trên ethresear.ch: và bài báo:
EIP-7594:
SubnetDAS trên ethresear.ch:
Các sắc thái của khả năng phục hồi trong lấy mẫu 2D:
Còn cần làm gì, cần cân nhắc điều gì?
Bước tiếp theo là hoàn thành và triển khai PeerDAS. Từ đó, việc tăng số lượng blob trên PeerDAS sẽ là một công việc tiến bộ, đồng thời quan sát mạng cẩn thận và cải tiến phần mềm để đảm bảo an toàn. Trong khi đó, chúng tôi hy vọng sẽ tiến hành nhiều nghiên cứu học thuật liên quan đến PeerDAS và các dạng DAS phiên bản khác cũng như vấn đề an ninh với quy tắc lựa chọn fork.
Trong tương lai, chúng ta cần phải làm nhiều việc hơn để tìm ra phiên bản lý tưởng của DAS 2D và chứng minh các tính năng bảo mật của nó. Chúng tôi cũng muốn cuối cùng chuyển từ KZG sang một giải pháp thay thế chống lượng tử, không tin cậy. **Tại thời điểm này, chúng tôi không biết bất kỳ ứng cử viên nào thân thiện với bản dựng khối phân tán. Ngay cả kỹ thuật "brute" đắt tiền của việc sử dụng STARK đệ quy để tạo ra bằng chứng hợp lệ của các hàng và cột được tái tạo là không đủ, bởi vì về mặt kỹ thuật kích thước băm của STARK là O (log (n) * log (log (n)) (với STIR), trong khi thực tế STARK gần như lớn bằng toàn bộ blob.
Trong tương lai xa, tôi nghĩ con đường thực tế là:
Chúng ta có thể đánh giá những điều này bằng cách cân nhắc phạm vi:
Vui lòng lưu ý rằng sự lựa chọn này vẫn tồn tại ngay cả khi chúng tôi quyết định mở rộng thực hiện trực tiếp trên L1. Điều này bởi vì nếu L1 phải xử lý một lượng lớn TPS, các khối L1 sẽ trở nên rất lớn và khách hàng sẽ cần một cách hiệu quả để xác minh chúng có đúng hay không, do đó chúng tôi phải sử dụng cùng một công nghệ hỗ trợ Rollup (ZK-EVM và DAS) và L1.
Nó tương tác như thế nào với các phần khác của lộ trình?
Nếu triển khai nén dữ liệu (xem bên dưới), nhu cầu của 2D DAS sẽ giảm đi một chút, hoặc ít nhất là sẽ Trễ, nếu Plasma được sử dụng rộng rãi, nhu cầu của 2D DAS sẽ giảm thêm. DAS cũng đối mặt với thách thức của việc xây dựng giao thức và cơ chế Khối phân tán: mặc dù trong lý thuyết, DAS thân thiện với việc tái cấu trúc phân tán, nhưng trong thực tế cần phối hợp với cơ chế lựa chọn fork bao gồm danh sách đề xuất và xung quanh nó.
Nén dữ liệu (Data compression)
Chúng ta đang giải quyết vấn đề gì?
Mỗi giao dịch trong Rollup đều sẽ chiếm một lượng không gian dữ liệu on-chain lớn: Việc chuyển đổi ERC20 cần khoảng 180 byte. Ngay cả khi sử dụng mẫu sẵn có lý tưởng cho sự có sẵn của dữ liệu, điều này cũng sẽ hạn chế tính mở rộng của giao thức lớp 2. Mỗi khe 16 MB, chúng ta có được: 01928374656574839201
16000000 / 12 / 180 = 7407 TPS
Nếu chúng ta không chỉ giải quyết vấn đề về tử số mà còn làm cho mỗi giao dịch trong Rollup chiếm ít byte hơn on-chain thì sao?
Nó là gì và làm việc như thế nào?
Tôi cho rằng giải thích tốt nhất là bức tranh hai năm trước đây:
Phương pháp nén đơn giản nhất là nén zero-byte: thay thế mỗi chuỗi zero-byte dài bằng hai byte biểu diễn số lượng zero-byte bằng cách sử dụng.
Có những mối liên hệ nào với nghiên cứu hiện có?
Khám phá từ sequence.xyz:
Đối với hợp đồng tối ưu hóa Calldata của L2, từ ScopeLift:
Một chiến lược khác - Rollup dựa trên bằng chứng hợp lệ (còn gọi là ZKRollup) phát hành sự khác biệt trạng thái thay vì giao dịch: Dấu chân dữ liệu trên l2.
BLS Ví tiền - 通过 ERC-4337 实现 BLS 聚合:
Còn cần làm gì, cần cân nhắc điều gì?
Công việc chính còn lại là đưa kế hoạch trên thành hiện thực. Sự cân nhắc chính là:
Nó tương tác như thế nào với các phần khác của lộ trình?
Việc áp dụng ERC-4337 và cuối cùng đưa một phần nội dung của nó vào L2 EVM có thể làm tăng tốc độ triển khai công nghệ gom nhóm. Việc đưa một phần nội dung của ERC-4337 vào L1 có thể làm tăng tốc độ triển khai trên L2.
Plasma rộng
Chúng ta đang giải quyết vấn đề gì?
Ngay cả khi sử dụng blob 16 MB và nén dữ liệu, 58,000 TPS cũng không đủ để hoàn toàn tiếp quản thanh toán của người tiêu dùng, mạng xã hội Phi tập trung hoặc các lĩnh vực có băng thông cao khác. Đặc biệt là khi chúng ta bắt đầu xem xét vấn đề riêng tư, điều này có thể làm giảm khả năng mở rộng từ 3-8 lần. Đối với các ứng dụng có dung lượng lớn và giá trị thấp, một lựa chọn hiện tại là validium, nó giữ dữ liệu ở trạng thái off-chain và có mô hình bảo mật thú vị, các nhà điều hành không thể ăn cắp tiền của người dùng, nhưng họ có thể biến mất và tạm thời hoặc vĩnh viễn đóng băng tất cả số tiền của người dùng. Nhưng chúng ta có thể làm tốt hơn được.
Nó là gì và làm việc như thế nào?
Plasma là một giải pháp mở rộng quy mô liên quan đến việc các toán tử xuất bản Khối off-chain và đặt các gốc Merkle của các Khối đó trên chuỗi (không giống như Rollups, rollups đặt toàn bộ Khối trên chuỗi). Đối với mỗi Khối, nhà điều hành gửi một nhánh Merkle cho mỗi người dùng, chứng minh điều gì đã xảy ra hoặc không xảy ra với tài sản của người dùng đó. Người dùng có thể rút tài sản bằng cách cung cấp chi nhánh Merkle. Điều quan trọng là chi nhánh không phải bắt nguồn từ trạng thái mới nhất - vì vậy ngay cả khi tính khả dụng của dữ liệu không thành công, người dùng vẫn có thể khôi phục tài sản của họ bằng cách rút lại trạng thái mới nhất có sẵn. Nếu người dùng gửi một fork không hợp lệ (ví dụ: thoát khỏi tài sản mà họ đã gửi cho người khác hoặc nhà điều hành tạo ra một tài sản từ không khí), cơ chế thách thức trên chuỗi có thể quy định tài sản đó thuộc về ai.
Plasma Cash chain diagram. The transaction spending coin i is put into the i-th position in the tree. In this example, assuming all previous trees are valid, we know that Eve currently owns hard coin 1, David owns hard coin 4, George owns hard coin 6.
Phiên bản sớm của Plasma chỉ xử lý các trường hợp thanh toán và không thể mở rộng một cách hiệu quả. Tuy nhiên, nếu chúng ta yêu cầu mỗi gốc được xác minh bằng SNARK, thì Plasma sẽ mạnh mẽ hơn. Mọi trò chơi thách thức đều có thể được đơn giản hóa đáng kể vì chúng ta loại bỏ hầu hết các con đường gian lận của người vận hành. Những con đường mới cũng được mở ra, cho phép công nghệ Plasma mở rộng đến nhiều loại tài sản hơn. Cuối cùng, trong trường hợp người vận hành không gian lận, người dùng có thể rút tiền ngay lập tức mà không cần phải chờ đợi một tuần thời hạn thách thức.
Một phương pháp để tạo ra một chuỗi EVM Plasma (không phải là phương pháp duy nhất): sử dụng ZK-SNARK để xây dựng cây UTXO song song, phản ánh sự thay đổi cân bằng được thực hiện bởi EVM và xác định điểm khác biệt duy nhất của lịch sử ánh xạ "cùng loại tiền". Sau đó, có thể xây dựng cấu trúc Plasma dựa trên điều này.
Một quan điểm quan trọng là hệ thống Plasma không cần hoàn hảo. Ngay cả khi bạn chỉ có thể bảo vệ một phần tài sản (ví dụ, chỉ là các Token không di chuyển trong tuần qua), bạn đã cải thiện đáng kể tình trạng hiện tại của EVM siêu mở rộng, điều này là một sự xác minh.
Một loại cấu trúc khác là cấu trúc Plasma/rollups hỗn hợp, ví dụ như Intmax. Những cấu trúc này đặt một lượng dữ liệu rất nhỏ của mỗi người dùng trên on-chain (ví dụ như 5 byte), qua đó có thể đạt được tính chất giữa Plasma và Rollup: trong trường hợp Intmax, bạn có thể đạt được khả năng mở rộng và riêng tư cực kỳ cao, thậm chí trong thế giới 16 MB, giới hạn về dung lượng lý thuyết cũng chỉ khoảng 16.000.000 / 12 / 5 = 266.667 TPS.
Có những mối liên hệ nào với nghiên cứu hiện có?
Giấy plasma gốc:
Plasma现金:
Luồng tiền mặt Plasma:
Intmax(2023):
Còn cần làm gì, cần cân nhắc điều gì?
Nhiệm vụ chính còn lại là đưa hệ thống Plasma vào sản xuất. Như đã đề cập ở trên, 'plasma và validium' không phải là một đối tác nhị phân: bất kỳ validium nào cũng có thể cải thiện ít nhất một chút hiệu suất an toàn bằng cách thêm tính năng Plasma vào cơ chế rút lui. Phần nghiên cứu là để đạt được các thuộc tính tốt nhất của EVM (trong yêu cầu đáng tin cậy, chi phí Gas L1 xấu nhất và sự dễ bị tấn công DoS) cũng như cấu trúc cụ thể cho ứng dụng thay thế. Ngoài ra, khái niệm Plasma phức tạp hơn so với rollups, cần được giải quyết trực tiếp thông qua nghiên cứu và xây dựng khung tổng quát tốt hơn.
Một nhược điểm chính của việc sử dụng thiết kế Plasma là chúng phụ thuộc nhiều hơn vào người điều hành và khó khăn hơn để "dựa vào", mặc dù thiết kế Plasma/rollup kết hợp thường có thể tránh điểm yếu này.
Nó tương tác như thế nào với các phần khác của lộ trình?
Khi giải pháp Plasma hoạt động hiệu quả hơn, áp lực đối với tính sẵn có của dữ liệu hiệu suất cao trên L1 cũng nhỏ hơn. Việc chuyển hoạt động sang L2 cũng giúp giảm áp lực MEV trên L1.
Hệ thống chứng minh L2 đã trưởng thành
Chúng ta đang giải quyết vấn đề gì?
Ngày nay, hầu hết các Bản tổng hợp chưa thực sự Chưa đáng tin cậy; Có một Hội đồng Bảo an có khả năng lật ngược (lạc quan hoặc hiệu quả) các hành động của hệ thống đã được chứng minh. Trong một số trường hợp, hệ thống chứng thực thậm chí không tồn tại, hoặc thậm chí nếu có, nó chỉ có chức năng "tư vấn". Tiên tiến nhất là (i) một số Bản tổng hợp dành riêng cho ứng dụng, chẳng hạn như Nhiên liệu, Không đáng tin cậy và (ii) tính đến thời điểm viết bài, Optimism và Arbitrum, hai Bản tổng hợp EVM hoàn chỉnh đã đạt được các mốc quan trọng một phần không đáng tin cậy được gọi là "Giai đoạn 1". Lý do Rollups không đi xa hơn là vì sợ lỗi trong mã. Chúng ta cần Rollup của Không đáng tin cậy, vì vậy chúng ta cần phải giải quyết vấn đề này.
Nó là gì và làm việc như thế nào?
Đầu tiên, hãy xem lại hệ thống 'stage' được giới thiệu ban đầu trong bài viết này. Có yêu cầu chi tiết hơn, nhưng tóm lại như sau:
Giai đoạn 0: Người dùng phải có khả năng chạy Nút và đồng bộ chuỗi. Nếu xác minh hoàn toàn đáng tin cậy / tập trung, nó ổn.
Mục tiêu của chúng tôi là đạt được giai đoạn thứ hai. Thách thức chính ở giai đoạn thứ hai là có đủ niềm tin, chứng minh rằng hệ thống thực sự đáng tin cậy. Có hai phương pháp chính có thể làm được điều này:
Sơ đồ thiết kế của nhiều chứng minh kết hợp một hệ thống chứng minh lạc quan, một hệ thống bằng chứng hợp lệ và một ủy ban an toàn.
Có những mối liên hệ nào với nghiên cứu hiện có?
EVM K Semantics (Công việc xác thực chính thức bắt đầu từ năm 2017):
Bài thuyết trình về ý tưởng của người chứng minh nhiều (2022):
Kế hoạch Taiko sử dụng chứng thực đa yếu tố:
Còn cần làm gì, cần cân nhắc điều gì?
Đối với việc xác minh hình thức, có rất nhiều cách. Chúng ta cần tạo phiên bản xác minh chính thức của người chứng minh SNARK toàn bộ của EVM. Đây là một dự án cực kỳ phức tạp, mặc dù chúng tôi đã bắt đầu. Có một mẹo có thể đơn giản hóa nhiệm vụ đáng kể: chúng ta có thể tạo người chứng minh SNARK chính thức cho máy ảo tối thiểu, ví dụ. RISC-V hoặc Cairo, sau đó viết triển khai của EVM trong máy ảo tối thiểu đó (và chứng minh chính thức tính tương đương của nó với một số quy cách EVM khác).
Đối với người chứng thực đa chữ ký, còn hai phần chính cần được xem xét. Thứ nhất, chúng ta cần có đủ niềm tin vào ít nhất hai hệ thống chứng thực khác nhau, mỗi hệ thống đều đảm bảo an toàn và nếu xảy ra sự cố, chúng sẽ gặp sự cố vì các nguyên nhân khác nhau và không liên quan (vì vậy chúng sẽ không cùng lúc gặp sự cố). Thứ hai, chúng ta cần có mức đảm bảo rất cao trong logic cơ bản của việc kết hợp các hệ thống chứng thực. Đây là một đoạn mã nhỏ. Có nhiều cách để làm cho nó rất nhỏ - chỉ cần lưu trữ tài sản trong hợp đồng đa chữ ký an toàn, người ký là hợp đồng đại diện cho hệ thống chứng thực cá nhân - nhưng điều này đòi hỏi phải trả một khoản phí gas trên-chain cao. Cần tìm một sự cân bằng giữa hiệu quả và an toàn.
Nó tương tác như thế nào với các phần khác của lộ trình?
Việc di chuyển hoạt động đến L2 có thể giảm áp lực MEV trên L1.
Cải tiến tương tác giữa các L2
Chúng ta đang giải quyết vấn đề gì?
Một thách thức lớn của hệ sinh thái L2 hiện nay là người dùng khó thao tác. Hơn nữa, cách đơn giản nhất thường đòi hỏi sự giả định về sự tin cậy: cầu nối tập trung, khách hàng RPC, v.v. Nếu chúng ta coi L2 là một phần của Ethereum, chúng ta cần làm cho hệ sinh thái L2 trở nên dễ sử dụng giống như hệ sinh thái thống nhất của Ethereum.
Một ví dụ cực kỳ tồi tệ (thậm chí nguy hiểm: tôi mất 100 đô la cá nhân vì lựa chọn chuỗi ở đây sai) qua trải nghiệm người dùng L2 - mặc dù điều này không phải là lỗi của Polymarket, nhưng tính tương tác qua L2 nên là trách nhiệm của cộng đồng Ethereum (ERC). Trong hệ sinh thái Ethereum hoạt động tốt, việc gửi Token từ L1 đến L2 hoặc từ L2 này sang L2 khác nên giống như việc gửi Token trong cùng một L1.
Nó là gì và làm việc như thế nào?
Cải thiện tương tác L2 có nhiều loại khác nhau. Nhìn chung, cách tiếp cận vấn đề này là nhận thấy lý thuyết, trung tâm của Ethereum sử dụng Rollup và việc thực hiện Phân mảnh trên L1 là tương tự nhau, sau đó hỏi xem phiên bản L2 của Ethereum hiện tại thực tế có khác biệt như thế nào so với lý tưởng. Dưới đây là một số điểm:
Làm thế nào để cập nhật Chủ đề ETH của khách hàng ánh sáng. Khi có Chủ đề, bạn có thể sử dụng chứng minh Merkle để xác minh bất kỳ đối tượng trạng thái nào. Khi bạn có đối tượng trạng thái L1 chính xác, bạn có thể sử dụng chứng minh Merkle (nếu bạn muốn kiểm tra trước xác nhận, bạn cũng có thể sử dụng chữ ký) để xác minh bất kỳ đối tượng trạng thái nào trên L2.Helios đã làm được điều đầu tiên. Mở rộng đến điều sau là một thách thức chuẩn hóa.
Ví tiền如何工作的程式化图表。
Có những mối liên hệ nào với nghiên cứu hiện có?
Địa chỉ đặc biệt của chuỗi: ERC-3770:
ERC-7683:
RIP-7755:
Thiết kế Ví tiền cho Thư viện Khóa cuộn
Helios:
ERC-3668(đôi khi được gọi là CCIP-read):
Đề xuất 'Xác nhận trước (Chia sẻ)' của Justin Drake:
L1SLOAD (RIP-7728):
Gọi từ xa trong tâm trạng lạc quan:
AggLayer, bao gồm cả ý tưởng cầu nối mã thông báo chia sẻ:
Còn cần làm gì, cần cân nhắc điều gì?
Nhiều ví dụ trên phải đối mặt với tình trạng tiến thoái lưỡng nan về tiêu chuẩn hóa khi nào và lớp nào cần tiêu chuẩn hóa. Nếu bạn chuẩn hóa quá sớm, bạn có nguy cơ gặp phải các giải pháp kém chất lượng. Nếu bạn chuẩn hóa quá muộn, bạn có nguy cơ bị phân mảnh không cần thiết. Trong một số trường hợp, có những giải pháp ngắn hạn ít hiệu quả hơn nhưng dễ thực hiện hơn và các giải pháp dài hạn "cuối cùng đúng" nhưng mất một lượng thời gian đáng kể để thực hiện.
Điều đặc biệt ở phần này là những nhiệm vụ không chỉ là vấn đề kỹ thuật: chúng cũng là (có lẽ chủ yếu là!) vấn đề xã hội. Chúng cần sự hợp tác giữa L2 và Ví tiền cũng như L1. Khả năng giải quyết vấn đề này thành công là bài kiểm tra về khả năng của chúng ta như một cộng đồng đoàn kết.
Nó tương tác như thế nào với các phần khác của lộ trình?
Hầu hết các đề xuất trong này đều là cấu trúc 'tầng cao' nên sẽ không ảnh hưởng nhiều đến việc xem xét L1. Một ngoại lệ là sắp xếp chia sẻ, nó ảnh hưởng lớn đến MEV.
Thực thi trên L1 mở rộng
Chúng ta đang giải quyết vấn đề gì?
Nếu L2 trở nên rất có thể mở rộng và thành công, nhưng L1 vẫn chỉ có thể xử lý rất ít giao dịch, thì Ethereum có thể đối mặt với nhiều rủi ro:
Vì những lý do này, việc mở rộng L1 và đảm bảo rằng nó có thể tiếp tục thích nghi với ngày càng nhiều ứng dụng là rất có giá trị.
Nó là gì và làm việc như thế nào?
Phương pháp mở rộng đơn giản nhất là tăng giới hạn gas. Tuy nhiên, điều này mang theo rủi ro tập trung của L1, làm suy yếu một thuộc tính quan trọng khác của ETH là tính tin cậy của nền tảng mạnh mẽ này. Câu hỏi về việc tăng giới hạn gas đơn giản đến mức nào là bền vững luôn gây tranh cãi, và điều này cũng sẽ thay đổi tùy thuộc vào việc triển khai các công nghệ khác nhau, để làm cho việc xác minh các khối lớn hơn trở nên dễ dàng hơn (ví dụ: lịch sử hết hạn, statelessness, bằng chứng hợp lệ L1 EVM). Một điều quan trọng khác cần phải được cải thiện liên tục là hiệu suất của phần mềm khách hàng ETH ngày nay được tối ưu hóa hơn so với năm năm trước. Chiến lược tăng giới hạn gas L1 hiệu quả sẽ liên quan đến việc tăng tốc các công nghệ xác minh này.
Một chiến lược mở rộng khác liên quan đến việc xác định các chức năng và loại tính toán cụ thể mà có thể trở nên rẻ hơn mà không làm tổn thương tính phân tán của mạng hoặc tính an toàn của nó. Các ví dụ trong lĩnh vực này bao gồm:
EOF - Định dạng mã byte EVM mới thân thiện hơn với phân tích tĩnh và cho phép triển khai nhanh hơn. Với những hiệu quả này, mã bytecode EOF có thể được cung cấp chi phí gas thấp hơn.
Những cải tiến này sẽ được thảo luận cụ thể hơn trong các bài viết sau về Splurge.
Cuối cùng, chiến lược thứ ba là Rollup nguyên sinh (hoặc "Rollup tích hợp sẵn"): Theo bản chất, tạo nhiều bản sao của EVM chạy song song, tạo ra một mô hình tương đương với mô hình mà Rollup có thể cung cấp, nhưng tích hợp một cách nguyên sinh hơn vào giao thức.
Có những mối liên hệ nào với nghiên cứu hiện có?
Lộ trình mở rộng L1 của Polynya ETH:
Định giá Gas đa chiều:
EIP-7706:
EOF:
EVM-MAX:
SIMD:
Rollup cấp cao:
Phỏng vấn Max Resnick về giá trị mở rộng L1:
Justin Drake về việc mở rộng bằng cách sử dụng SNARK và Rollup nguyên bản:
Còn cần làm gì, cần cân nhắc điều gì?
L1 mở rộng có ba chiến lược, có thể thực hiện độc lập hoặc song song:
Điều đáng hiểu là đây là những công nghệ khác nhau với những sự cân nhắc khác nhau. Ví dụ, Rollup gốc có nhiều điểm yếu tương tự như Rollup thông thường về khả năng tương tác: bạn không thể gửi một giao dịch duy nhất để thực hiện các hoạt động đồng bộ qua nhiều giao dịch như bạn có thể xử lý hợp đồng trên cùng một L1 (hoặc L2). Tăng giới hạn Gas sẽ tước đi những lợi ích khác có thể đạt được bằng cách làm cho L1 dễ dàng xác minh, chẳng hạn như tăng tỷ lệ người dùng kiểm tra Nút và tăng số người thế chấp độc lập. Làm cho các hoạt động cụ thể trong EVM rẻ hơn (phụ thuộc vào cách thức thực hiện) có thể làm tăng độ phức tạp tổng thể của EVM.
Một trong những vấn đề lớn mà bất kỳ lộ trình mở rộng L1 nào cũng cần trả lời là: Tầm nhìn cuối cùng của L1 và L2 là gì? Rõ ràng, việc thực hiện tất cả mọi thứ trên L1 là vô lí: Có hàng trăm nghìn giao dịch mỗi giây có thể xảy ra, điều này sẽ khiến cho L1 không thể xác minh hoàn toàn (trừ khi chúng ta áp dụng lộ trình Rollup nguyên sinh). Nhưng chúng ta thực sự cần một số nguyên tắc chỉ đạo để đảm bảo rằng chúng ta không gây ra tình huống như thế này: Chúng ta tăng giới hạn Gas lên 10 lần, gây thiệt hại nghiêm trọng cho tính tập trung của ETH và phát hiện ra rằng chúng ta chỉ đang bước vào một thế giới, trong đó không gần như 99% hoạt động đều diễn ra trên L2, 90% hoạt động đều diễn ra trên L2, do đó kết quả trông gần như giống nhau, ngoại trừ sự mất mát không thể đảo ngược của đặc tính đặc biệt của ETH L1.
Một quan điểm đề xuất về "phân công" giữa L1 và L2
Nó tương tác như thế nào với các phần khác của lộ trình?
Thu hút nhiều người dùng hơn vào L1 có nghĩa là cải thiện không chỉ quy mô, mà cả các khía cạnh khác của L1. Điều này có nghĩa là nhiều MEV sẽ vẫn còn trên L1 (thay vì chỉ trở thành một vấn đề đối với L2), vì vậy có một nhu cầu cấp thiết để giải quyết nó một cách rõ ràng. Nó làm tăng đáng kể giá trị của thời gian khe cắm nhanh trên L1. Nó cũng phụ thuộc rất nhiều vào việc xác nhận trơn tru của L1 ("The Verge").
Đặc biệt cảm ơn Justin Drake, Francesco, Hsiao-wei Wang, @antonttc và Georgios Konstantopoulos