深度讲解Web3.0当下最大难题之去中心化存储

Web3与Web2的最大区别就是数据所有权的归属问题,如果做不到存储去中心化,那么,用户要夺回数据主权将只能是天方夜谭。
2022-06-02 纳斯赛博伯

虽然大家对于Web3的期待与呼声日益高涨,但不得不说它依旧属于未来事物,作者之所以这么认为,主要在于当下还有诸多问题亟需解决,其中去中心化存储乃关键之关键,毕竟,Web3与Web2的最大区别就是数据所有权的归属问题,如果做不到存储去中心化,那么,用户要夺回数据主权将只能是天方夜谭。



大家好,我是纳斯赛博伯,一个对未来互联网有着独立思考的内容创作者,关于Web3的内容,我们已经陆续讲了几期,感兴趣的朋友可以进行往期内容查看,这些内容都将有助于你更全面地了解Web3。本期内容我们将着重讲讲去中心化存储之于Web3的重要性以及问题所在,并一起探讨去中心化存储的未来模样。


去中心化存储之于Web3非常重要,甚至可以说是定义Web3的关键,因为它关乎数据产权这条底线,以至于被定义为数字化世界的土地!在Web3时代,数据由用户创造也必须属于用户,如果它依旧被中心化平台所拥有,那么它自然不配称之为Web3。然而,不得不说,虽然市面上已出现诸多的去中心化存储项目,但依旧问题重重,要么门槛太高、要么无法落地。


在“普通人如何入局Web3”的内容中,我们已经对IPFS/Filecoin、Arweave进行了分析,这里就不再赘述,下面我们着重看看另外几个项目:Sia和Swarm。


Sia的存储思路是利用全世界那些未被充分使用的闲置硬盘来构建一个大型存储生态,其整体理念与Storj非常相似,主要区别在于Storj没有自己的公链,而是在以太坊上发行Storj通证。Sia通过自己加密通证即Siacoin来完成数据存储双方的交易过程,并且对数据进行分段式存储分布发散在所有节点之中。其最大的好处是可以确保没有一台主机出现单点故障,并加强了整个网络的正常运行时间和冗余,也同时可以保证用户数据的可靠性。但Sia的共识机制不是基于存储共识,而是基于Pow算力共识的,这就构成了机制上的重大缺陷,而且没有图灵完备的智能合约,只是一个早期不完备的存储公链,目前影响力已经越来越小。



与此同时,Sia使用Twofish算法对网络中所有数据进行加密,以保障数据的存储;同时也满足小存储采购商的需求,让存储渗透到了下沉市场,满足更多小而多的存储采购商的需求。租户需要留出固定数量的Siacoin用于存储和传输数据,合同持续90天,当合同在一定期限内到期时,Sia会自动更新合同,如果合同没有续约,Sia会在合同结束时将未使用的Siacoin返还给承租人。但值得注意的是,Sia的主机租赁者并不能采用即用即付方式,必须预付文件合同中的存储费用,虽然表面上看可以降低用户的存储成本,但其本身的PoW共识机制会导致严重的算力浪费和耗电问题,也难以公平的反映用户的存储和带宽的资源供给能力。另外,Sia虽然解决了用户需要一直在线和去中心化验证的问题,但缺陷依旧非常明显,从而无法大规模应用:比如矿工仍然可以模拟多个文件副本,向网络提交证明,达到女巫攻击的效果;为了防止文件丢失,用户仍然需要保存一份备份数据;基于Pow共识算法的区块链交易效率极低,无法实现高频率实时结算。


Swarm通过点对点的网络节点组成整个系统,也一度被认为基于以太坊智能合约而量身定制的存储协议,其最大的特点是通过内在的激励系统Bzz以实行经济上的自我维持,这一点又与IPFS/Filecoin非常类似。Swarm通过内置隐私保护、通信和冗余功能,以确保数据的可用性和在单个节点一经要求,任何数据,任何设备在离线时仍能持续传输数据,一定程度上增强的了数据的安全性和隐私保护。其内置的激励机制Bzz可以很好地帮助前期生态的建立,但从现今回头来看,其更多的是为了激励而激励,从这个角度来讲它已经将普通用户排除在外了,因为Swarm虽说是一个去中心化存储网络,但更多的还是一个内容分发系统,对于带宽以及CPU的要求非常之高,也就是说要进入这个网络就需要更高的成本:一台配置奢华的设备——矿机,这种情况之下,在这个网络中最为活跃的则是矿场,跟普通大众已然无关。虽然名义上是去中心化,但更多的节点掌握在大型矿场手上,就好比现在的互联网上的各大巨头一样,一旦矿场被破坏其后果是非常严重的,从终端角度来看,在Swarm中除了上传操作不是发生在特定服务器上外,Swarm与现有互联网服务并没有多少不同。



由此看来,IPFS/Filecoin、Arweave、Sia、Swarm等虽都是当下最火热的去中心化存储项目,但更多的还是虚有其表,无法真正成为Web3的基建设施!


基于去中心化存储问题的无法解决,那么在其基础之上构建的应用更不能称作为Web3。


举个例子,比如大家熟知的Mirror,确实是将Web3的理念运用的淋漓尽致,从各方面去看它貌似是一个完整的Web3产品,然而它并不是!其关键点在于它的存储以及它的服务,首先它的存储明面上看是显示存储在Arweave上的——这是一个标榜可以将数据永久存储的平台,通过Mirror发布的文章存储在Arweave上的数据基本上文本字符之类,所占的存储空间非常之小。



为进一步验证它的可用性,作者专门用钱包登录了Arweave,并试图利用Ar Drive专门进行了数据存储,试了很多遍发现界面一直处于“转圈”状态,压根存储不了!


另外是它的服务,虽然Mirror的存储是通过Arweave去实现,但其本身依旧是一个中心化平台,与现有的Web2.0平台没有任何区别。为什么这么说呢?Web3强调的是可靠性,也就是服务的持久性,不会因为平台停服而导致数据丢失或者服务中断,Mirror作为一个内容创建及发布平台其本身还是一个http的url链接,随时都有可能服务器宕机或停止运营的情况出现。 因为Mirror的网站平台依然是中心化的Web2服务,如果服务器宕机或停止运营,那么你依然无法使用该服务,同时Mirror 虽然不能删除你的账号和数据,但是依然可以任意控制你内容的展示,下架你的内容,这些依然都是Mirror 平台方说了算,换句话说,你的数据依然不属于你。


除了Mirror,类似的平台还有Opensea、Notion等,虽然在理念上比较起现有的Web2.0产品已经先进许多,但可惜还算不上真正的Web3产品,毕竟不彻底的去中心化其本质还是中心化!


由于去中心化存储的并不可靠,NFT其实也名存实亡!


也许有人会插上一句,不是可以存区块链比如以太坊之上吗?好吧,如果真有人问这种问题,只能说门外汉!


目前NFT存储的最简单模式是将NFT作为记录(具有哈希值的文件)存储在以太坊上,而它指向的相关内容(文本、照片或视频等)则存储在网络中的其他地方。原因在于存储在区块链上的不仅效率低下而且费用极其昂贵,据统计,在以太坊上存储500KB数据需要20000美元,这导致在区块链上存储数据非常不切实际,更何况这些精致高清的NFT艺术品就更是难上加难。


或许你会说你非常富有,并乐意花巨资将NFT存储在以太坊上,那也不行,因为ERC-721标准压根就不支持非结构性数据的存储!所以,当你在一些NFT平台铸造或购买的NFT消失之时,你其实不必大惊小怪,它本质还是类似Web2的一个中心化托管平台,而非真正的Web3产品!


这一点,我们也可以在NFT最常用的标准ERC-721中找到答案:


“A mechanism is provided to associate NFTs with URIs. We expect that many implementations will take advantage of this to provide metadata for each NFT. The image size recommendation is taken from Instagram, they probably know much about image usability. The URI MAY be mutable (i.e. it changes from time to time). We considered an NFT representing ownership of a house, in this case metadata about the house (image, occupants, etc.) can naturally change.”


你会发现,该标准并不打算将图像元数据作为拥有NFT的关键点!毕竟,它是元数据,这意味着它旨在描述其他数据,另外,它还是一个“可变”链接,这意味着它可以改变。2021 年 10 月,一位名叫 Moxie Marlinspike 的计算机安全研究员玩弄了 NFT 的这一特性,他创建了一个 NFT,当不同的平台进行查看时,它的内容也会发生变化。



不仅如此,NFT平台还可能删除你的内容,并让它在你的钱包中永久消失!


简而言之,这些标榜去中心化的NFT平台并不彻底,而不彻底的去中心化本质还是中心化!在当下,你所购买的NFT其实仅仅是一个网络链接,事实上你并未拥有它的所有权和控制权,当平台倒闭或停服,你的NFT也将不复存在!



那么Web3真正的去中心化存储应该是怎样的呢?


我认为应该基于两个理念:


一个是并非所有数据都需要上链,简而言之就是我的数据只需基本的可靠就行,而并不需要成千上万的副本来支撑,当然我们也可以根据数据的重要程度来确定副本的多少,在传统区块链中,所有节点都拥有区块链数据的全副本,以至于网络拥堵不堪以及存储成本非常之高。


另一个是平凡的交付,也就是说普通数据的提取可以只在交易的双方之间发生,只需要通过智能合约设定交易双方的权利与义务即可,至于重要的数据或者有争议的数据便可以上链,防止作恶的发生。


基于这两个理念,Web3时代的去中心化存储将会是私有云,在这个可预见的未来,每一个用户都将拥有一台专属于自己的数据保险箱(OOD,全称Owner Online Device),用于存放属于自己的数据,并运行自己使用的应用服务,不仅可以用于你个人数据的存储或网络中的备份,也可以用来运行自己所使用的DecAPP。如同移动互联网时代的智能手机一样,这个设备会是Web3时代标准性的新智能设备,它可以由PC、NAS升级而来,也可以由专门厂商进行生产。这些OOD由每个用户自己保管,每一份存储空间都掌握在用户手中,所有OOD作为节点以Zone的形式组成OOD互通层,不同的Zone之间是平等的,去中心的,它与侧链层、元链层共同组成整个一个全新的网络。



在这个网络中,互联网本身就是最大的云,属于所有人,并服务于所有人!


这将从根本上解决传统区块链无法存储结构性数据的难题,可以想象的是,每一个OOD都是独立的中心,用户的数据存在自己OOD 上,对自己的数据具有完整控制权。用户只要有闲置空间都可以在数据撮合市场进行挂单交易,普通数据只发生在独立的OOD之间,只有重要数据才需要在链上进行,其本质与传统区块链很相似但又有所区别。这个可以通过存储双方以及数据撮合市场进行合理的角色设计,从而打造出一个类似现有互联网时代的社区自治系统,但不同的是,各角色之间的交互都是通过智能合约来完成,同时需要加入信用评分体系,以更好地约束交易双方的合规守矩,也方便为交易双方匹配更合适的服务者,这将最大程度地避免资源浪费,让存储发挥其最原始的功能,将资源使用在存储有效数据之上,而非无实际意义的算力竞争。


可以畅想的是,在真正的Web3时代,每个人都可以携带自己的OOD进入这个网络之中,每一份数据都掌握在自己手上,每一份数据都将实现它应有的价值!


至于Web3何时能到来,只能说革命尚未成功,同志仍需努力,但可以确信的是,这场革命正在如火如荼地展开了!!


虽然前面内容中对一些去中心化存储项目进行了点评,但只是我个人的客观评价,若有不足之处,欢迎补充!作者坚信去中心化存储是一个全新的赛道,更是一项伟大的工程,无论最终谁能在这个赛道获得成功,对于全人类来说都是一件极为利好的事情。


好了,本期内容就到这里,我是纳斯赛博伯,一个对未来互联网有着独立思考的创作者,如果大家对内容还算满意,希望可以多多关注与转发。如果大家对未来互联网有更多想了解,想讨论的内容,欢迎私信留言,我们一起学习一起进步,万分感谢,我们下期再见。