从“绳上”到“链上”  信息存储的前世今生

存储技术目前还是处于便利与安全的博弈状态,但能感觉到,一场关于存储方式改变的革命即将到来!
2021-10-26 纳斯赛博伯

“小伙子,我想存钱。”

“没问题,爷爷。您打算存多长时间呢?”

“存、存个死期。”

这是网上曾经流传过的一个段子,说出来的时候是当作银行员工工作中的一个笑话,但其实它反映出了人们在日常生活中对重要的物品、 信息进行存储的需求和习惯。银行工作人员自然没有办法让这笔钱获得“死期”,但他们会把存款的期限、金额、利率、支取方式等相关信息记录在一张存折,或者一张卡上,再转交给这位爷爷。这也就完成了一次存储的操作,包含了存储对象的确定、存储要素的记载以及存储介质的传递。

在遥远的古代,虽然没有这么先进的存储手段,但是咱们的老祖先们展现出了惊人的生活智慧,万物皆可用于存储——竹子不只是国宝的宝贵食物,或是君子隐居山间的自然屏风,竹片上刻下的锯齿存储了大量的有效信息;五彩斑斓、大小不一的贝壳也不再只是少女们用作装饰的美丽项链,而是成为了部落间记录约定的天然工具;古代印加人更是琢磨出了“结绳记事”的方式,从此不再有“解不开的结”,只有“不能解的结”,一条绳上全是“宝贝疙瘩”。后来,生产技术不断发展更新,一方面创造出了更多用于存储信息的介质,比如丝帛、纸张等,在轻便性、存储质量上均有可显著提升; 另一方面,各地语言习惯、文字规则趋于统一,人们记录信息更加规范,存储内容的转播也更加容易。



随着社会的不断发展进步,信息存储的量级不断扩大,原始的存储模式已经不能满足人们庞杂的存储需求,磁盘系统的出现将存储带入了新的纪元。1932年在奥地利出现了早期计算机的磁鼓存储器,这个大东西看上去很像现在打印机里使用的硒鼓,包括了旋转圆通包围铁磁介质条和一排固定的读写磁头,可以存储8.5KB的数据。在一张手机照片就高达几MB的今天,8.5KB的容量听上去好像是存了,但又好像什么都没存,不过在80年前,这绝对是技术的天花板了,相比现今高达十几T的硬盘,简直是天壤之别!



不过,你有没有想过一个问题:电脑里的存储盘符为什么是从C盘开始的?(如果你是苹果用户或者其他非windows系统,就别找C盘了)A盘和B盘去哪儿了呢?要回答这个问题,就得回溯到最早的量产电脑。那时候的电脑是没有硬盘的,需要处理的内容会存储在软盘上,拿着软盘插到电脑,所有数据就会随之转化过去,这就是消失了的A盘和B盘。听起来很方便是不是?可是软盘之所以叫软盘,就是因为它真的极软,一个不小心就会损坏磁道,导致数据丢失。所以后来,先是发明了被塑料壳全方位包裹的3.5寸盘来解决存储介质易损的问题,又在此基础上发明了硬盘进一步提升存储能力,电脑上也多了一个盘符“C盘”来读取和存储数据。

在C盘之后很快又出现了“D盘“,对应的是光盘的广泛应用。一张光盘从最初的CD到后来的DVCD,存储量实现了从几百M到几个G的飞跃,在光盘上刻录流行歌曲或是电影也成为了一代人的青春记忆,下课的时候大家纷纷交换着贴着“香港枪战”、“串烧歌曲集锦”各种小标签的光盘。然而交换的次数多了,光盘表面划伤、破损的问题又出现了,给你的时候发哥还在帅气地枪战呢,还回来的时候再播子弹就卡在枪杆儿里了,刚建立起来的革命友谊瞬间消磨殆尽。

车到山前必有路,办法总比问题多,U盘应运而生。手指大的一块铁,具备读写高效、不易损坏、便于传递的多重优点。值得一提的是U盘刚问世的时候,还只能是“有钱人”的工具,动辄一、两百的价格对于老百姓来说并不友好。好在科技的发展始终以用户的需求为导向,市场也在不断适应生产力的进步,很快U盘、移动硬盘等闪存类工具就覆盖了消费者的工作和生活。

在解决了存储容量和介质的物理稳定性过后,人们的需求重心开始向追求更“自由自在”的存储体验转移,各类网络云盘、云服务器正在不断突破物理条件的桎梏,摆脱存储过程中对于介质的依赖---云存储的方式突破性地扩展了存储容量,人们不再需要纠结于硬盘的大小,而是拥有了极大的网络存储空间;与此同时也实现了存储信息的随时、随地读取和随心传送。



云存储虽好,但中心化带来的弊端也不容小觑,突出表现在不可靠、价格歧视、使用方式不自由、数据分散等方面,其中“不可靠”是中心化存储最大的痛:平台宕机、数据被监视、隐私被泄露等问题,严重影响着人们的日常工作和生活,它们不再是微博热搜榜上的一条八卦新闻,而是对众多企业、家庭、个人造成严重影响的安全事故!

关于“艳照门”我们或许只记得陈老师,殊不知还有一个高手那就是iCloud。2014年,众多女明星如珍妮佛·劳伦斯、维多利亚·嘉斯蒂、埃米莉·布朗宁等人不雅照片大规模流出,其原因就是iCloud存在安全漏洞导致黑客入侵,致使照片泄露,造成非常恶劣的影响;2018年,同类型事件再次在iCloud上演,主人公则是《银河护卫队》女演员米凯拉·胡佛,被盗取的照片不少于40000张,其中119个不雅照片被发布在国外某成人网站上。

如果说iCloud是遭受黑客攻击导致数据泄露,门槛相对较高,那么百度云则是零门槛了,而且直到今天还依旧存在,搜索引擎输入“网盘搜索”,随便点进去一个进行关键词搜索,就可以看到大量用户的个人信息,其中不乏身份信息、私人照片等。也许这些用户到现在都不知道自己的这些信息被泄露了,即便设置的公开分享,相信他们只是为了在传输时让对方更方便地提取,而绝不希望在整个网络被公布!



痛、痛、痛!

在用户对数据日益重视的今天,信息安全、隐私保护尤其关键,但却是中心化存储无法解决的痛,究其原因主要在于“中心”二字:软件方面,这些云平台都依托在http之下,作为一种超文本协议,其最大特点就是中心化,容易遭受攻击;硬件层面,这些云服务器都都依附于某个公司,地址相对集中,中心化管理,一旦某区域断电或遭受自然灾害,都是相当之脆弱,容易造成大面积数据丢失!即便某些云平台希望通过分布式存储去解决物理存储的介质问题,但依旧治标不治本,无法从真正意义上去解决中心化存储“不可靠”的病症,因为这些数据产权依旧被掌握在某个中心平台。举个例子,比如阿里云,虽然其可以使用不同设备去存储数据,甚至将存储服务器设置在不同城市、不同地域,但仍然有一个中心节点,那就是阿里云自己,用户付费的对象也必然是阿里云,一旦中心节点出现问题,数据丢失就在所难免。

正因为如此,去中心化存储应运而生,顾名思义,其是与当下中心化存储完全不相同的一种模式,其与中心化存储最大的区别在于是否有中心节点,数据产权掌握在谁手上,而这亦是实现可靠存储的基石。

那么去中心化存储是如何实现可靠存储的呢?

通过区块链技术将数据分布在全网多个节点,存储方与出租方基于智能合约来达成存储交易,并定期证明自己是否有继续提供存储服务的能力,直到合约到期。其最大的特点就是去中心,每一个用户都是一个网络中的独立节点。用户可以将自己未使用的硬盘空间进行出租,从而获得一定的金额作为报酬,也可以租赁其他用户的硬盘存储空间来使用。对于那些使用存储服务的人来说,安全是首要的,所以存储在去中心化网络上面的数据将被切割成小块,经过加密后,分散存储在众多节点上。


目前国内在理论和实际应用方面做得最好的还是CYFS,那句“重塑数字世界的生产关系”的口号不仅霸气十足,有着一股逆天改命的志气,而且也反映了当下数据产权不属于用户自己的黑暗现实!在这里,每一个用户都是自己数据的主人:

首先,它在底层协议上对http进行了升级,在这里诞生的每一个应用产品都是去中心的,用户的每一份数据都存储在自己的数据保险箱(OOD)当中,不仅可以通过密码学技术进行加密,还可以多地备份在全网的OOD节点中,比如北京、纽约、东京等等,并且只有持有私钥的人才能拿到数据,这不仅解决了数据存储的物理安全风险,也不会像中心化平台那样容易遭受攻击;

其次,用户可以选择对关键数据/元数据,如身份信息、账户信息、智能合约信息等进行上链,由全网所有节点进行维护,其他数据则可选择性地存储在性价比更高的存储设备中,从而有效控制成本;



最主要的是,每一个用户都能参与进来,通过DIY OOD、NAS OOD免费将你的电脑、NAS等设备打造成个人云,配合CYFS研发的应用产品CYFS Drive和享存DSG轻松实现数据的同步、空间的出租或租赁,从而有效配置全网闲置资源,减少资源浪费,提高存储资源的合理再利用。

综上,去中心化存储的优点显而易见,突出体现在安全性更好,隐私性更强,成本更低,由于它的存储类型是网状结构而不是像中心化存储那样只有中心节点,所以速度也会更快。

当然,难点也非常多,毕竟它属于一次技术变革,最大的困难就是市场冷启动。中心化云存储因为是单个公司在运营存储空间,可以灵活地根据实际存储空间的使用量来选择增加或减少服务器。而对于去中心化存储来说,因为没有中心化公司来运营,存储空间的运转主要是靠经济激励来驱动存储供应商来提供服务,这里就会出现共享经济中供给和需求的平衡问题,前期非常困难。也就是说,早期可能因为没有人使用,从而导致用户因无法获得足够稳定的收益而不愿意提供服务。但是CYFS提出了数据产权的概念,在OOD里存的每一份数据都属于用户自己,而不是像百度云或其他云服务那样,用户的数据被平台所监视,被肆意删除,数据产权压根不属于用户自己,所以CYFS较其他去中心化存储还有着不可替代的先进性。换句话讲,用户将数据存储在这里一方面是为了获得数据安全,但更多的是为了数据的确权,让自己数据或存储空间能够变现!这就解决了去中心化存储市场冷启动难的问题,只要用户对数据安全有着足够的重视,那么这个需求就是极其硬核的。



当然,“去中心化存储”看似简单,实则还有很长的路要走,更是几代人努力的结果,用户对数据安全的重视程度,基建设施的安全稳定,国家政策的支持力度等都非常关键。便利与安全的博弈还在僵持,数据的形态还会发生更多的变化,对于存储的要求还会新增更具体、更专业的需求。

不管怎样,从人类一诞生就产生的存储技术,发展到如今,已经几千年,每一次迭代,不仅代表着人类的发展进程,也是科学技术进步的表现,更反映着人类对于社会政治形态的追求和思考!

放眼未来,去中心化存储任重道远。