为什么说IPFS可以优化数据存储?

2020-06-18 17:04:46

IPFS的出现,确实颠覆了以往HTTP存在的诸多问题,它到的优势是:自动备份、永不丢失、安全加密、无限空间、高速连接等

  IPFS的出现,就是为了优化甚至取代HTTP协议,而一个运行了数十年的互联网协议,凭什么就能被IPFS取代呢?

  IPFS的出现,确实颠覆了以往HTTP存在的诸多问题,它到的优势是:自动备份、永不丢失、安全加密、无限空间、高速连接等。更甚至,很多人说IPFS的出现,可以优化世界数据存储,这个说法又是从何而来呢?下面我们先来比较一下HTTP和IPFS两种不同协议下的存储方式:


http


  HTTP协议下存储方式

  1、直连式存储:

  简称DAS(Decimal Adjust for Subtraction),即开放系统的直连式存储,主要依赖服务器主机操作系统进行数据的IO读写和存储维护管理,数据备份和恢复要求占用服务器主机资源(包括CPU、系统IO等),数据流需要回流主机再到服务器连接着的磁带机(库),数据备份通常占用服务器主机资源20-30%。

  2、网络连接存储:

  简称NAS(Network Attached Storage)按字面简单说就是连接在网络上,具备资料存储功能的装置,因此也称为“网络存储器”。它是一种专用数据存储服务器。它以数据为中心,将存储设备与服务器彻底分离,集中管理数据,从而释放带宽、提高性能、降低总拥有成本、保护投资。其成本远远低于使用服务器存储,而效率却远远高于后者。目前国际著名的NAS企业有Netapp、EMC、OUO等。

  3、存储区域网络:

  简称SAN(Storage Area Network and SAN Protocols),是一种高速网络或子网络,提供在计算机与存储系统之间的数据传输。存储设备是指一台或多台用以存储计算机数据的磁盘设备,通常指磁盘阵列。存储区域网络能够使用多种技术,这就使得系统间的数据备份、操作、文件转移和数据复制很容易实现重定向。


IPFS

 

 IPFS存储方式

  分布式哈希表简称DHT(Distributed Hash Table)是一种分布式存储方法,它的原理就是不需要服务器的情况下,每个客户端存储一小部分数据,并负责一定区域的检索,进而实现整个DHT网络的寻址和检索。IPFS还借鉴了一种Kademlia技术,在此网络中,所有信息均以哈希表条目的形式加以存储,这些信息被分散地存储在各个节点上,从而构建一张巨大的分布式哈希表,正式这一特性确保了IPFS成为了没有中心调度节点的分布式系统。

  万变不离其宗,不管HTTP用什么方式存储,它的存储本质没变。简单的说就是,HTTP协议下,它的存储方式就是把完整的数据存到服务器,用户需下载时,再从服务器传送给用户。如果客户重复上传一样的数据a,服务器也就会按名字a、a1、a2、……这样一直存储下去,没有一种技术把重复的数据删除这功能。

  而IPFS采用为数据块内容建立哈希去重的方式存储数据,也就是会把冗余的数据清除,保证在网络存储中,该文件总的份数是固定的。举个简单的例子,客户上传一文件b,IPFS网络会用过Git先把该文件b打碎成若干个256kb的小文件c、c-1、c-2、……并计算各个部分的哈希值,利用这些构建起与文件对应的有向无环图(DAG),DAG的根节点也就是b文件的哈希值;如果说客户一直上传文件b,那IPFS网络系统,会利用DHT哈希去重,保证文件b在IPFS网络中的DAG只有固定的5份,这样不仅可以确保文件不容易丢失,还能有效的优化IPFS网络的存储空间。


最新推荐