何以说IPFS网络将优化全球数据存储?

2020-06-09 17:25:11

和传统HTTP的域名寻址不同,IPFS采用内容可寻址, 旨在创建持久且分布式存储和共享文件的网络传输协议。

  IPFS是一个伟大的技术集合,它集合了多种技术的优点,把这些技术整合创新,形成了一个IPFS网络,一个去中心化的分布式文件版本系统。通俗一点理解IPFS,当用户有文件需要让别人帮忙存储的时候,他把文件提交到IPFS系统,系统首先把文件打散成每一份不大于256kb的碎块,比如一首普通音质三分钟的歌曲大约有3M的数据,3M就是3072kb,会被打散成12个以上的碎块,这些碎块再分配给那些专门提供存储空间的存储节点,由他们来存储数据。


  和传统HTTP的域名寻址不同,IPFS采用内容可寻址, 旨在创建持久且分布式存储和共享文件的网络传输协议。


HTTP


  HTTP协议下存储方式:

  1、直连式存储:

  简称DAS(Decimal Adjust for Subtraction),即开放系统的直连式存储,主要依赖服务器主机操作系统进行数据的IO读写和存储维护管理,数据备份和恢复要求占用服务器主机资源(包括CPU、系统IO等),数据流需要回流主机再到服务器连接着的磁带机(库),数据备份通常占用服务器主机资源20-30%。

  2、网络连接存储:

  简称NAS(Network Attached Storage)按字面简单说就是连接在网络上,具备资料存储功能的装置,因此也称为“网络存储器”。它是一种专用数据存储服务器。它以数据为中心,将存储设备与服务器彻底分离,集中管理数据,从而释放带宽、提高性能、降低总拥有成本、保护投资。其成本远远低于使用服务器存储,而效率却远远高于后者。目前国际著名的NAS企业有Netapp、EMC、OUO等。

  3、存储区域网络:

  简称SAN(Storage Area Network and SAN Protocols),是一种高速网络或子网络,提供在计算机与存储系统之间的数据传输。存储设备是指一台或多台用以存储计算机数据的磁盘设备,通常指磁盘阵列。存储区域网络能够使用多种技术,这就使得系统间的数据备份、操作、文件转移和数据复制很容易实现重定向。


360截图20200609172912524.png


  IPFS存储方式:

  分布式哈希表简称DHT(Distributed Hash Table)是一种分布式存储方法,它的原理就是不需要服务器的情况下,每个客户端存储一小部分数据,并负责一定区域的检索,进而实现整个DHT网络的寻址和检索。IPFS还借鉴了一种Kademlia技术,在此网络中,所有信息均以哈希表条目的形式加以存储,这些信息被分散地存储在各个节点上,从而构建一张巨大的分布式哈希表,正式这一特性确保了IPFS成为了没有中心调度节点的分布式系统。

  万变不离其宗,不管HTTP用什么方式存储,它的存储本质没变。简单的说就是,HTTP协议下,它的存储方式就是把完整的数据存到服务器,用户需下载时,再从服务器传送给用户。如果客户重复上传一样的数据a,服务器也就会按名字a、a1、a2、……这样一直存储下去,没有一种技术把重复的数据删除这功能。

  而IPFS采用为数据块内容建立哈希去重的方式存储数据,也就是会把冗余的数据清除,保证在网络存储中,该文件总的份数是固定的。举个简单的例子,客户上一文件b,IPFS网络会用过Git先把该文件b打碎成若干个256kb的小文件c、c-1、c-2、……并计算各个部分的哈希值,利用这些构建起与文件对应的有向无环图(DAG),DAG的根节点也就是b文件的哈希值;如果说客户一直上传文件b,那IPFS网络系统,会利用DHT哈希去重,保证文件b在IPFS网络中的DAG只有固定的5份,这样不仅可以确保文件不容易丢失,还能有效的优化IPFS网络的存储空间。


最新推荐