DT(Data Technology)时代,随着企业的发展,不断产生的非结构化数据规模越来越庞大。企业降低成本和提升效率需求的攀升,促使其不断寻找新的解决方案,创造新的价值,应对新的挑战。
本期华云大咖说与您一同分享对象存储在金融行业的应用,助力金融企业探寻存储发展路线图,帮助企业更好地使用对象存储。
核心观点:
1.我们正在进入从IT时代到DT时代的转型阶段。我们熟悉的IT是信息技术,是以控制管理、积累数据为主。DT时代,它是以数据创新、激发生产力为主的技术。DT时代依托于大数据采集,采用传统大数据加工转变为快数据加工。优先丰富精准的指标体系形成推动社会进步、提升幸福指数的深数据。
2.随着数字化转型升级和新技术的普遍应用,海量非结构化数据以每年60%—80%的速率增长,这不仅给数据存储行业带来前所未有的机遇与挑战,如何解决数据存储更多、更快、更稳定,实现可扩展的需求,也成为当前迫在眉睫需要解决的问题。
3.目前,传统NAS存储面对海量非结构化数据的新问题包括:海量小文件性能、数据安全、大容量空间管理、价值挖掘。
4.对象存储是用来描述解决和处理离散单元的方法的通用术语。对象在一个层结构中不会再有层级结构,是以扩展元数据为特征的。
5.对象存储和文件系统在接口上的本质区别是对象存储不支持和fread和fwrite类似的随机位置读写操作,即一个文件PUT到对象存储里以后,如果要读取,只能GET整个文件,如果要修改一个对象,只能重新PUT一个新的到对象存储里,覆盖之前的对象或者形成一个新的版本。
6.对象存储与熟悉的块和文件存储略有不同。它将数据整理到可灵活调整大小的数据容器中,也就是对象。这些对象存储在可能跨多个位置的平面命名空间中。每个对象都包含数据(未解释的字节序列)和元数据(独一无二的 ID 再加上描述该对象的一组可扩展属性)。
7.此方式的优势在于,可以基于任何属性引用和查询数据。此外,不同于很容易放错地方的纸质停车票据,您可以通过多种方式找到正确的“票据”,而且还可以根据需要采用安全或简单的方式使用票据。标识符标记支持大量文件索引,高出文件系统几个数量级,因而对象存储成为分布在各地并且包含几十亿个文件的企业存储的理想选择。
8.目前,金融是对象存储需求最大的行业。以银行为例,银行的票证单据电子化存档系统对存储分为在线和近线两部分,在线数据通常保留3年,3年后再归档至近线存储进行长期保存,以便后续检索与查询。由于归档数据需要保存15年,银行预测未来全行数据量将超过100PB。而当前采用光盘塔设备归档,存在归档速度慢、查询响应时间长达30分钟、无法大规模扩容等问题,需要为金融行业搭建接口标准化、规范化、高可用、高可靠、高性能的分布式云存储平台。
9.对象存储使用典型场景包括:文档云、云盘、内容和媒体服务、批处理、容错和高可用性、大规模处理和超大数据集、文件同步、日志分析等。