一、冷热定位
在数据存储方面,必须考虑温度。从冷到热的分层数据存储服务的级别由温度设置来描述。
这些级别根据业务的重要性级别进行区分——换言之,数据对业务的重要性以及访问频率。通常,术语“冷”和“热”表示数据较早的位置(传统文件存储)。
经常访问的热数据保存在 CPU 的热量和旋转驱动器附近。冷数据——不经常需要的数据——保存在磁带或远离数据中心地板的驱动器上。
随着现代数字化转型时代,传统的文件存储系统正在变得过时,并正在被最新的基于软件的文件系统所取代。此外,随着引进云端,事情发生了翻天覆地的变化,虚拟存储介质变得越来越普遍。
让我们根据当前场景找出与数据存储相关的基本术语以及知晓如何区分它们。
二、热存储
热存储是需要立即频繁访问的数据。任何对您的业务至关重要且需要定期检索的信息都被认为适合热存储。
数据通常放置在分层或混合存储系统中,以实现热存储的快速数据访问。 迎合热存储的服务更有可能做以下事情:
- 使用采用最新技术的驱动器
- 拥有更快的传输协议
- 靠近客户或位于多个区域
由于资源密集型存储需求,云数据存储提供商对热数据存储收取额外费用。一些流行的服务提供商,如亚马逊 AWS 和微软的 Azure Hot Blob,提供大量服务。
三、热存储中的分层
存储在最上层(高优先级)的数据应使用固态驱动器。这些驱动器经过优化,可产生比传统硬盘驱动器更高的交易速率和更低的延迟。对于其他情况,硬盘驱动器最适合对驱动器进行大量访问的情况,因为它对密集的读写循环具有更高的耐用性。
无论使用何种存储介质,这些作业都需要在热数据存储中具有即时且一致的响应时间。
需要此类存储的任务示例:
- 交互式视频编辑
- 捕获遥测数据
- 网页内容
- 消息传递
- 网上交易
- 数据转换
四、基于热、温、冷的差异化云服务
区分存储类型取决于使用的存储架构类型:
- 对于使用边缘设备的分布式系统,热存储可以作为每个边缘设备的计算内存和存储。
- 纯云服务用作冷计算内存和存储,其中任何云外设备都使用冷存储。
五、确定何时使用热存储
热存储需要的数据包括:
- 以更快速度转换的数据
- 用于查询客户请求的数据
- 最新实时项目中使用的数据
由于热存储需要即时且一致的访问,因此谷歌和亚马逊等云服务的可访问性为 99.95%,而 Azure 则高达 99.99%。来自热存储的数据被称为“数据流”。
数据传输的速度主要取决于数据从主机到达目的地所经过的几条路径。最靠近其源头处理的数据将具有更高的速度,而通过不同网络传输到达开发人员设备的数据将具有更长的访问时间。
六、冷库
冷存储用于不常访问的数据,不需要像热数据那样即时访问。此类数据包含不再有效且不相关的信息。适合冷存储的一些可行的数据示例包括:
- 过时的项目
- 需要记录和维护的财务数据
- 有关法律和人力资源(人力资源)的数据
- 其他需要记录的要求
冷存储数据系统的数据检索速度和响应时间比用于管理活动数据的服务慢。冷云存储的好例子是 Amazon Glacier 和 Google Coldline。
冷数据最好保存在速度较低且价格更实惠的存储介质上。磁带就是这样一种冷数据存储介质。1990 年代后期开发的 LTO(Linear Tape-Open)也是另一种选择。要检索线性磁带开放 (LTO) 数据,必须从存储架物理访问磁带并固定在磁带读取机上。LTO 属于最慢的数据存储方法(即最冷的介质)。
通过冷云存储存储数据的费用相对低于热存储或热存储,但与其他类型的云存储相比,冷存储的每次操作成本更高。
七、冷数据存储带来什么?
冷数据存储是纯粹的离线存储,包含未存储在云中的数据。它非常适合存储在位于无法访问互联网的安全环境中的某些有形介质上的数据。此类数据需要远离互联网世界(例如,像比特币这样的加密货币)。
八、何时使用冷库
用于冷藏的数据(例如法律原因、协议或记录)会保留相当长的时间。由于数据版本控制变得普遍,旧版本的数据集最适合放在冷存储中。这些数据最近没有更新,但正在被查询,也称为“休眠数据”。
检索冷存储数据比热存储需要更多时间。访问冷存储数据可以通过物理筛选一组硬盘驱动器并连接到计算机以检索数据来完成。
九、何时使用温存储
需要连续访问而不受冷存储强制限制的数据适合温存储。温存储可以采用支持网络的存储驱动器或位于远程位置的文件服务器的形式,用于业务网络。
如果您担心热存储过载,可以将文件存储在温存储上。它不会释放空间或资源,但会保护数据免于丢失。对于能够保持以下业务的人员来说,此类替代方案是最佳选择:
- 店铺指南
- 教程
- 不常访问的数据,例如为员工提供的更高容量共享驱动器上的文档
十、AI 正在重新定义数据存储
数据只会越来越大,目前已经到了 Zettabyte 时代。技术的未来是人工学习 (AI)、深度学习 (DL) 或机器学习(ML),而数据是命脉。
然而,当涉及到人工智能、深度学习或机器学习时,数据存储不能被定义为一刀切。在这里,根据容量、吞吐量、延迟、IOPS 等不同的存储要求,分析的概念开始生效。
充分发挥 AI 和 ML 技术潜力的基础设施是数据增长。这正是为什么需要大量训练数据来提高需要摄取、存储和准备数据的预测环境的准确性级别的原因。
然而,人工智能(AI)正在重新定义和改造冷热数据存储的概念。正如英特尔副总裁兼数据中心内存和存储解决方案总经理 Alper Ilkbahar 所解释的那样,“简单地将图像存储在云中是冷的,而使用 AI 识别图像中的人脸是热的。”
十一、结论
各种规模的企业每天都会产生大量数据。这就要求高效数据管理策略,尤其是存储和维护。但是,首先,您需要确定哪种解决方案适合您的要求,例如支出范围、数据需求和复杂性。
无论您选择热存储还是冷存储,最重要的是要考虑的是您的数据使用情况。如果您想快速轻松地访问,请结合使用本地存储和云提供商将是您数据的正确选择。
在长期存储的情况下,混合冷存储或备份提供商将是理想的选择。此类解决方案可降低存储成本并为其他数据释放本地存储空间。