备份数据湖,多云时代的价值刷新 | ToB产业观察
对于企业级用户而言,存储系统是支撑业务生产、数据运转的生命线,常见的如块存储、对象存储、NAS等等,对系统的性能、稳定性要求极高。而在处理用于备份、灾备、开发测试等环境中的数据存储问题时,过去非常传统的磁带、磁盘技术,也早已伴随现代应用开发面临的新环境而有了新的迭代。
多云策略,是当下企业数字化转型过程中面临的其中一类环境变化,尤其对于政府、大企业、金融机构而言是重要的技术路径。与之伴随的是,多云带来了成本集约性难解,以及各类复杂性问题。
同样,在数据管理方面,多云也同样导致了数据分散,增加了企业数据管理的复杂性。数据从生产系统到备份系统,到归档系统,到不同使用场景的版本管理和数据副本管理阶段,企业都会通过不同的工具、平台进行数据管理。在上述问题之外,数据管理所衍生出的数据合规也是一个需要关注的领域。
诸多难题之下,业界开始了破解数据管理的探索。
架构升级
探索之一在于升级原有技术架构。
以爱数为例,不久前,爱数升级AnyBackup?Family 8,并对其涉及的核心技术架构包括备份数据湖、数据管理开放架构、数据生命周期管理等等,进行了完整阐述。
2017年,爱数AnyBackup Family 7产品基于CDM(Copy Data Management,数据副本管理)技术推出分级数据保护,实现数据两极分布数据保护技术,五年后AnyBackup?Family 8产品是对CDM技术进行充分论证下的改进。
从这套技术架构来看,主要包括三个层面:
首先是最底座的备份数据湖,可支撑1700+工作负载、180+云数据的保护,并通过Proplyd分布式存储实现存储资源Scale-Out扩展,提供海量数据的高性能备份、存储、管理与使用。此外,备份数据湖可统一管理各类型的第三方存储、云存储介质,满足多云架构下的海量数据管理。
其次,在备份数据湖之上,提供了一层数据管理服务,通过对数据实现备份恢复的管理、副本数据管理、数据治理、数据归档、数据搜索。
而数据管理开放架构的实现,则是希望将备份数据湖和数据管理服务的能力以API、SDK等方式,开放给生态伙伴、第三方开发者、DBA管理员等。目前开放架构提供了可扩展的代理架构SuperAgent,以实现备份脚本开发、自定义应用备份开发,以及系统管理命令集和集成接口,用于备份系统管理运维的集成和与云管平台的整合。
最上层是业务数据生命周期管理,面向不同业务,开发测试、数据科学、数据保护、长期归档、灾难恢复等业务,提供一系列数据生命周期管理及围绕每一个业务,数据从采集、准备、提供、使用、处理、归档、销毁生命周期的过程提供全生命周期管理。
备份数据湖思路的引入
作为底座的备份数据湖,不同于此前理解的数据湖(Data Lake)或者湖仓一体(Lakehouse)架构,是将不同云上不同业务、不同类型数据通过保护的方式、备份的方式,将数据放在备份数据湖中。也就是说,“利用企业的备份数据,直接建湖。”
在技术实现的逻辑上,按照爱数的解释,它没有将底层的分布式存储做成通用的存储,而是采用集成系统的思路,把数据管理应用和分布式存储进行紧耦合的设计,让整体数据管理平台的性能不仅能够进行快速的备份和恢复,也能进行高速的挂载,提供接近生产系统的高性能的数据服务。
当然,对于客户而言,并非所有的业务场景都需要用上备份数据湖,目前它针对的“是具有多云架构的客户场景,这类客户的数据量会比较大,遇到数据管理挑战也会比较多,可以通过备份数据湖架构支撑统一数据管理产品来解决问题。”爱数研发副总裁邓平告诉钛媒体APP。
而从数据备份的角度,AnyBackup?Family 8类似于第二存储系统,即以CDM技术为基础,除了备份与数据湖理念进行结合外,还具备CDM本身的技术特性。这也让其不仅具备对数据的备份、灾备,同样侧重于对数据的全生命周期管理,从数据存储、数据管理和数据服务等全周期。
事实上,2016年Gartner发布的《Innovation Insight:Copy Data Management Accelerates Bimodal IT》报告,就明确了CDM的定义和使用场景,并且到如今已经成为一项具有生命力的技术。根据Gartner给出的定义,CDM是从生产环境通过快照技术获取有应用一致性保证的数据,在非生产存储上生成“黄金副本”(Golden Image),这个“黄金副本”数据格式是原始的磁盘格式,可再虚拟化成多个副本直接挂载给服务器,分别用于备份恢复、容灾或开发测试。
“在新技术的演进下,原来传统备份的技术(如重删、压缩),也逐渐在CDM技术框架下已经实现了。通过CDM技术替代传统备份是完全可行的,而且也是对任何一个组织的数据保护,不管是从数据备份恢复的角度来讲,还是未来数据管理的角度来讲,都有更高的价值。”
邓平还指出,未来的备份CDM会逐渐完成对传统数据备份的替代。一是在技术层面相比传统备份技术的优势,能够提供更高效的数据备份机制;二是用于数据访问和使用时,通过数据存储可以更高实现数据恢复以及数据利用。
长远来看,这样的好处是,备份数据不再是沉睡的企业成本,而是也能够服务于业务,为业务产生类似于生产数据的价值,将数据价值可量化、数据可交换,让数据价值要素得以释放,也就是当前企业所重视的数据资产化和数据交易范畴。
从另一个数据维度来看,从结构化数据,到非结构化数据,再到由机器产生的日志指标等机器数据,爱数面向全域数据能力构建出了4+2体系,包括核心的灾备产品AnyBackup、智能内容管理平台AnyShare、AnyRobot Eyes 5等等,归根结底都是大数据服务商在应对市场需求变化时进行的一定创新。
显然,在当下各地方政府掀起的数据交易热潮中,从数据备份到数据管理的路径转变,是必然选择。
(本文首发钛媒体APP 作者 | 杨丽)