2022爱分析?数据库厂商全景报告 | 爱分析报告
报告编委
黄勇
爱分析合伙人&首席分析师
洪逸群
爱分析高级分析师
张良筠
爱分析分析师
目录
1. 研究范围定义
2. 市场洞察
3. 厂商全景地图
4. 市场分析与厂商评估
5. 入选厂商列表
1. ? ? 研究范围定义
研究范围
在国内数字化转型以及信创建设持续推进的大背景下,众多厂商入局国内数据库市场,为企业提供了面向多种应用场景的数据库,以及相关的生态工具或服务。国内数据库市场因此迎来了诸多新的变化,新的产品类型、新的技术、新的服务,以及新的市场格局,而这些变化也让企业在选择数据库时需要考虑更多复杂的因素。
在本报告中,爱分析将数据库市场划分为数据库产品、数据库工具和数据库服务。其中,数据库产品包括各种类型的数据库,如事务型关系数据库、分析型数据库,以及图数据库、时序数据库等专用数据库等;数据库工具包括各种用于数据库管理运维、开发测试的工具;数据库服务包括咨询规划、实施部署等服务。
综合考虑细分市场的市场规模、企业关注度等因素,爱分析在本次研究中选取了事务型关系数据库、分析型数据库、超融合数据库、图数据库、数据库云管理平台5个细分市场,进行重点研究。
本报告面向各行业企业的IT部门、大数据部门、科技创新部门,以及相关业务部门的负责人,通过对各个特定市场的需求定义和代表厂商能力解读,为企业数据库规划与厂商选型提供参考。
图1:数据库市场全景地图
厂商入选标准
本次入选报告的厂商需同时符合以下条件:
厂商的产品服务满足各市场的厂商能力要求;
近一年厂商具备一定数量以上的付费客户(参考第4章各市场分析部分);
近一年厂商在特定市场的营业收入达到指标要求(参考第4章各市场分析部分)。
(注:“近一年”指2021年Q4至2022年Q3)
2. ? ?市场洞察
2.1 信创政策支持下,国产数据库潜在替换空间大,但当前存量市场整体替换率还较低。
自2018年来,国内信创建设逐步升级,以Oracle为代表的国外商业数据库在国内市场日渐式微,国产数据库迎来前所未有的发展机遇。根据爱分析的估算,2022年中国数据库市场规模约为320亿元,国产数据库潜在替换空间巨大。
然而,国产数据库替换目前主要集中在行业的增量市场,在更大的存量市场,由于数据库替换迁移是项非常繁琐、高成本的工作,且国产数据库在技术积累、生态成熟度等方面与国外商业数据库还存在一定差距,国产数据库目前的渗透率还较低。根据爱分析调研,目前在全行业数据库存量市场,国产数据库的整体替换率约为10%,而在银行的核心生产系统,国产数据库的替换率仅有1%左右。
图2: 国产数据库在存量市场的替换率
爱分析认为,信创带来的国产数据库的替换需求将是长期且不可逆的,且目前正处于加速状态,预计国内数据库的存量市场将在未来5-10年逐步完成国产化替换,最终国产数据库的替换率将达到80%以上。国内数据库厂商在这个过程中要抓住机遇,需在以下几方面着重发力:
1)提升产品与Oracle、MySQL等数据库在语法、功能特性,以及生态工具的兼容性,并提供易用的数据迁移工具,保障数据库的平滑替换,并降低替换成本;
2)注重生态建设,尤其是注重培养数据库生态服务厂商,数据库应用人才,一个完善的数据库生态是企业使用数据库的长期保证。
3)加强技术研发,积累客户服务经验和场景考验,提高产品化能力,并提升产品性能和稳定性。
2.2???数据库不断出现技术融合,新兴行业或新兴业务场景是应用主力。
近年来,数据库技术出现了显著的融合趋势,一些全新类型的数据库融合了传统的两种或以上类型的数据库的能力,来满足用户的需求。这是由于数据库应用场景正变得更加广泛,数据类型变得更加多样,而传统的部署多套数据库系统的模式在使用门槛和运维成本方面都很高,这导致了一些新兴的融合型的数据库的出现,这些数据库主要包括:
1)HTAP数据库:融合OLTP数据库的事务处理和OLAP数据库的查询分析的能力;
2)智能湖仓:融合了数据仓库对数据的高效管理能力以及数据湖对于海量数据的低成本存储能力;
3)超融合数据库:融合了事务处理和查询分析能力,并能对关系型数据、图数据、时序数据、文档数据等多种数据模型进行统一管理。
融合型数据库通过简化系统架构,显著降低了使用门槛和运维成本,但其当前用户主要来自新兴行业或新兴业务场景,传统行业企业的传统业务场景对融合型数据库的应用有限。以HTAP数据库为例,传统行业企业内的OLTP数据库和OLAP数据库的应用场景通常在不同的部门,两者在企业内部由于业务分工导致数据库系统的物理隔离,是传统企业当前对于融合型数据库的需求不足的原因。而在新兴行业或新兴业务场景,以先进制造行业为例,智能制造对于工业生产流程的颠覆,使得记录生产过程的大规模数据需要被采集、存储、分析,以指导自动化和智能化的生产过程,导致这类企业对于智能湖仓、超融合数据库有着较强劲的需求。
图3:数据库市场重要趋势
2.3???Serverless渐成趋势,帮助用户更快、更便捷地构应用。
数据库的服务形态在不断进化,从最早在本地数据中心自建数据库,到云上的PaaS服务,再到云原生数据库,数据库正在往Serverless的方向发展。
Serverless数据库是指用户在构建和运行数据库时无需对数据库本身以及底层的服务器资源进行管理,并且当用户的业务请求数增加或减少时,数据库能够自动调度资源,实现弹性伸缩。Serverless数据库渐成趋势的原因有两点:
1) 数据库类型越来越多,数据库的架构也变得越来越复杂,开发者学习和使用每种数据库的门槛越来越高,需要Serverless来屏蔽数据库技术的复杂度。
2) 企业对于数据库的应用需求变得越来越敏捷,通过Serverless实现数据库资源自动伸缩,并按量计费,越来越成为企业重要的需求。
目前,Serverless技术处于早期阶段,能够提供Serverless数据库的仅有部分公有云厂商和少数数据库厂商。爱分析认为,Serverless将成为数据库发展的重要趋势,会有更多厂商加入这条路线,其用户基础也会逐渐壮大。
2.4???数据库管理平台成为国内数据库生态的重要参与者,AI自治是数据库管理的重要能力。
随着国产和开源数据库在国内数据库市场的崛起,数据库管理平台成为国内数据库生态的重要参与者。由于数据库管理平台具备数据库安装部署、迁移、备份、监控告警、巡检、性能分析、智能运维、安全管控等数据库使用全生命周期管理能力,有效弥补了国产和开源数据生态中对数据库管理运维工具相对缺失带来的诸多不便。
与此同时,数据库管理越来越强调智能化的能力。即在数据库管理中引入AI技术,实现数据库管理运维智能诊断、智能优化,降低数据库运维对专业人员的依赖。具体而言,智能诊断是从数据应用、数据库、底层资源不同层面进行诊断分析,自动定位问题,实现数据库运维的可观测性;智能优化是指针对数据库表结构、集群使用效率等进行条有建议,提升效率。
3. ? ?厂商全景地图
爱分析基于对甲方企业和典型厂商的调研以及桌面研究,遴选出在数据库市场中具备成熟解决方案和落地能力的入选厂商。
4. 市场分析与厂商评估
爱分析对本次数据库项目重点研究的特定市场定义如下。同时,针对参与此次报告的部分代表厂商,爱分析撰写了厂商能力评估。
4.1 ? ? 事务型关系数据库
市场定义:
事务型关系数据库是指采用行和列构成的二维表格模型来组织数据,通过关系模型对表进行连接,并针对数据“增改删”的事务处理而设计的数据管理系统。事务型关系数据库需具备事务的ACID特性、并支持SQL访问和解析等功能。
甲方终端用户:
各行业企业的IT部门、大数据部门、科技创新部门,以及相关业务部门
甲方核心需求:
近年来,随着企业数字化转型步入深水区,为了应对数据量爆发式增长、业务场景多样化扩展的趋势,甲方企业对于事务型关系数据库的选型要求也在不断提升:除了要保证基本的系统运行稳定及服务的可靠性,也需要数据库具备优良的性能来更好地支持银行存取转账、电子商务订单等大规模的交易处理场景。此外,随着国家信创政策的不断深化,企业对使用的国外商用数据库替换的需求也与日俱增,尽可能缩减迁移改动成本成为甲方企业的主要诉求。具体而言,企业对于事务型关系数据库的核心需求包括:
能够稳定可靠地运行。作为数据管理系统的核心,企业需要事务型关系数据库具备对外服务响应的灵敏性、整体系统运行的流畅性和数据服务的可靠性,保障业务系统能够稳定运行。
数据库服务高可用。许多如银行、电信、政务等行业的重要业务系统都要求数据库提供7*24不间断服务,需要事务型关系数据库尽可能缩短因为维护或者故障造成的服务不可用时间。因此,在系统硬件发生故障、人为出错或者软件报错等情况下,企业需要数据库服务能够在一定时间范围内切换至可用状态,并且保证数据零丢失。
具备高性能的事务处理能力。面对数据量爆发式增长、业务场景多样化扩展的趋势,企业需要数据库能够完成海量数据处理的工作,并且支持大量业务人员同时进行读取或写入的事务处理场景。在诸如“双十一”、秒杀活动等高并发的交易处理场景,企业需要数据库能够提供毫秒甚至更短的响应时间来面对不断增长的业务需求。
要尽可能降低数据库替换成本。由于信创政策对数据库国产化的要求,企业需要对传统使用的国外商业数据库进行替换。在替换过程中,需要尽量减少对原有业务的改造,并且尽可能延续上层应用的使用。此外,自动化的数据迁移工具也成为企业降低迁移成本的需求之一。
丰富的生态资源。企业会对数据库的周边生态有一定依赖性,因此生态资源的丰富程度也成为甲方选型的考虑因素之一,尤其是周边工具所提供的功能支持。
此外,部分企业对于事务型关系数据库还有以下期望需求:
在某些行业,事务型关系数据库需要满足信创资质要求。在党政军、金融等需要严格保证信息安全的行业,核心技术需要自主可控来保证安全性。因此,企业需要严格参照信创测试报告或者信创名录来进行数据库选型。此外,由于某些企业已经进行了国产化软硬件的部署,需要数据库能够在在国产IT环境中顺利运行。
厂商能力要求:
基于上述核心需求,数据库厂商需具备以下能力:
厂商提供产品能够稳定地运行在企业的业务环境中,并且保证事务数据的可靠性。具体而言,厂商产品提供数据的充分冗余,并且保证备份数据的一致性。同时,具备完善成熟的机制保证事务处理的一致性。其次,厂商产品被广泛采纳使用,运行的稳定性得到企业及用户的认可。
厂商产品能够提供高可用的数据服务。厂商产品提供具备完备的容备灾机制,支持数据的充分冗余。在数据节点由于硬件故障或人为失误导致不可用时,备灾节点能够快速切换,保证服务不中断。如果集群无法提供服务,厂商有其他用于备灾的数据中心对服务进行无损接管,同时要保证服务的切换恢复时间在企业的可接受范围内。
在性能方面,厂商提供的产品具备事务的高吞吐、横向扩展和并发处理能力,并且支持数据的实时写入和读取。在海量事务处理的场景下,厂商提供分布式部署的事务型关系数据库产品,具备高吞吐能力来降低系统服务的响应时间,并且通过横向扩展来支撑不断增长的数据量。在读写高并发的需求下,事务型关系数据库需要具备一定的并行执行能力,并且通过均衡分配读写负载来支持大量业务人员同时进行查询或写入操作。
厂商数据库产品能够对企业原有数据库进行低成本替换。厂商提供的产品需要对相应被替换的数据库产品语法兼容,保证替换后上层应用的平稳运行,并且不需要进行太多的业务改造。此外,产品配套的迁移工具也能够降低数据迁移成本,方便企业做数据库替换。
厂商提供的产品具备一定的生态资源。厂商的产品具有一定的周边生态工具和服务,或者能够兼容主流生态,能够满足企业对生态资源的使用需求,尤其是生态中数据库周边工具要能够满足数据库使用全生命周期的功能支持。
针对部分企业的期望需求,数据库厂商需具备以下能力:
厂商提供的产品需要满足信创的要求。厂商的产品需要通过了相应的信创测试或进入了信创名录,证明了自身技术的自主可靠性。此外,厂商产品对甲方企业使用的国产操作系统、芯片等软硬件进行了相应适配,能够保证数据库系统在国产IT环境的平稳运行。
入选标准:
1. 符合事务型关系数据库的厂商能力要求;
2. 近一年在该市场服务客户数10家以上;
3.近一年该市场相关服务收入规模在1000万元以上。
代表厂商评估:
爱可生
厂商介绍:
上海爱可生信息技术股份有限公司(简称“爱可生”)成立于2003年,是国内知名的数据库、数据库运维管理平台以及数据处理技术提供商。产品包括关系型数据库云树?数据库ActionDB、向量数据库TensorDB、云树?DMP数据库集群管理平台、云树?DBaaS和DaaS数据中台系列产品等,客户主要分布于金融、电力、智能制造、电信、广电、交通、航空航天等行业。
产品服务介绍:
云树?数据库ActionDB(简称“ActionDB”)是一款爱可生自主研发的国产关系型OLTP数据库,主要应用于高并发、海量数据场景下结构化数据的存储、管理和计算,具备灵活弹性扩展、金融级可靠性、自动化运维管理、多地多中心容灾等特性,适用于高并发、TB级海量数据及国产化转型场景。目前主要在金融和运营商行业核心业务系统有大规模的落地。
向量数据库TensorDB主要用于非结构化数据的低成本存储和计算,能够将图片、视频等非结构化数据以向量的形式进行表示,并支持向量数据的近似检索,可用于人脸识别、推荐系统、图片搜索、视频指纹、语音处理、自然语言处理等涉及AI应用的各个行业。TensorDB 具有极高的并发检索性能,卓越的水平拓展能力,并提供满足多元业务场景下的高可用能力。
厂商评估:
爱可生云树?数据库ActionDB在产品的安全可靠性、分布式性能、MySQL语法和生态兼容性方面具备优势,同时能够适配主流国产软硬件,满足企业信创要求。同时爱可生具备较强的数据库服务能力,ActionDB配备的可视化管理平台和DBA专家能够为数据库提供全面的数据库相关服务。
ActionDB具备满足金融等行业客户要求的安全可靠性,并在此基础上实现了数据库的高可用。在可靠性上,ActionDB采用了自研的数据一致性技术和多副本机制保证了存储节点的数据的一致性,在分布式架构下采用Raft协议保证了事务的一致性。在可用性上,存储层数据分片能够实现故障自动切换,支持同城多中心、两地三中心、多地多中心的容灾部署,整体达到“5个9”的可用性,在跨数据中心切换时能够实现RPO=0的服务无损接管 。
例如,在某大型国有银行核心业务系统的分布式转型中,爱可生提供了支持大体量高并发场景的分布式数据库解决方案,实现了事务数据的金融级强一致性,并且满足银行业对系统灾备建设的等级要求和个人账户信息等高敏感数据对系统安全性的要求。
ActionDB通过分布式技术实现了数据库的性能增强,能够支持海量数据、高并发交易的业务场景。在分布式架构下,ActionDB支持上百TB的大体量存储,智能路由调度和自动化分片功能实现了数据库的弹性扩展,产品曾支持过某运营商行业客户电子渠道充值的高并发业务场景,交易量峰值达上亿QPS。在SQL解析计算方面,ActionDB优化了解析器并将SQL翻译为关系代数层面下推至存储节点进行计算,提升了SQL语句处理效率。在并行计算方面,ActionDB对线程池技术进行了优化,提升了任务执行的并发度来提升整体效率。
ActionDB完全兼容MySQL语法和生态,便于企业进行MySQL数据库的国产化替换。在语法兼容性上,ActionDB兼容MySQL语法协议、数据对象和类型、内置函数等,能充分支持MySQL上既有业务的平滑迁移。在生态兼容性上,ActionDB延续了MySQL技术路线并完全兼容其生态,方便企业直接使用丰富的生态工具和技术资源。
ActionDB适配主流的国产软硬件并通过了多个行业的信创标准测试,能够满足企业对信创的要求。在软硬件适配方面,ActionDB支持与国产芯片(如飞腾、海光)、中间件、操作系统(如中标麒麟、统信)及上下游软件适配。在行业信创测试方面,ActionDB参与编写并通过了多个行业的信创标准测试,包括央行下属的金融科技联盟的信创测试、工信部信创数据库标准的测试等。
爱可生为用户提供了可视化数据库管理平台云树?DMP和数据库相关服务,能够帮助企业降低运维管理的难度和成本。云树?DMP提供可视化的数据库运维管理能力,包括安装部署、配置变更监控、告警备份恢复、性能诊断、扩缩容SQL 质量审核、数据迁移、数据安全等,能够自动处理大部分DBA日常工作,降低了数据库运维的难度。同时,爱可生的DBA专家也能够提供MySQL源码级服务,支持数据库的分布式转型及基础运维等一站式服务。
典型客户:
中国人民银行、中国工商银行、华夏银行、兴业银行、吉林银行
代表厂商评估:
万里数据库
厂商介绍:
北京万里开源软件有限公司(简称“万里数据库”)成立于2000年,专注于国产自主可控的数据库产品技术研发,打造了功能、性能、稳定性、易用性领先的一站式数据库产品与解决方案,已服务金融、运营商、能源、政府、交通等多行业重点客户,助力超1000个应用场景实现国产化替代与数字化转型。万里数据库拥有发明专利、软件著作权百余项,是国家级专精特新“小巨人”企业,已参与多个国家级的数据库行业标准制定工作。
产品服务介绍:
万里数据库GreatDB是一款国产自主可控的关系型数据库,可根据用户需求采用分布式或集中式部署,具备动态扩展、数据强一致、集群高可用等企业级特性,满足业务高并发、高扩展性、高安全性等严苛的事务处理和轻量分析需求,完全兼容MySQL生态,兼容适配了国产主流操作系统、芯片等基础软硬件,广泛应用于金融、运营商、能源、政府等行业,其衍生的开源分支版本GreatSQL可直接对官方MySQL进行兼容替换。
厂商评估:
万里数据库GreatDB在产品稳定可靠性、MySQL和Oracle技术兼容性、部署灵活性、容备灾能力和服务等方面具备优势,在分布式和集中式部署下的性能表现可以满足金融、运营商、能源等重点行业多样化的场景需求,同时GreatDB能够适配主流国产软硬件,满足企业对信创的要求。
在产品能力上,GreatDB稳定可靠且性能表现强劲,具备金融、运营商等多个重点行业核心业务系统的技术支撑能力,能够满足海量数据、高并发场景下对事务容错性和处理效率的要求。如金融行业,万里数据库服务的全国股份制银行统一支付系统,部署超24个节点,峰值支撑超2000TPS,采用同城双活架构实现机房级的高可靠,确保RPO=0;运营商行业,万里数据库服务的四川移动开关机系统,部署约10个节点,峰值支撑超4500TPS,支撑高峰订单每日超2000万,指令下发量10000万,保障全省用户的各类基础业务及增值业务功能的办理开通。
在稳定性方面,GreatDB通过事务管理器的轻量化和读写快照的无锁化解耦,配合在通信网络技术上的优化,整体降低了网络波动对事务响应时间的影响;在可靠性方面,GreatDB采用多副本冗余和 Paxos 协议来保证事务数据的强一致性;在容灾备份方面,GreatDB采用备份恢复机制,同城双活或三活加上异地容灾集群的部署达到了RPO=0和RTO<60秒的高可用性。
在性能方面,GreatDB针对事务处理要求严苛的场景优化了SQL并行执行、事务快照维护、副本复制协议等方面来提升整体性能表现;同时,GreatDB在小规模配置场景下性能表现良好,在国产鲲鹏等服务器上,用三台机器性能可以达到100万TPMC。
在技术能力上,GreatDB全面兼容MySQL及其生态,同时兼容Oracle语法及功能特性,助力企业顺畅完成数据库国产替代。在与MySQL的兼容性方面,万里数据库作为原MySQL中国研发中心积累了深厚的技术经验。在语法上,GreatDB全面兼容MySQL的语法和功能特性,能够支持MySQL上既有业务的平滑迁移。在生态上,GreatDB兼容了MySQL生态中数据链上下游的各种工具,可提供面向多元化终端用户的数据库工具链,降低了GreatDB用户的工具学习和使用成本。GreatDB还能够兼容Oracle的语法和功能特性,如递归查询、DBLink、窗口函数、序列等,降低了对Oracle存量业务替换的成本。 如万里数据库服务的河北移动统一接触库的Oracle国产化替代项目,基于GreatDB的各类Oracle语法兼容特性,替换过程中业务保留了大量的Oracle特性语法,确保了项目周期和迁移成本可控。
在部署模式上,依据客户不同的业务场景需求,GreatDB能够采用集中式或分布式的灵活部署模式。针对海量数据、并发量高的业务场景,客户可以选择分布式的模式部署GreatDB,利用并行计算加快数据处理能力,同时还能保障数据一致性,未来还能按需持续扩容;针对数据量偏小、对稳定性和事务一致性要求极高的业务场景,客户可以选择使用集中式的部署模式。
在国产生态上,GreatDB适配主流国产软硬件,满足国家信创要求。GreatDB与主流国产芯片(如龙芯、申威、飞腾、鲲鹏、海光、兆芯)、操作系统(如麒麟软件、统信UOS、麒麟信安、TurboLinux等)和第三方应用等软硬件适配,充分满足企业在信创方面的需求。
在开源贡献上,万里数据库主导成立了GreatSQL社区,助力开源数据库生态。GreatSQL社区致力于打造国际主流的开源数据库中国根社区,为金融、运营商、能源等众多行业客户提供自主可控的开源数据库产品。GreatSQL数据库适用于金融级应用,可以完全兼容MySQL或Percona Server。目前,GreatSQL社区已覆盖2000+技术开发者,被Gitee评为“最有价值开源项目”。
在技术服务上,GreatDB拥有完善的服务体系和丰富的应用实践经验,可以保障服务响应的及时性和故障处理能力。GreatDB配套的标准服务包括实施阶段的现场部署、调试,上线之后的故障处置、应急响应等;高配服务提供整体架构解决方案的设计讨论、迁移过程和业务调试的配合等服务。万里数据库服务过银行、电网、运营商等多个行业的大型头部企业客户,曾为某银行客户提供MySQL源码级专家服务。公司在全国设有北京、上海、成都、广州、福州5个技术服务中心,分公司服务范围覆盖全国,充分保障了服务响应的及时性。
典型客户:
四川移动、河北移动、中信建投、国家气象局、首都信息集团
代表厂商评估:
亚信科技
厂商介绍:
亚信科技控股有限公司(简称“亚信科技”)成立于 1993 年,是领先的企业级软件产品、解决方案和服务提供商,其软件产品包括数据库和大数据产品、人工智能平台、PaaS 平台、云管理平台等,主要为大型企业数字化转型持续提供端到端的全栈数智化支撑,是国内领先的“数智化全栈能力提供商”,客户涉及通信、金融、能源、交通、政务等多个行业。
产品服务介绍:
AntDB是亚信科技21世纪初打造的内核全自研的国产数据库,在通信运营商核心业务系统平稳运行15年,服务全国24省市的10亿多用户,峰值每秒处理百万笔通信核心交易。目前,AntDB已发展为通用型企业级分布式关系型数据库,并在通信、交通、金融、政务等多个行业商用落地。近些年,AntDB全面融入信创,支持众多国产芯片和操作系统,安全、可靠、易用,并助力上海移动、云南高速等行业客户率先完成升级改造目标,树立行业信创典范和标杆。
厂商评估:
AntDB数据库在产品可靠性、语法和生态工具兼容性、备份容灾、性能、HTAP能力,信创支持方面具备优势,可满足用户海量的数据处理和应用平滑迁移等需求。
AntDB产品成熟稳定,并拥有完善的服务体系。AntDB在通信运营商的生产环境平稳运行了 15 年,服务10亿多用户,经历了大量实战验证和技术打磨;在服务方面,亚信拥有超过1万人的服务团队,由软件工程师组成的现场团队遍布全国各个省市,保证了服务响应的及时性。
AntDB在SQL语法和生态工具上具备与国外开源和商业数据库良好的兼容性,便于企业做数据库国产化替换迁移。在语法方面,AntDB内置多模SQL解析器,兼容标准SQL语法,以及PostgreSQL、MySQL和Oracle等数据库的语法;在生态工具方面,AntDB注重与开源生态的兼容性,目前兼容95%以上PostgreSQL和MySQL开源生态的工具,可直接使用丰富的第三方工具。
AntDB通过多副本存储和容备灾部署保障了数据库的高可用。AntDB通过多存储节点实现数据多副本,保障了数据安全和强一致性。同时,AntDB在部署上采用“两地三中心”模式,主中心出现故障后,备中心对业务无损接管达到RPO=0,异地容灾中心对服务的接管达到RTO<10秒。
AntDB在性能方面做了大量优化,能够支持通信、金融等行业企业高并发、大吞吐量的交易场景。AntDB分布式版本优化了任务分发、MapReduce计算框架,降低了计算开销;在部分极端场景,AntDB分布式版本还进一步引入内存计算,结合相应算法优化,弥补单节点的硬件性能不足;同时,AntDB分布式版本利用两段式提交和内部事务管理机制保证了事务强一致性;AntDB单机版本在内核层读写分离,并支持自动化调整读写负载,实现了单机版本 TPMC 最高可达 100 万。
AntDB支持HTAP混合负载,并具备实时分析能力。AntDB在一套引擎里同时提供了交易处理和分析能力,降低了企业部署和运维成本;同时,分析场景中进一步融合了流处理技术,提供数据主动推送能力,相比传统HTAP的分析方式,业务响应速度得到了提升,能够支撑企业在营销、库存管理中进行实时的数据处理与分析。
在某省清分结算系统中AntDB一体化的清分结算业务分析能力,覆盖数据采集、上传下载、数据处理、清分、清分结算、数据校验、路径拟合、数据查询等业务场景,达到清分结算业务高效进行,推进全省收费公路联网收费工作的安全、有序发展,助力高速的精细化运营。
AntDB核心技术自主可控,并融入信创体系。AntDB核心的存储和计算引擎均来自自研技术,作为信创工委会的成员单位,AntDB通过了国家信创产品测试和国家实验室代码自主率测试,代码自主率超过90%;在国产化适配方面,AntDB和主流国产芯片(如飞腾、龙芯、鲲鹏、海光)、操作系统(如统信 、中标麒麟、银河麒麟、欧拉)等兼容,并适配主流国产第三方工具。
典型客户:
中国移动、中国电信、中国联通、中国邮政储蓄银行
4.2 ? ? 分析型数据库
市场定义:
分析型数据库是指能够对各种来源的结构化数据,以及半结构化和非结构化数据进行存储和计算分析的数据管理系统。分析型数据库能够执行即席查询和复杂分析,满足业务分析或商业智能的需求。分析型数据库通常采用列式存储,具备自动索引、总I/O较少、利于数据压缩等优势,极大地提升了查询性能。
甲方终端用户:
各行业企业的IT部门、大数据部门、科技创新部门,以及相关业务部门
甲方核心需求:
随着数据量越来越大、数据结构更加复杂,以及应用场景越来越多样化,业务部门需要处理和分析不断增长的数据,从中获取有价值的信息。在传统的分析场景中,业务数据来源较为单一,企业大多只能对结构化数据进行较为简单的查询分析,而且,实时数据需要一天甚至更久才能进入数据库并于与历史数据整合,缺少了做实时业务决策的数据支撑。因此,企业在当下对分析型数据库提出了更高的要求。企业对分析型数据库的核心需求包括:
高效的查询分析性能。企业一般需要将大量的业务历史数据进行存储,并保证数据的读取效率。在业务分析的场景中,会涉及大量的即席查询和复杂分析,需要随意组合查询条件或者跨多表对数据进行多维度聚合计算。企业需要分析型数据库具备完成这些复杂运算的能力,并且在尽可能短的时间内获得查询结果。
高可用的数据服务。企业需要分析型数据库具备一定的机制来应对服务器故障、操作失误等异常场景,无需人工干预即可自动恢复,减少服务的不可用时间。
支持多种数据源。随着业务数据结构越来越复杂,应用场景更加多样化,企业需要从不同数据来源中获取有价值的信息。因此,企业希望分析型数据库具备支持不同数据源、多种数据结构的读取能力。
数据库周边工具。企业需要分析型数据库周边工具来满足数据库使用中不同的功能需求,例如,企业需要运用ETL/ELT工具将数据同步传输至湖仓中;在分析场景中,数据清洗、数据挖掘等周边工具能够辅助业务人员快速完成分析需求。
此外,部分企业对于分析型数据库还有以下期望需求:
对人工智能应用的支持。近年来,随着人工智能在分析场景中的大量应用,企业也需要分析型数据库更好支持AI 模型训练时大量复杂数据的读取能力,并能够通过一定的AI运算能力增强数据挖掘处理的效率。
厂商能力要求:
基于上述核心需求,分析型数据库厂商需具备以下能力:
厂商提供的产品能够进行高性能的数据存取,并且支持即席查询以及复杂分析。为了满足企业大量历史业务数据的存储需求,厂商产品需要提供高效的列式存储和数据读取能力,在分布式下能够动态扩展支持数据的不断增长。此外,要能够支持查询条件的任意组合,满足业务灵活的查询需求;并且具备跨多表、多维度聚合计算的能力。
厂商产品支持多数据源。厂商产品提供数据源接口,能够对多种数据源,如Oracle、MySQL、HDFS等,进行读取。在更理想的情况下,厂商产品能够支持数据联邦,在不需要对数据进行整合的前提下对多源异构数据的进行统一的查询分析。
厂商提供丰富的周边工具来支持多项数据库使用的功能需求。数据库的配套工具能够更好地支持产品的使用,尤其 ETL/ELT工具能够支持与数据湖仓连接传输需求。或者,厂商产品提供标准化接口,能够对接主流应用工具。
针对部分企业的期望需求,数据库厂商需具备以下能力:
厂商产品能够支持AI的相关应用。数据库需要具备一定的数据处理能力,支持AI模型训练时的数据读取工作,尤其是对向量、矩阵等复杂数据结构的存取。此外,数据库本身需要具备一定的AI运算能力来增强数据挖掘处理的效率。
入选标准:
1. 符合分析型数据库的厂商能力要求;
2. 近一年在该市场服务客户数10家以上;
3.近一年该市场相关服务收入规模在1000万元以上。
代表厂商评估:
柏睿数据
厂商介绍:
北京柏睿数据技术股份有限公司(简称“柏睿数据”)成立于2014年,是一家以数据库为核心的“Data+AI”数据智能基础软件公司,国内首家因突破数据库核心技术而获得国家级专精特新“小巨人”称号的民营企业。柏睿数据作为国内掌握全内存数据库引擎关键专利的企业,基于完全自主研发的全内存分布式数据库产品体系和人工智能产品体系,打造软硬一体化智能数据处理平台,其产品在算力性能、智能化、安全性、标准化等关键技术指标上均业界领先,已为金融、政务、能源、通信、医疗等众多行业标杆客户提供原创性数字化转型技术产品服务。
产品服务介绍:
RapidsDB是柏睿数据自主研发的基于分布式架构的全内存分析型数据库,具有完整的数据库管理系统特征,提供高效完备的数据库管理功能,主要包括高性能、高可用、支持海量数据、应用开发环境、运行环境和管理工具等产品特性和技术功能。RapidsDB提供对各种数据源的统一SQL访问,包括关系型和非关系数型数据。同时兼容MySQL语法,可以用RapidsDB自身提供的程序或者MySQL驱动。目前在金融、通信、政务、医疗、能源、工业互联网等行业实现了业务场景的落地。
厂商评估:
RapidsDB分布式全内存数据库具备高效的数据存取和横向扩展能力,能够保证存储数据的准确可靠性,并提供持续可用的数据服务。RapidsDB联邦层接口能够连接多源异构的数据,并在无需进行数据交换整合的情况下即时查询。同时,RapidsDB在内核层具备了AI的运算能力,并借助机器学习实现了查询的动态优化。此外,RapidsDB配备了ELT及其他分析型数据库周边工具,能够支持数据挖掘、数据治理等多项业务需求。
RapidsDB是基于分布式架构的内存数据库,具备高效的数据存取、横向扩展能力,能够实现在高并发、跨多表的复杂查询等分析场景的即时响应。RapidsDB采用基于内存的行列混合存储技术,内存存储能够避开数据访问磁盘时的I/O限制来达到更快的存取速度,并配合数据压缩和格式优化达到更高的CPU、GPU等硬件资源利用率。分布式架构能够按需动态扩展,支持日增20TB数据量的实时采集与分析。同时,RapidsDB的分布式查询优化器能够均衡分配节点负载,数据结构的无锁化允许高吞吐量的并发读写,整体达到100TB全内存数据量分析500/秒并发,TB级数据毫秒级响。在复杂的跨多表查询场景下,布隆Join通过连接布隆过滤器来排除优化不必要的数据交互,提升了节点之间的数据传输效率。此外,RapidsDB将查询计划编译为机器代码执行并且缓存,不仅提升了代码执行效率,而且使得相同结构的后续查询能够快速进行。
RapidsDB具备高可靠性,能够支持金融、政务等行业重要业务系统数据服务的持续可用。RapidsDB提供主副两个可用性组,主副组之间通过数据实时同步来保证一致性。集群节点以成对的配置模式在彼此之间共享数据副本,当某个节点出现故障时能够自动进行故障转移,保证数据服务的持续可用。此外,RapidsDB支持内存数据持久化,提供完备的备份与恢复措施,在内存存储数据之外,服务器会在磁盘中维护数据副本防止数据错误或者丢失。
RapidsDB的数据联邦技术支持用户通过统一接口层在无需对数据进行交换整合的前提下实现对多源异构数据的即时分析。RapidsDB内置智能化联邦连接器,能够与多种数据库或数据源相连接,包括Oracle、PostgreSQL、Greenplum连接器、流数据连接器、JDBC连接器、HDFS Hive连接器等,支持不同来源数据对象在不交换整合的情况下在单一SQL中的查询。自适应查询下推机制能够依据数据源特征将部分执行计划下推至底层执行来提升整体效率。同时,RapidsDB优化了自身的联邦查询技术,利用人工智能和动态优化技术实现了分布式架构以及数据加密形态下的的高效路径估算,大大提升了查询效率。
RapidsDB配备了ELT等分析型数据库周边工具,能够满足企业数据挖掘、数据治理等多项业务需求。RapidsDB配套了ELT相关工具,支持数据清洗、增量数据抽取、流式处理、批处理等多项功能,能够为企业BI业务提供数据支撑。此外,RapidsDB的工具生态中还有数据挖掘等周边工具,方便对入库/湖数据进行处理和分析。在数据治理方面,数据血缘管理、数据关系知识图谱、虚拟数据路由管理等功能支持用户对企业内部各种数据格式和不同数据源统一透明的访问,提供了自助创建业务视图、安全认证、鉴权等一系列操作。
柏睿数据作为一家“Data+AI”的技术公司,在RapidsDB内核层集成了多项AI优化能力,同时数据库本身也提供AI模型训练所需的特征库功能。RapidsDB的核心引擎具备了AI的运算能力,包括对复杂数据结构及相应算子的支持。基于AI和机器学习算法,柏睿数据自主研发出了动态查询优化技术,动态查询优化能够根据数据分布特征预先捕获不同列或表之间的相关性,并自动插入条件语句来完成优化查询计划,从而得到更精确的查询结果。同时,RapidsDB还提供pandas人工智能的API,在数据库内核层实现智能化数据挖掘、数据清洗以及SQL增强,可以作为机器学习中的特征库来更好支持地模型训练中的前期数据准备工作。
典型客户:
中国移动、北方健康
代表厂商评估:
睿帆科技
厂商介绍:
广州睿帆科技有限公司(简称“睿帆科技”)成立于2015年,是以大数据及人工智能核心技术为客户提供平台产品及服务的高新技术型企业,公司拥有来自Teradata、华为、阿里、摩托罗拉、Nokia等机构的大数据技术团队,以及自主创新的数据智能全生命周期产品体系,在海量数据治理与计算方面有着深厚的技术沉淀。多年来已经服务过通信、公安、轨道交通、政务、金融、应急等行业。
产品服务介绍:
SnowballDB是睿帆科技自主研发的用于联机分析处理OLAP的MPP 列式数据库管理系统,SnowballDB提供PB级别大数据集的在线多维查询和分布式存储,适用于海量结构化数据存储、高并发点查询、高吞吐即席查询和多维实时分析场景。目前主要在运营商行业有广泛应用,SnowballDB服务过北京移动、四川移动等大型客户,并且在轨道交通、公安、金融、政府、应急等行业有落地应用。
厂商评估:
SnowballDB具备大规模数据量、高并发场景下的即时查询分析能力,能够保证数据副本的最终一致性,提供高可用的数据服务,尤其在运营商行业拥有丰富的实践经验。此外,SnowballDB提供多种安装部署方式、可视化监控管理平台和数据库周边工具,支持SQL查询和多种函数。SnowballDB可以作为独立的OLAP引擎,或者与Baymax大数据科学平台结合构成大数据仓库解决方案。
SnowballDB提供PB级分析数据的列式存储,支持数据的实时在线查询分析,尤其在运营商等行业超大数据规模、高并发、低时延要求的场景下具备优势。
在超大规模数据的查询分析场景下,SnowballDB通过对列式存储格式和数据压缩技术进行重构,减少了数据存储空间和I/O资源消耗,提升了查询速度,达到每秒上亿行的吞吐能力。同时,SnowballDB采用向量化执行技术,可以跳过不必要的数据,仅加载必要的列数据来最大化CPU的资源利用率,以此获得更高的吞吐能力。
在高并发、即席查询的场景下,SnowballDB支持上千台节点的的线性扩展;MPP集群采用Share-nothing 节点架构,读写操作可以在多个节点并行执行,并且通过自动均衡节点负载来大幅提升集群整体性能;而且SnowballDB支持写入和查询同时进行,允许在数据库运行时创建表、加载数据和执行查询,无需重新配置或重启服务。
此外,SnowballDB核心代码采用C++开发,执行速度快于Java语言编写的数据库;LLVM 动态编译能够根据数据和硬件配置,动态生成优化的机器代码,极大提高代码执行效率。
例如,SnowballDB的某省级运营商客户服务覆盖近亿用户,单日增量数据超过500T。应用SnowballDB提供的PB级联机分析能力,使各业务部门可以自主进行海量数据的在线查询和多维分析。同时,SnowballDB支持多人多地高并发查询的需求,解决了数据更新不及时、查询响应延迟高、分析维度受限等问题,大幅提高了该运营商客户数据服务的效率和水平。
SnowballDB能够提供可靠的数据副本的最终一致性,容灾机制保证了数据服务的持续可用。SnowballDB具备多副本备份功能,可以在不同的节点上维护相同的数据,副本内数据发生变化时系统会以异步的方式同步至其他副本,达到所有副本数据的最终一致来保证服务的可靠性。如果节点如发生故障,则自动切换由备份副本提供服务,保证数据服务的持续可用。此外,SnowballDB支持数据跨中心备份,数据能够自动同步恢复,适用于重要系统的跨中心灾备体系。
SnowballDB在数据库的安装部署、使用等方面具备高易用性,配套工具提供了多样灵活的使用方式,分析人员可以使用SQL语句进行快速查询分析。
SnowballDB支持多种安装部署和监控管理方式,可以通过Ambari 开源平台的图形化安装配置和RPM安装包等方式进行安装部署;SnowballDB配套了可视化的监控管理平台,能够对集群节点实施监控预警,展示资源使用和运行状态等多项指标,提供包括数据库管理、用户管理、集群管理、副本配置管理在内的数据库使用全生命周期的功能支持。
SnowballDB配套了完备的命令行客户端、数据备份、数据迁移、数据导入导出等工具,并且支持JDBC、ODBC 连接,可以方便对接各类主流可视化平台和BI 工具。
为了帮助分析人员快速上手使用,SnowballDB内置了多种表引擎,可以直接访问HDFS / Kafka / MySQL 等外部数据源,并且提供完善的SQL 支持和多种高级函数,能够进行复杂查询和多维分析。
SnowballDB可以作为独立的OLAP 分析引擎,或者与Baymax大数据科学平台结合提供数据仓库提供服务,适用于多样的大数据应用场景。SnowballDB通过接口和客户端,可以作为独立的OLAP引擎提供数据服务。或者,SnowballDB可以结合Baymax的全息数据集成和开发应用能力构成大数据仓库的解决方案,Baymax大数据科学平台基于Hadoop框架,适配各类结构化、半结构化、非结构化数据,能够通过数据处理功能构建统一规范的数据池,并利用数据编排工具将分析所需数据推送至SnowballDB,由SnowballDB提供查询分析服务。
典型客户:
北京移动、四川移动、广东省公安厅机场公安局、广州市公安局白云区分局
4.3 ? ? 超融合数据库
市场定义:
超融合数据库是指在内核层面采用模块化和插件化的架构,通过插拔不同类型的数据引擎,实现对不同模型数据进行处理能力的数据库。超融合数据库能够支持用户在一套系统中统一处理关系、图、时序、文档等多种模型的数据,并同时具备事务和分析处理、流和批处理的能力。
甲方终端用户:
金融、制造、泛互联网行业企业的IT部门、大数据部门、科技创新部门,以及相关业务部门
甲方核心需求:
随着企业业务类型以及数据应用场景的多样化,对多种数据模型进行处理变成了企业的常态化需求。在传统的解决方案中,企业会针对不同数据模型,不同应用场景部署多种类型的数据库系统,但这种方式会造成用户在跨数据库做联合分析时操作流程非常复杂,并且多套系统的维护成本也很高。由于超融合数据库能够使用户用一套数据库系统满足对多种模型的数据进行处理的需求,并在保证性能的前提下简化了系统架构,降低了运维成本,近年来正被一些领先企业所采用。企业对超融合数据库的核心需求包括:
能够在特定业务场景中支持对所需的多种数据模型进行处理。如在营销场景中对人群偏好进行分析时,企业需要数据库支持对关系型数据、图数据、搜索引擎等模型数据进行联合分析;在高端制造业有大量物联网设备的生产场景,企业需要数据库支持对关系型数据、时序数据进行联合分析,并支持事务处理。
在支持多种数据模型的前提下,数据库的使用和运维尽量简化。在数据查询分析方面,企业需要数据库支持使用统一的查询语言来简化跨模型的联合分析,降低对用户的技能要求。在数据库运维方面,企业需要数据库简化其系统架构,无需针对不同数据模型建立不同的开发和运维体系。
具备与专用数据库同等或更高的性能。由于目前企业主要是在一些新兴的业务场景中采用超融合数据库,而这些场景通常具备数据量大,对于查询分析结果的时效性要求高等特点,因此,企业在这些场景中使用超融合数据库需要避免数据库为支持多模型数据的而牺牲数据库的运行效率,从而获得较高的数据查询分析的性能。
能与主流的数据库生态在一定程度上开放和兼容。为了与企业内部存量业务和数据系统进行对接,超融合数据库需要支持开放的标准接口,满足用户跨系统的数据迁移、ETL需求,以及能够与常见的计算引擎无缝对接;同时,超融合数据库需要与常用第三方数据库生态工具兼容,满足数据库运维管理中的诸多功能需求。
产品稳定可靠。与企业对其它数据库产品的要求一样,企业使用超融合数据库时同样需要其产品稳定可靠,避免使用过程中出现系统故障、数据丢失等问题。
厂商能力要求:
为满足核心需求,超融合数据库厂商需要具备下述能力:
厂商的产品可支持处理多种常用的数据模型,并且不同数据模型之间能够互通互融。为满足企业多种特定业务场景数据分析需求,超融合数据库需要支持关系型数据、宽表、图、时序、文档、队列等常见数据模型,并且这些数据模型之间可以互通互融,使得企业可以通过统一的查询引擎对多模型数据进行联合分析。
能够在数据库中采用创新性的系统架构来简化运维复杂度,并提升其运行效率。具体而言,厂商需要能够在数据库内核层采用模块化的方式,支持插拔针对不同数据模型的存储引擎和执行器,并使用统一的数据存储、统一的SQL访问接口,从而简化系统架构,便于企业后续扩展新的数据模型,以及大幅降低数据库运维的难度。
能够针对不同数据处理需求优化做相关技术优化,获得较高的性能表现。如针对时序场景的写入及查询、单表查询、多表关联分析、机器学习以及OLTP等数据处理需求,厂商在对其进行性能优化后,其性能可以比常见的专用数据库或大数据引擎,如InfluxDB 、Clickhouse、HBase、Spark等相同或更高。
厂商的产品能够对主流的数据库生态开放和兼容。超融合数据库需要兼容多种开源标准接口,如HBase、OpenTSDB、Solr等,并提供数据迁移工具,便于企业对数据进行迁移,实现业务无缝衔接。同时,超融合数据库需要与常用数据库,如Greenplum 、PostgreSQL等的生态工具兼容,满足企业对于超融合数据库的运维管理需求。
厂商的产品稳定可靠,且经过一定企业用户在业务场景中的验证。具体而言,厂商产品需要获得一定数据库企业用户的采用,并在实际的业务场景中能够稳定可靠的满足用户需求,获得企业用户的认可。同时,厂商需要在产品中提供多副本存储、企业级备份能力等,保障数据的可靠性。
入选标准:
1. 符合超融合数据库的厂商能力要求;
2. 近一年在该市场服务客户数5家以上;
3.近一年该市场相关服务收入规模在500万元以上。
代表厂商评估:
YMatrix
厂商介绍:
北京四维纵横数据技术有限公司(简称“YMatrix”) 成立于 2020 年,是一家创新型基础软件公司,致力于物联网时代新一代数据基础设施软件的研发,并提供相关产品、解决方案及一站式商业服务。公司在业界率先提出超融合数据库理念,并发布了 YMatrix 超融合数据库,基于独创的多微内核开放架构,在单一数据库之上,实现多模态数据的融通管理,及全场景查询分析的统一支持。
产品服务介绍:
YMatrix 超融合数据库(简称“YMatrix”)是同时支持在线事务处理(OLTP)、在线分析处理(OLAP)和物联网时序应用的分布式超融合数据库产品,具备严格分布式事务一致性、水平在线扩容、安全可靠、成熟稳定、兼容 PostgreSQL / Greenplum 协议和生态等重要特性。在万物互联的时代,YMatrix可面向物联网应用、工业互联网、智能运维、智慧城市、实时数仓、智能家居、车联网等场景,提供架构简洁、功能丰富的数据基础设施,并已在多家行业头部公司成功实现商业化落地。
厂商评估:
YMatrix超融合数据库产品稳定可靠,支持关系数据、时序数据、GIS 数据、JSON 数据、文本数据、图片等多类型数据的统一处理,简化技术架构,从而降低企业在数据库选型、使用和运维时的成本。YMatrix超融合数据库在OLAP和时序数据处场景具备突出优势,适用工厂数据基座、智能网联汽车、物联设备智能运营、实时数据仓库等场景,且能保障较高的性能。同时,YMatrix具备较完善的数据库生态工具。
YMatrix超融合数据库产品稳定可靠,且经历过大规模工业生产场景的使用和验证。YMatrix产品是在分析型数据库Greenplum和关系型数据库PostgreSQL的基础上,做了大量原创性研发工作而构建。由于Greenplum和PostgreSQL技术稳定成熟,且YMatrix的研发团队曾有Greenplum的研发经验,因此YMatrix的稳定性和可靠性得以保正。同时,YMatrix已经在工业生产场景经历过多家头部企业的使用和打磨,使得其针对工业场景的产品性能稳定、功能完善,应用能力较强。
YMatrix超融合数据库功能丰富,支持多种数据模型,尤其适用于OLAP和时序数据处理的场景。YMatrix内置多个微内核数据引擎,实现了对关系型数据、时序数据、JSON数据、键值数据、GIS数据、文本、图像等多种数据模型的广泛支持,并在数据操作层面支持以标准SQL实现跨数据模型的写入、建模、查询等操作。YMatrix尤其适用于OLAP和时序数据处理的场景,如车联网、智能制造、智慧能源、智慧交通、智慧城市等领域,可应用于工厂数据基座、智能网联汽车、物联设备智能运营、实时数据仓库等场景。
YMatrix超融合数据库技术架构简化灵活,大幅降低了企业需要运行多种类型的数据库选型、部署以及后续的运维成本。YMatrix采用了创新的“多微内核开放架构”技术架构,实现了数据库的“多核“,面向OLTP、OLAP,时序等场景,每个内核由不同的存储引擎和执行器组成,并针对前述场景专门优化。
基于这样的架构,企业后续可以通过YMatrix增加面向新场景的微内核,方便地进行数据分析场景的扩展,避免重新选型和部署一整套新数据库的高成本。同时,YMatrix配备了完善的安装、监控、报警、扩容、容灾等数据库管理运维功能,并可以对多种数据模型进行统一管理,大幅降低了企业部署多套数据库系统的运维复杂度以及运维成本。
例如, 理想汽车在引入 YMatrix 后,在同等数据规模下,整体服务器用量减少三分之二,指标开发周期从按天计算大幅压缩至小时级,同时数据入库速度及查询性能均大幅提升。
YMatrix超融合数据库在时序等各类数据使用场景具有较优异的性能表现。YMatrix针对写入和分析等重点领域进行了多达138项深度的指令级的优化。在时序场景的写入能力上,YMatrix在真实的生产场景中写入速度可达1.52亿数据点/秒,满足了新能源汽车(理想汽车)、重型装备制造(三一重工)等行业客户对于超大规模时序数据的写入速度要求。在时序场景的查询性能上,YMatrix的查询耗时在基准测试中是目前国外主流时序数据库的1/5左右;
此外,在单表查询性能上,SSB基准测试结果表明YMatrix比ClickHouse快27%;在多表关联分析性能上,对比MPP数据库主流厂商,YMatrix实现了数倍的性能提升;在机器学习场景性能上,YMatrix库内机器学习性能相比Spark提升了8倍;在OLTP场景下,TPC-B国际标准测试结果表明,YMatrix主键查询TPS高达160万,而绝大多数低于TPS5万的水准。
YMatrix 超融合数据库支持库内机器学习,生态兼容完备,可以满足企业用户多种类型的数据分析需求。YMatrix 是国内率先具备库内机器学习建模能力的数据库产品,支持通过 Python/R 等语言构建算法模型,并直接在数据库内进行分析运算,帮助用户大幅消除数据的迁移/加载作业量,显著提升数据利用效率。
例如:三一重工在预测性维护业务中建立需要基于大量设备数采数据做建模分析,在使用 YMatrix 后,相比过去的 Hadoop + Spark 组合, 不仅技术栈复杂度降低,同时运算速度提升了约 5 倍。同时 YMatrix 全面兼容 Greenplum 和 PostgreSQL 的上下游生态链工具,并支持通过数据联邦对接多类型数据源,满足企业用户在各种复杂分析场景下的数据迁移、ETL、监控及分层存储需求。
典型客户:
理想汽车、小米、三一重工、浪潮、BYD
4.4 ? ? 图数据库
市场定义:
图数据库是以点和边为基本存储单元,为高效存储、查询图模型的数据而专门设计的数据管理系统。在图模型中,数据是以点和边的形式存在,“点”表示实体,“边”表示实体间的关系,从而可以清晰展现数据间的关联关系。图数据库需要将数据以丰富的关联关系表示、支持图查询语言的访问和解析等功能。
甲方终端用户:
金融、政务、能源、泛互联网等行业企业的IT部门、大数据部门、科技创新部门,以及相关业务部门
甲方核心需求:
随着企业业务类型以及数据应用场景的多样化,对于数据之间的关系挖掘逐渐成为典型的业务需求。企业需要将看似离散的数据通过一定的关联关系进行连接,并运用可视化技术描述数据之间的相互联系。例如,知识图谱、金融反诈、社交网络、智能物联网等业务应用下,需要对图数据进行高效的查询和计算。由于图数据库相比传统的关系型数据库具备对图模型数据更加高效的存储和查询性能,近年来被许多企业所采用。企业对图数据库的核心需求包括:
高性能的图存储和计算。金融、政务、能源等行业有大量图模型的应用,例如金融风控、反欺诈、能源管理等。企业希望图数据库相比关系型数据库拥有更高的图模型存储效率和更低的存储成本,并且在多度关系或者多点遍历的复杂关系查询上更具备优势。
快速上手的查询分析功能。由于图数据库目前没有统一的标准查询语言,并且图分析的使用对于专业知识的要求程度较高,业务分析人员可能会缺少相关的知识技能上手使用。因此,企业需要图数据库具备一定的功能设计来降低图数据库的使用门槛,方便图数据的查询分析以及图算法的应用。
具备高可用和一定的稳定可靠性。企业需要图数据库具备一定的防范和恢复措施来应对突发的服务中断情况,保证数据服务的高可用性,避免数据错误、数据丢失的发生。同时,作为图数据应用的底层支撑,企业希望图数据库能够平滑稳定的运行,并且具备一定的服务响应灵敏度。
此外,部分企业对于图数据库还有以下期望需求:
能够支持行业知识图谱。作为图数据最基本和广泛的应用,知识图谱在金融、公安等行业有大量的使用需求。因此,企业希望图数据库厂商能够提供行业知识图谱的整体解决方案。
能够进行云化部署。由于数据上云趋势逐渐明显,部分企业希望将图数据库同其他数据库一起在云上部署,方便总体资源的规划和管理。
满足信创要求。在公安、政务等敏感度较高的行业,企业需要使用核心技术自主可控的产品来保证数据的安全性,因此会依据信创测试报告或信创名录进行选型。
厂商能力要求:
基于上述核心需求,图数据库厂商需具备以下能力:
厂商的产品具备高性能图存储和计算能力。厂商产品能够通过分布式部署实现大规模的图数据存储,并且保证高效的图数据访问读取。在对于数据关系的分析上,厂商产品要能够实现全图查询、遍历迭代的高效性,并且能够完成多样的图分析算法。
厂商的产品具备易用性。在图数据的查询上,厂商产品的查询语言能够让用户快速上手使用,并且需要支持常用的图算法。此外,厂商需提供可视化分析工具以及常用的分析函数,使得业务用户可以通过拖拉拽的方式在常用场景,如信用卡套现、贷后失联修复、客户贡献度评价等,快速实现图分析功能。
厂商产品能够稳定可靠地运行,并且持续提供可用的服务。厂商产品具备一定的数据冗余机制,满足分布式下的数据一致性,而且在服务器出现故障时能够保证数据不丢失且服务持续可用。此外,厂商产品经过多场景的打磨验证,能够满足金融、政务、能源等行业不同应用场景下对于图数据库稳定可靠运行的需求。
针对部分企业的期望需求,图数据库厂商需具备以下能力:
厂商能够提供针对不同行业提供知识图谱解决方案。厂商能够依据行业需求提供金融、政务、能源等行业的知识图谱解决方案,输出包括图谱构建、开发工具等在内的知识图谱整体解决方案。
厂商的产品能够采用云原生技术。面对企业数据上云的需求,厂商需要提供图数据库的云化部署,并且应用云原生技术实现企业资源隔离、多租户等需求。
厂商的产品要满足信创要求。在敏感度较高的行业,厂商产品需要通过信创测试来证明技术的自主可靠性。此外,由于某些企业进行了全国产化软硬件部署,厂商产品也需要做相应适配保证在国产化IT环境中的顺利运行。
入选标准:
1. 符合图数据库的厂商能力要求;
2. 近一年在该市场服务客户数5家以上;
3.近一年该市场相关服务收入规模在500万元以上。
代表厂商评估:
海致星图
厂商介绍:
北京海致星图科技有限公司(简称“海致星图”)成立于2015年,公司通过自主可控的知识图谱、大数据等核心技术,提供金融、能源、制造、智慧城市等政府机构与企业级用户数字化转型的产品和服务,帮助用户构建数据驱动的管理运营体系,赋能决策智能。海致星图目前已服务建设银行、工商银行、招商银行、上交所、深交所等70多家银行、券商、保险等金融机构及国家电网、南方电网等大型能源企业。
产品服务介绍:
海致星图AtlasGraph图数据库,是基于Rust自研的新一代云原生分布式实时图数据库,具备高性能图计算引擎、类SQL的图查询语言、分布式存储引擎等内核技术,能够支持复杂的数据挖掘和机器学习场景。海致星图AtlasGraph图数据库支持万亿量级数据存储分析及流式计算引擎的结合,支持数据实时入库构图,为在线业务决策分析提供有力支撑。同时,AtlasGraph预置了20余种图计算算法及上百种分析函数,并配套可视化操作分析平台提供丰富的分析管理功能。AtlasGraph目前主要应用于金融、政务、能源等行业。
厂商评估:
海致星图AtlasGraph图数据库在稳定可靠和安全性、数据服务的高可用性、存储计算性能、HTAP混合负载能力方面具备优势,产品技术自主可控且适配国产软硬件,具备易用的查询分析和管理功能,云原生技术支持AtlasGraph的云上部署并提供容器化、自动化的数据服务方式。海致星图在金融、政务等领域有包括行业知识图谱等在内完善的解决方案输出能力,其自研的图数据库和解决方案适配度高,并提供针对性优化。
AtlasGraph具备高可靠性和安全性,并能够为企业提供高可用的图数据服务,尤其在金融、政务等行业拥有多年的服务经验。AtlasGraph支持分布式下的多副本存储,能够在部分服务器出现故障时保证数据不丢失且服务持续可用。AtlasGraph内部通过一致性协议保障数据读写的完整性和一致性。同时,AtlasGraph采用Rust语言编写,为数据库提供了安全的内存管理和访问机制,并保证了任务并发场景下的稳定性。
AtlasGraph的分布式引擎具备高性能的存储和计算能力,能够提供大规模集群与万亿规模节点数据的全量存储,支持万亿大图实时分析。在分布式部署下,AtlasGraph可以整合多台服务器的存储计算能力提升系统整体性能,在低成本的部署条件下提升高并发场景处理能力,并加速对于慢查询的处理速度。AtlasGraph的分布式数据存储,及其shared-nothing和存算分离的系统架构,方便数据库通过横向扩展来应对更高负载和更大数据量。在语言层面,Rust语言编写能够在保证数据安全稳定的情况下达到与C/C++编写同样的高性能。此外,自研的图原生存储技术、图数据在外存的编码优化、分布式下的数据划分和数据读写优化帮助AtlasGraph突破了对数据访问的性能瓶颈。
AtlasGraph支持HTAP混合负载,并支持图数据的实时分析。在OLTP场景,AtlasGraph可以支持对关系相对稀疏的数据进行高效的读取和写入,并满足高并发低延迟的场景需求,例如一度、二度的关系分析,AtlasGraph可以在毫秒或者亚秒级完成,对于深度关系查询,如6度关系查询,AtlasGraph可以在秒级完成。在需要对全图数据多轮迭代计算的OLAP场景,如page rank、连通性分析、社区划分、图神经网络 GNN等。AtlasGraph同样提供了高性能的图计算引擎,支持快速的在线计算。AtlasGraph提供实时的数据分析能力,支持数据实时采集入库,并且数据导入过程和上层计算并行执行互不影响。此外,海致星图在图技术领域积累了多年在金融、政务行业的服务经验,让AtlasGraph能够针对客户常用的查询模式、分析算法、并发访问效率等方面进行大量优化,提升执行效率和算法效果。
AtlasGraph具备良好的易用性,提供可视化的操作和分析平台,并支持类SQL的查询语言并内置上百种分析函数。AtlasGraph提供便捷易用的可视化操作和分析平台,降低了图数据库的使用难度,并且为用户提供了丰富的计算分析和管理功能。在图数据的查询分析上,AtlasGraph提供类SQL的图查询语言AQL (Atlasgraph Query Language),并内置了上百种的计算和分析的图算法。在此之上,AtlasGraph对内置算法的参数和性能进行了调优,并封装成用户可以直接上手使用的函数,降低了用户查询分析的操作门槛。
海致星图拥有丰富的行业级解决方案经验,能够针对不同场景提供完备的方案设计。海致星图服务金融、能源、制造等行业多年,沉淀了深刻的业务场景认知和丰富的行业落地经验,能够针对不同客户所需的查询分析算法、数据特点、写入查询模式进行图数据库的相应优化,并且结合自身产品体系,对企业输出包含图数据库、数据库周边工具集、知识图谱平台在内的行业级解决方案。
例如,在知识图谱的解决方案中,海致星图提供金融、制造、能源等行业知识图谱,同时,海致星图的图平台、图算法团队会在知识图谱和图机器学习等层面与客户进行需求沟通,并针对相应的建模方式和分析算法进行设计优化,结合数据库内核在存储计算、上层算子支持等方面的改进,输出系统性的解决方案。
AtlasGraph技术自主可控并适配国产软硬件,满足企业信创要求。在企业资质上,海致星图目前已是信创工委会成员单位。同时,基于多年的图数据库领域研发经验积累,海致星图已成为多个国家级和国际级图数据库标准的制定方之一。在产品资质上,AtlasGraph图数据库是海致星图全栈自研的产品,已通过中国软件评测中心的“信息系统安全测评”并被收录至相关信创产品名录中,满足技术自主可控的要求。在国产化适配上,AtlasGraph图数据库已与包括飞腾、海光、龙芯等在内的六大国产CPU、以及主流国产操作系统、服务器等基础软硬件完成兼容适配,能够支持在不同类型的国产IT环境中使用。
AtlasGraph采用云原生技术顺应数据上云的趋势,支持企业图数据库的云化部署并提升了资源管理效率。面向大型企业用户,云原生技术支持AtlasGraph在企业的私有云环境中部署,并且提供多租户的资源隔离、权限控制等功能需求。此外,云原生技术为AtlasGraph提供故障自愈的能力,帮助企业降低了运维的难度和成本;资源的自动调度和动态扩缩容能力,提高了资源的分配和使用效率。
典型客户:
中国某期货交易所、某国有大型银行、江南农村商业银行
4.5数据库云管理平台
市场定义:
数据库云管理平台是面向企业多类型数据库、多云部署环境,提供统一数据库管理服务的平台。数据库云管理平台具备安装部署、迁移、备份、监控告警、巡检、性能分析、智能运维、安全管控等数据库全生命周期管理能力。此外,部分厂商提供的数据库云产品还具备了对多云资源进行调度管理的能力。
甲方终端用户:
各行业企业的IT部门、大数据部门、科技创新部门,以及相关业务部门
甲方核心需求:
近年来,数据库的市场格局发生了深刻变化,出于满足国产化替代、应对更多样的应用场景、以及降低成本等考虑,企业对各类国产和开源数据库的需求日趋强烈,然而国产和开源数据库管理运维相关的生态工具相对欠缺,导致企业在使用这类数据库时面临诸多困难。与此同时,数据库云化的趋势使得数据库的运行环境从物理主机转变为各种虚拟化、私有云、公有云,又给数据库的管理运维带来了更的高的复杂性。面对这些挑战,数据库云管理平台能够有效解决多数据库多元化、多云部署带来了的诸多问题,正被一些大中型企业采用。企业对于数据库云管理平台的核心需求包括:
具备数据库使用全生命周期管理运维功能。为使数据库在使用过程中能够稳定可靠的运行,并满足各类管理运维要求,企业需要数据库云管理平台能够面向企业内运维、DBA、开发、业务等各类人员提供数据库全生命周期管理运维功能。
具备对多元化数据库的管理能力。大中型企业内部业务线林立,相应地,企业内部会逐渐部署多套、多类型的数据库系统,对这些数据库进行管理运维逐渐变得更加分散和繁重。因此,企业需要数据库云管理平台支持多种常见类型数据库的管理能力。
使用门槛较低。由于当前企业对多元化数据库的使用需求不断增加,但与此同时,企业又普遍缺乏对多元化数据库进行管理的人才和技术。因此,企业需要数据库云管理平台具备对多元化数据库进行管理运维的自动化和智能化的能力,降低平台的使用门槛。
此外,部分企业对数据库云管理平台还有以下期望需求:
能够对多云资源的进行统一调度管理。随着企业内的数据库逐渐部署各种基于虚拟化或容器化的环境私有云、公有云、混合云环境,对多云资源进行统一调度管理变成了企业面临的一大挑战。因此,企业需要数据库云管理平台使用云原生技术来屏蔽多种异构基础设施的复杂性,并具备资源弹性伸缩、资源隔离能力。
厂商能力要求:
基于上述核心需求,数据库云管理平台厂商需具备以下能力:
在数据库管理运维方面有长期的服务经验积累,能够提供数据库管理运维全生命周期的功能。具体而言,厂商需要在其数据库云管理平台产品中提供包括迁移工具、安装部署、备份、扩展、监控报警、高可用、SQL优化、SQL审计、性能视图等在内的完善的数据管理运维能力,满足运维、DBA、开发、业务等各类人员的需求。
对多种主流国产和开源数据库有深入理解,使平台支持对这些数据库的管理运维。厂商需的数据库技术专家需对主流的国产和开源数据,如Oracle、MySQL、PostgreSQL、TiDB、达梦、人大金仓、TiDB等,的功能特性有深入理解,在平台中提供对上述多种数据库进行统一管理运维的能力。
能够将数据库管理运维功能代码化和自动化。一方面,厂商需要具备大量数据库管理运维的最佳实践,并将这些最佳实践的管理经验代码化,形成数据库云管理平台的标准功能;另一方面,厂商需要能够在数据库管理中运用机器学习等AI技术,以自动化、智能化的方式实现监控、巡检、审核、诊断等功能。从而减低平台对用户的技能要求。
针对部分企业的期望需求,数据库云管理平台厂商需具备以下能力:
厂商需能够在数据库云管理平台中引入云原生技术,具备对多云资源的调研度管理能力。具体而言,厂商需要具备Kubernetes、Docker等云原生技术的研发能力,并对操作系统技术有深入理解,能够利用云原生技术在数据库管理中,统一管理公有云、私有云、混合云等多种异构的基础设施,同时能够在数据库系统运行时,使其能够实现资源的弹性伸缩,以及多租户的资源隔离。
入选标准:
1. 符合数据库云管理平台的厂商能力要求;
2. 近一年在该市场服务客户数5家以上;
3.近一年该市场相关服务收入规模在500万元以上。
代表厂商评估:
沃趣科技
厂商介绍:
杭州沃趣科技股份有限公司(简称“沃趣科技”)创建于2012年,创始团队为原阿里去“IOE”时期数据库团队的核心骨干,从事数据库生态平台领域产品研发多年,产品覆盖全球主流数据库和云原生技术架构,提供数据库全生命周期的云平台解决方案。公司现有上百位资深数据库及系统技术专家,累计服务近3000家企业客户,产品主要应用于证券、保险、银行、能源电力、医疗、广电传媒、电信、快递物流、公共事业等行业。
产品服务介绍:
沃趣科技提供中立的企业级数据库云,产品包括数据库私有云PaaS平台 QFusion、公有云RDS产品Squids、国产化替代(数据库一体机)三大类。其中数据库私有云PaaS平台QFusion面向企业数据库多元化的场景,提供了覆盖数据库使用全生命周期的各类功能,在金融、通信、医疗、制造等十余个行业均有落地案例;公有云SquidsRDS产品面对数据上云的趋势,为企业提供了便捷易用的数据库公有云服务。数据库私有云PaaS平台QFusion与公有云RDS产品Squids共同构成了沃趣数据库云平台产品体系。
此外,沃趣科技打造了高性能的数据库一体机整体解决方案,包括以Oracle为主,实现去“I”去“E”的高性能数据库私有云平台QData、以及全国产化适配的QFusion-C、与达梦数据库联合研发的国内首款全栈式一体机QDM等三种数据库一体机,主要适用于用户的核心交易系统、主备灾备系统、数据仓库和大数据云平台。
厂商评估:
沃趣数据库云平台在功能完备性、稳定可靠性、数据库纳管多元化和易用性等方面具备优势,产品引入云原生技术为企业提供了数据库平台即服务的能力,同时研发团队将自身多元化的技术背景和丰富的一体机研发经验融入了沃趣数据库云平台的设计中,实现了数据库整体性能的提升。
沃趣数据库云平台提供了面向各类数据库终端用户的功能,可以充分满足数据库使用全生命周期的各类需求。沃趣数据库云平台为企业提供了DBA用户关注的迁移、备份、扩容、容灾、SQL审计优化,以及运维用户关注的监控报警、性能视图等功能。同时,平台基于云原生技术,以及将数据库管理运维经验代码化,让业务人员和应用开发人员只需在平台上通过点选所需的数据库、设置相应的参数等简单操作即可创建和使用数据库。
沃趣科技拥有丰富的数据库云平台服务经验和完善的测试机制,产品具备满足大型企业要求的稳定可靠性。在客户服务经验方面,沃趣科技在数据库云平台产品上有近十年的研发经验,已服务近3000多家企业级客户,在证券、电力、制造业、医疗、教育等40多个行业有落地案例,沉淀了深厚的技术经验来保证产品的稳定可靠性。在产品测试机制方面,沃趣数据库云平台在每个版本发布前要经历上百项疲劳测试和故障测试,同时沃趣科技将售后工单系统中用户的反馈问题纳入到测试场景中,收集了丰富的应用实践案例,产品形成了完善的迭代演进流程。
沃趣数据库平台引入云原生作为技术底座,为数据库用户提供资源自动调度分配和多租户隔离能力。通过云原生技术,沃趣数据库平台能够将底层计算、存储、网络等资源池化,为数据库提供自动化的资源调度分配。同时,云原生技术也让平台可以轻松应对企业内多用户、多数据库实例的情况下资源隔离的需求。
例如,某头部汽车集团使用了沃趣科技基于云原生技术的QFusion产品定制版进行数据库容器化私有云改造,规模达到100多个物理节点,上千套数据库实例。容器化的数据库云平台,使该车企在数据库使用和管理中实现了真正意义的弹性架构,同时也满足多租户需求,方便各个租户随时构建服务自身业务的数据库服务。
沃趣数据库云平台对系统各层面优化实现了数据库整体性能的提升。在数据库一体机上,沃趣科技有近十年的研发经验,产品性能在行业处于领先地位。同时,研发团队成员具备多元的技术背景,对硬件、操作系统和数据库技术等各方面有着深入理解。因此,沃趣数据库云平台能够从PaaS层面实现系统级的优化,保证了数据库整体性能优良。
沃趣数据库云平台能够管理多种国内外主流数据库,并且仍在不断在加入对新兴数据库的支持和服务能力。在数据库多元化的趋势下,沃趣科技的技术专家对不同数据库的特性有着深入的研究和理解,能够充分支持对多种数据库的纳管能力。沃趣数据库云平台目前已能够支持Oracle、MySQL、Redis、PostgreSQL、TiDB、海量信创数据库、达梦、人大金仓等数十种国内外主流数据库,未来会持续投入研究并支持服务更多的数据库产品。
典型客户:
中信证券、国泰君安、国网山东电力、西安国际医学中心、厦门大学
5. ? ?入选厂商列表