KLake
虚拟数据中心平台
KLake虚拟数据中心平台
目前,在医疗、高校、政府、金融等行业单位,其数据库数量高达上百个,难以形成统一的访问视图,需要通过ETL等工作,先将其进行集中存储后方能进行后续的分析与数据治理。然而,面对如此庞大的数据资产,通过ETL这种数据移动集中的方式,将存在以下难以回避的痛点:
->高成本
要将分散在上百个数据库系统中的数据进行集中,需要付出极大的时间、人力、财务成本。
->不实时
数据通过ETL移动到集中的中央库后,一方面其数据滞后于生产库,二来移动过来的数据并不是在相同时间点,因此也影响了后续的分析与使用;
->性能压力
通常,各业务库需要承担数据上报、集成平台同步等工作;此时,再增加ETL抽取同步等工作,将进一步加大业务库的负担,影响了业务操作的性能体验。
数据资产管理痛点
KLake是基于Data Fabric数据经纬架构而设计,通过实时链接的方式,将组织内所有数据库统一的组织起来,形成逻辑上集中统一的虚拟数据库系统,从而实现全局数据资产的集中、安全的运营与共享:
->统一访问入口
将组织内所有数据库系统进行集中纳管,形成逻辑上集中的单一数据源,统一对外提供数据共享与访问;
->跨库分析
KLake中的SQL,能够实现跨多个业务库、多种异构数据库进行SQL执行,避免各类数据时间不一致、需要先行集中数据等的弊端;
->为生产库减负
KLake中的SQL执行,首先被解析成若干个小的子SQL,以便可以轻便的从各源库获取数据,然后将在KLake集群节点中进行SQL的关联、汇总等计算。因此,通过KLake平台进行数据分析,可直接从数据源头到报表展示或结果输入,避免了复杂的中间过程,此外,还极大的释放了生产库的性能压力;
KLake应用场景---以医疗为例
KLake是基于Data Fabric数据经纬架构而设计,通过实时链接的方式,将组织内所有数据库统一的组织起来,形成逻辑上集中统一的虚拟数据库系统,从而实现全局数据资产的集中、安全的运营与共享。
技术架构
日常数据上报、各类数据同步等场景,导致核心生产库不堪重负。KLake通过自身的计算集群,实现SQL计算从业务库到KLake平台的卸载,同时提升了SQL的执行效率;
BI 报表
为生产库减负
电子病历、互联互通、等级医院等的评定工作,涉及复杂且众多的指标查询与跨库数据比对,通过KLake平台,可以通过一个SQL,实现对多个数据源的跨库指标比对,避免了传统方式下分步分库的复杂过程;
各类评级中的指标比对
传统模式下,BI报表,需要通过ETL、数据仓库、数据集市等,层层汇总,最终才能生成BI报表,实现展现。
KLake 模式下,用户可以在BI报表中,通过KLake SQL的跨库查询,直接针对各源数据进行汇总分析,并通过BI报表工具,实现对结果的直接展现,从而跳过中间所有环节。
智慧医院建设过程中,各类智慧应用,需要实时的、全方位的数据供给,而传统的数据中台、集成平台等,在实时性、数据全面性等方面,难以满足其应用需求;KLake将全院的所有数据库资源统一成为一个虚拟的数据库,因此,完美的解决了数据实时性、数据全面性的问题,成为院方核心的数据基础设施底座。
为智慧医院应用提供实时数据支撑
留言板
地址:上海市浦东新区张杨路3680号碧云中心16层1625
电话:021-68770597