袋鼠云闵佳:立足大数据开发及治理,打造金融行业数字化基础设施
闵佳强调称,“解耦”是当前金融数字化平台的核心竞争点之一,也是当前金融机构极为看重的一点。
图 |袋鼠云CTO、金融事业部业务总经理闵佳
自国务院印发的《“十四五”数字经济发展规划》提出“加快数字化发展,建设数字中国”后,数字化就成为了市场如火如荼的话题。
而作为一个天生就与数字打交道的行业,金融行业理所当然地成为了排头兵。
落实到具体应用,基于AI、大数据等前沿技术,在过去的几年中,我们也在金融领域看到了多种技术升级与应用,包括智能风控、反洗钱、异常交易分析、智能投顾等。但值得注意的是,这些创新性应用的实现,离不开牢固的数字化基础设施,其中,近日,被Gartner《中国分析平台市场指南》列为中国分析平台代表厂商的袋鼠云就是数字基础实施建设者之一,一站式大数据开发及治理平台“数栈DTinsight”是其核心产品。
行业应用之前,围绕“数据”还有几个难题
数字化时代,最重要的几个命题之一就是如何高效率地将数据转化为资产。而现实情况是,随着各类信息系统的上线,数据来源与种类逐渐增多,可能同一类数据也会出现形式不一、标准不一的情况。尤其是在一些小型机构,这些问题更为严重。
这就造成,数据之间筑起了一个个“烟囱”,无法互通有无,也无法高效率复用。
此时,如何采集数据并将作统一管理,以及如何避免无用的重复开发工作、将数据盘活等等就成为了难题。
这方面,袋鼠云“数栈DTinsight”则是将数据工作分为了“存”、“通”、“管”、“用”,全维度解决了数据统一等问题。
比如“存”,顾名思义解决即时数据存储问题,产品主要是大数据平台“EasyMR”,其中涉及到将各处零散数据采集过来,并分门别类整理好,留待下一步使用。对此,袋鼠云CTO、金融事业部业务总经理闵佳补充到,不仅仅是存储,随着数据量的增加,EasyMR还能够依据数据量,计算量大小来动态调整计算能力,实现资源的弹性伸缩。
又比如“通”这一层,主要包括两个产品,分别是离线开发平台、实时开发平台。简单理解,这两大平台主要承担的责任就是将数据采集并整理好,为后续的数据资产和数据服务提供数据“弹药”。值得一提的是,实时开发平台的数据处理速度能够做到毫秒级响应,从而为实时风控、实时营销、实时决策提供强大的技术能力支持。
再看其他两个能力,“管”这一层的定位就是数据资产平台,主要任务就是将企业所有的数据管理好,并基于其中相应数据的关联性、调用频次,提供一个灵活的治理能力;“用”这一层涉及数据服务平台、智能标签平台、指标管理平台3个平台。
截至目前,袋鼠云“数栈DTinsight”也已经与多家金融机构达成了合作,包括银联云、中信银行、华夏银行、中原银行、招商证券、中金公司、银河证券、中信建投、国信证券、华夏基金等等。
比如与华夏基金的合作,双方建立起开箱即用的一站式标签体系与画像分析体系,即便是不懂技术的一线业务人员,也可以快速完成标签的创建、更新等等。而智能标签则可以帮企业快速、精准地为人、物、服务场景等构筑出360°画像,从而让业务人员等准确看到客户或场景需求,从而达成精准营销,以便于更好推进业务实现。
此外,闵佳也向镁客网强调了一点,除了性能稳、功能全、信创等要求,“在金融行业当中,客户要求产品具备非常强的解耦性,比如我们的‘数栈DTinsight’有10个子产品,但客户最终会依据自己的场景需求去购买一个或多个产品。”
这也就意味着,每一个产品都需要能够做到独立输出,需要能够与客户的应用产品相结合。在闵佳看来,这是平台产品的核心竞争点,也是产品化能力非常强之外,袋鼠云的又一主要优势。
同时在信创方面,随着金融信创三期在2022年开始启动并进行大规模推广,未来几年预计会扩容到5000家,会有越来越多的企业要求产品自主可控,国产化等,目前“数栈DTinsight”全部技术自研,不依赖于第三方商业化组件,同时全面兼容国产上下游信创产业链,实现多方产品的兼容适配。例如已经完成了国内主流芯片(龙芯、飞腾)、操作系统(麒麟、统信UOS、中科方德)、服务器(华为鲲鹏、长城、Zstack)、数据库(达梦、南大通用、人大金仓、瀚高)等产品的兼容适配,并取得了官方的信创兼容的认证证书。
局部已“红海化”,大数据基础设施尚是“蓝海”
前面我们也说到,金融行业是“排头兵”。发展至今,金融行业在数字化转型这一块已经相对比较成熟了,局部红海化特征也已经显现。
“如果是做交付服务相关工作,市场是一片红海。”闵佳表示,至于数据基础服务设施,“目前基本上还是一片蓝海,还没有形成某一家特别大的巨头,未来可能经过5年或者更多的时间,竞争会慢慢剧烈。”
袋鼠云作为行业推动者,并不认为竞争是坏事,反而证明行业在繁荣。为了促成行业的繁荣,袋鼠云始终坚持开源理念,助力更多开发者、客户在更多场景让数据发挥了其社会价值。袋鼠云于2018年开始,陆续在技术社区上开源技术项目,为开源社区贡献力量。
最近,袋鼠云还推出了自主开源计划DTstackCon,致力于让开源项目更好、更广泛地惠及行业和市场。
至于新玩家如何在数字化市场中获得位置,闵佳也提供了一些思路。
他指出了两个方向,一个是底层技术平台,比如底层计算引擎,数据库等,“从某个点打入进去,并且做得很深、很透,要么性能做到极致,要么稳定性方面做的非常好,远超出一般服务商的能力或者客户自己的需求预期,从纯技术领域通过技术深度来构建进入行业的能力。”
另一个方向就是从业务端切入,专门做某一块的场景,但正如前面所说,服务侧已经呈现部分红海化的趋势,因而找到合适的切入点也是有难度的,“要么是某个比较深的点,要么是某个具体产业化的领域。”
而回到袋鼠云所在的基础设施平台,也有许多可能性留待开发与完善。
正如前面所说,“如何高效率地将数据转化为资产”是数字化时代的一个重要命题。这就对“数据”提出了要求,也点出了底层大数据开发平台的发展趋势。
“第一个就是在业务上将数据价值化,让数据去帮助业务更好地发展;第二个是在技术端向着实时化演进,比如依据用户行为实时推荐某一类产品,而不是隔天再推荐,到那时时效性已经丧失了。”闵佳表示。
在实时数仓等技术应用上,袋鼠云也积累了诸多的金融行业案例。其中包括袋鼠云和中信建投的合作。通过实时数仓,可以让多个场景可以更加准确快速地运行。例如,在实时资讯场景采用多元数据交叉检验,即实时对足够多的信息原始材料进行交叉检验,智能识别出差异点,及时发出提醒并纠错。这就解决了金融行业资讯来源广且杂乱,容易推出错误信息,继而造成客户投资损失等问题。
而在袋鼠云和东吴证券的合作中,实时开发平台还被应用在融资融券场景,在客户发生大额或异常金融操作时,实时在后台告警,从而可以让机构对此项行为进行标记追踪,以及为机构更正确的资金策略(资金调配等)提供数据支持。
“众多的场景案例,让袋鼠云更懂金融行业的业务需求。可以将技术深度结合场景需求、提升服务和管理能力,也是袋鼠云被众多金融机构选择的原因之一。”
此外他也提到,诸如通过一套代码支持多种数据场景计算,以此来节省成本的批流一体,以及湖仓一体、云原生等也是趋势之一。目前在这一块,这些技术也已经被袋鼠云融入“数栈DTinsight”中。
最后
目前,袋鼠云在金融领域已经持续深耕多年,而在今年,该业务也迎来了新的升级。闵佳表示,公司在今年专门成立了金融事业部,接下来也将在三个方向进行发力。
“第一个是在业务侧,将过往与100多家机构合作过程中接触的各类场景产品化,形成标准化,从而在之后的合作项目中做到快速交付;第二个是在技术端,将继续围绕湖仓一体、批流一体、信创、技术开源、平台安全合规性等相关技术作进一步突破;第三个是数字孪生,将金融业务这类场景通过可视化方式快速呈现出来。”
最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!
硬科技产业媒体
关注技术驱动创新