2010年就成立的邦盛科技,在金融风控反欺诈领域的资历不可谓不深。但就是这样一家老牌技术服务商,却走了一条不太常规的路子:从成立之初到现在,邦盛有将近一半的时间在全力攻克流式大数据实时处理平台“流立方”,再去开展融资和商用。
现在的流立方,号称有着超高并发与超低延时的特性,同时支持多种复杂事件的计算。从业务版图来看,流立方也正是邦盛整个金融实时风控反欺诈堡垒的顶梁柱。这次,雷锋网AI金融评论就和邦盛科技创始人兼CEO王新宇博士聊了聊流立方的诞生始末。
“流立方”与实时风控系统:和时间赛跑
邦盛的技术思路,逃不开对“时间”的要求。
在王新宇看来,刚刚在线上产生的数据,需要结合历史数据,才能对它进行实时的价值判断,而不是仅分析当前的数据本身:“例如把过去一年所有交易行为的流水全部分析一遍,对比当前才知道有没有风险。”
流立方要成为的,就是这样一个实时大数据处理引擎:兼顾数据的时间跨度和新鲜度,还有计算速度,解决数据倍增、数据处理时效差和数据处理毫秒级需求的问题。
这能为风控反欺诈带来什么?王新宇博士以时间窗口问题为例,更详细地解读了流立方的目的和设计:
比如做攻防模型的时候,一开始想到采用过去三个月的交易平均额放进模型,然后与黑色产业链攻防。但它的欺诈手段如果发生变异,之前的模型可能就失效了,对方能绕过这个模型。
升级的时候,发现当时用的指标,过去三个月的平均交易额不及过去一个月的管用——但如果要以这个时间维度,重新现场计算相关指标和数据,与黑产的攻防交手过程中就已经损失很多时间和金钱了。
流立方做到时间窗口的动态拉伸,也就是(时间上)任意指定起点和终点,在毫秒级给出运算结果。
官方数据显示,流立方集群部署少量节点即可达百万笔每秒,平均延迟在1毫秒左右。王新宇告诉雷锋网,在实际应用中,最复杂的客户延迟大概在6~13毫秒之间;普通的客户基本能达到1~6毫秒。
邦盛科技的一系列风控反欺诈产品,也全数基于流立方这个核心底层技术平台,更强调“实时”这一效果的完成度。在实时风控的整体系统上,邦盛也自主研发了机器学习、关联图谱、设备指纹、人机识别等多项相关技术加以辅助。
尽管在金融风控领域,已有不少企业也表示能够达到实时的效果,例如完成贷款的秒级审批和放贷,不过王新宇认为,授信模型的秒批秒贷,初步需要的数据量并不算大;与交易环节相比,用户对授信的延时情况也没有那么敏感。
但如果要收紧风控尺度,做到深层次的个人信用数据实时分析,还是需要大量实时计算,这正是流立方精通之处:“例如用户过去24小时通话超过5次的对象,这些人又和谁通话超过5次?类似这样的(关系)传播开去,计算量也会非常大。”据悉,平安银行的信用卡网申系统就有采用流立方这一技术平台,并从2016年开始,将所有信用卡相关的交易均以实时模式接入流立方支撑的风控系统。
像银行卡支付这样的业务环节,要求则更为严苛。王新宇介绍称,其合作机构银联,在做反欺诈的时候往回追溯数据,要面对一年1200亿笔的交易流水,日均水平在4亿笔左右,可能还需要在6~13毫秒内完成判别。
熬走三波股东,“流立方”艰难降生
在有这样的业务规模之前,王新宇和邦盛团队的其他成员一起,怀揣着一个宏大的目标,也经历了一段不太明媚的日子——很难想象一家创业公司,成立五年之后才开始进入业务推广期。
最初,创始团队在浙大网新与华尔街的IT服务合作中注意到,国内的金融机构无论是在硬件还是软件上,都依赖国外的基础平台。
“我们就想,能不能研发国人自有的核心基础软件?从理论层创新一直到底层核心的那种,而不是像以前那样:国外软件商提供中间件,国内只是做个业务系统。”王新宇笑言,这也正是邦盛科技名字的由来:
“国邦昌盛——我们想摆脱这种相当于中国企业都在给国外企业打工的局面。”
因为有过不少金融IT分析类的项目经验,也接触过多个相关赛道的国外SaaS服务商,在创业初期,邦盛的团队很快将目光锁定在金融数据分析的赛道上。
他们认为,尤其是国内互联网还有如此庞大的访问量,能把数据分析得又准又快的话,就一定会有市场。
于是在2010年,中国工程院的陈纯院士带领他的弟子们创立了邦盛科技,王新宇也是其中的一员。2007年从浙大计算机学院博士毕业的他,随即和兄弟们投入到流立方的研发当中去。
邦盛科技创始人兼CEO王新宇博士
然而,要让数据分析兼备准确度和速度,这样的研发目标就好比鱼和熊掌兼得,难度也超出了他们的预期范围。
流立方的内部,是一个又一个技术难点。除了前文所述的时间窗口问题,还有内存计算、增量计算、机器学习模型的实时决策等等……原计划最多用三年时间做研发,结果“从成立到现在,差不多有一半的时间都在攻克最底层的东西。”
这样的做法不可谓不冒险。“股东们会觉得,应该接一些开发集成项目来养公司,而不是全部投入到研发上。”王新宇告诉雷锋网(公众号:雷锋网),在流立方的“烧钱研发、不搞收入”期间,邦盛熬走了三波股东。
他回忆,当时股东们认为可以拿一些成型的开源框架稍加修改,先把可用的产品推出市场销售。但在创始团队看来,开源框架的天花板太低了,它的理论模型“技术扩展性不行”。
“如果用开源做了,那基本上只是开源的水平,想要再大幅往前超过它就不太可能了,会受到它各种限制,不如全部从头自己做起。现在从底层开始做的话,就有希望大幅超过开源的性能和能力。”王新宇解释道。
因此,技术团队坚持要先把“独家的东西”做出来。直到2015年,有了流立方和20余项核心专利,邦盛科技才完成自己的A轮融资,正式开展自己的业务。
如今的流立方除了有超高并发和超低延时的特性以外,在扩展性方面也下了功夫:自带可计算分布式缓存,在内存不足时,能够平滑扩展到多节点;能够提供基于Paxos算法的多副本一致性存储机制,确保数据存储的高可靠性。
除了前文所述的平安银行,目前流立方的服务领域包括银行、第三方支付、证券、保险、互联网金融等,邦盛科技合作的大中型金融机构累计近400家——这样的实战案例,也使得他们拥有更多输出标准化方案的底气。
“标准化的路线,是在与头部客户的合作中,不断学习(金融知识)积累而成的。”王新宇告诉雷锋网,近年来邦盛陆续攒下近3000个风控模型,涵盖160+个风控场景;目前邦盛大约仅有10~20%左右的业务以定制化形式交付。
今年6月,邦盛顺利完成了3.5亿元人民币的C轮融资,正式迈入下一阶段。
再持一把重剑
为什么执着于底层技术?“对金融机构来说,太底层的东西,他们反而不会做。”当被问起第三方风控技术服务商的未来,王新宇这样说道。
持牌金融机构加码科技投入,逐渐长出自己的风控能力,很难说第三方风控企业的生存现状不会因此而受到影响,但于邦盛而言,对底层技术的“固执”曾经是一种冒险,如今更是他们在产品同质化严重的行业里杀出重围的武器。
邦盛科技的下一步是什么?2018年的邦盛,重心或许更多放在金融领域的横向开发上,包括保险智能反欺诈、证券量化实时策略计算、网络自动化攻击防御等。
而在2019年,邦盛计划继续以流立方为基础,尝试向金融以外的行业伸出触角。据悉,未来邦盛将在轨道交通、物流、电力、气象、军工、反恐等方面进行相关的产品开发。王新宇表示,一切会产生大量热数据、有望实现热数据价值最大化的赛道都有可能涉足。
更值得期待的是,邦盛正在研发下一个核心技术:多重关系的秒级实时计算。王新宇向雷锋网透露,这一底层基础平台的研发两年前就已启动,目前技术攻关部分已经接近尾声,不久的将来就会进入商用阶段。
雷锋网原创文章,未经授权禁止转载。详情见转载须知。