获A轮融资 他深入300万网站频道挖20亿数据 金融机构放贷审核以秒计
2017-05-16 编辑:
◆作为清华博士,高强带着一批精英创立了“法海风控”。
文| 铅笔道 记者 赵芳馨
?导语
招商银行、工商银行、交通银行等20家大型银行,邓白氏、芝麻信用、万达征信等国内外征信机构,以及支付宝、58同城等互联网金融企业,它们背后有一个共同的服务商——法海风控。
2014年7月,高强创立法海风控,定位于金融风控大数据服务商,服务于银行,金融、征信机构。其系统采集了包含涉诉、税务、工商、环保等20大领域、140个维度的企业信用数据,总量为20亿;再利用人工智能技术将数据结构化,进而为金融机构定制化建模。
从采集数据到建模完成,法海风控一般花费2~3个月时间。传统征信手段依赖于人工调查、写报告,放贷结果往往需一周后知晓;而模型打分、出报告,最快仅需要几秒钟。
今年1月,法海风控获得A轮融资,投资方为雪杉资本和绿禾资本。
硬需求
清华经济管理学院出身的高强,在金融活动中发现了一个“硬”需求。金融机构、银行等需要收集企业的负面信息,因为涉及金融信贷时,企业往往把自己包装得光鲜亮丽,很少主动提供不利消息。
沿着这一思路,他集结了一批清华系的精英,以及花旗、渣打等银行前高管为银行、金融机构、征信企业服务。“法海风控”随之于2014年7月成立,定位于金融风控大数据服务商。
邓白氏(历史最悠久的企业资信调查类信用管理公司)是法海风控最早的合作伙伴。起初,它希望高强及团队做数据采集,其核心是司法数据。
在此之前,邓白氏利用人工调查、编辑数据。但各省市的法院多达3000多家,企业也不局限于在某一地区做生意。“根本没办法单独查。”
而数据采集是法海风控的强项。在清华读博士时,高强创立蔚蓝网络书店,就开发了一套系统,用于采集大量的图书简介、图片信息等。
在原有资源的基础上,团队研发了人工智能系统“小龙人”,其核心之一是天罗采集系统。拟人化的“小龙人”在网上巡逻,查看频道、数据是否增加,若出现新数据则进行采集。
服务邓白氏时,系统扫描追踪了16万个司法方向的网站频道,最终采集3亿多条消息。在客户最关心的数据完备性上,系统基本能实现采集到完备的数据。
随后,法海风控一路走得比较顺利。各大银行也找上门来,希望法海风控为其提供数据服务。
20领域140维度数据
起步于司法数据,但这还远远不够。
很快,客户提出了新需求:能不能把相关新闻也摘出来?利用语义分析,系统把洋洋洒洒的新闻稿变成一句话摘要,比如某企业上市、开展新合作等。其定向语义分析准确率约为98%。
除了新闻之外,法海风控逐步增加了税务、环保、行政处罚等信息,共20大领域、140个维度。为了保证可信度,这些外部信息的背书来自于权威媒体、政府机构等。
每一条采集来的数据,系统均为其打标签。银行中有企业信用的五级分类,而团队发明了风险信息五级分类(已申请专利),包括警告、负向、中性、正向和利好。以企业老板失联为例,“警告”的标签显示了银行最关心的部分——此类事件的性质。
有了标签,团队可以为客户提供更深层次的服务:一是把文本化的数据结构化,可大批量输出;二是建模。
◆法海风控的系统名,如元界、天罗、小龙人等都是中国风。
通过建模,银行等机构得到企业的风险概率,再确定是否放贷。这是一项个性化的需求,因此团队中的专家们制定相应方案,再据此调教人工智能系统,为企业打分。
一般而言,打分的依据是机构的信贷偏好。“有的机构放贷,企业收益要达到30%,有的5%即可。”在此基础上,模型通过2000多个维度字段,算出哪一家企业有问题。
在测试中,法海风控利用外部数据与客户历史数据做对比,计算出的企业不良准确率吻合度约为60.8%。
更显著的是效率的提升。从采集数据到建模完成,法海风控一般花费2~3个月时间。传统征信手段依赖于人工调查、写报告,放贷结果往往需一周后知晓;而模型打分、出报告,最快仅需要几秒钟。“大幅度降低成本,最起码大量的人工就用不着了。”
获A轮融资
随着客户增多,越来越多的机构选择法海风控,比如支付宝(芝麻信用)。“金融信贷圈子不大,靠的是口碑和圈内相互推荐。”
总的来说,这些大体量客户的需求精确,多为定制化服务。但实际上,躺在法海风控后台的两万多家申请试用的企业,只有少部分享有了团队的服务。
而高强并不想放弃顶级客户之下的巨大市场。在他看来,法海的优势在于“人工智能方向上有顶尖科学家”,团队也足够优秀。待到成本降下来,开发出通用简化版模型之后,系统就能大规模推出。
今年1月,法海风控获得A轮融资,投资方为雪杉资本和绿禾资本。在此之前,公司曾获得好贷网的天使轮投资。
因此本轮融资之后,高强计划继续服务更多的优秀金融机构。他着重点出“优秀”二字,若保持现有客户的品质和业务的专精,“在别处发力的前景也是很乐观的”。
截至目前,法海风控每天扫描跟踪300多万个网站频道,采集收录20大领域、140个维度的20多亿条信用数据。未来,他希望这个数据能达到100亿。
而人工智能系统的下一步的目标则是40个领域、400个维度的数据。“这些数据和维度,会产生很多神奇的效果。”对此高强留了一个悬念,“肯定不是现在的玩法。”
/The End/
编辑 孙 娇 校对 石 伟
相关阅读:
相关推荐: