清华大学金融科技研究院孵化
金融科技与金融创新全媒体

扫描分享

本文共字,预计阅读时间

十年磨一剑,以扎实的步伐深耕数据领域超过十年,并在过去三年实现跨越式高增长发展后,数库科技在2021年世界人工智能大会正式面对公众亮相。

作为本届世界人工智能大会承办单位之一,数库科技举办以 “数据智能,链接未来” 主题分论坛,会中数库科技总裁沈鑫发表了以《数据智能驱动产融数字化转型》主题演讲。

image.png

沈鑫提到,厚积而薄发,此次亮相WAIC,是数库的“成人礼”。在WAIC展区中,数库直接带来了基于虚拟现实技术的沉浸式数据体验,并首次在业内展示了基于产业关系组装市场全量数据的震撼效果。此外,数库还充分展示了基于产业数据引擎在银行对公业务获客、风控、政务产业大脑、智慧招商引资及园区管理、企业采购大脑、量化投资等诸多场景的成熟客户解决方案,多维度展现了数库科技基于长期对数据标准化、结构化及数据融合的反复锤炼,为数字化时代所带来的全方位数字化应用效果。

image.png

在数字化新工业革命时代,数据已成为核心生产要素。由于数据“燃料”的质量将直接影响决策引擎的性能,因此数据能力成为产融数字化转型的核心能力。

在沈鑫看来,在数字化新工业革命时代,数据已成为核心生产要素。由于数据“燃料”质量将直接影响决策引擎性能,因此数据能力成为产融数字化转型的核心能力。在传统投研时代,由于场景单一、数据维度极少,且数据逻辑组装及分析主要由专业人士的人脑来完成,数据孤岛并不是问题。但在如今的数据驱动决策时代,数据驱动决策场景已远超金融投研领域,开始向银行、政务、企业、中小企业等各维度产融决策场景覆盖。在这些决策场景中,数据服务需求发生了质变,数据范围及维度剧增。因此破除数据孤岛,实现数据融合成为实现高质量应用的基础。

从数库实践经验来看,产融数字化决策场景具备很强共通性,无论是银行寻找优质企业进行贷款,还是政府招商引资强链补链,亦或者大型企业实现智能化供应链风控及管理,其决策本质都是不断定位及跟踪动态发展中的优质企业或潜在风险点。因此,通过扎实的数据智能搭建形成完整的产业画像和企业画像,实现对产业及企业周边的实时资讯动态解析及跟踪,进而对目标企业的快速定位及评估,成为产融数字化决策中的核心能力。这些能力结合后,即可形成从产业到企业的完整全景画像,进而实现以数据体系模拟实体经济运转规律,并产生真正的产融数据决策智能。

这个看似理想化的理念如何真正实现的?

沈鑫提到,数库在实现产业到企业的完整动态全景画像中发现,所需攻克的三大壁垒是“量”、“准”、“智”。

首先,解决结构化数据的量产问题。 当今市场现状是数据体量呈指数级增长,80%的数据产生于过去两年内,数据化决策时代的数据需求猛增,决策维度更加复杂多样化。如果基于人工处理结构化数据,这种传统方式既不能满足指数级增长的数据体量,也不能满足数据维度的进一步复杂多样化,且人工处理方式难以实现数据的高度标准化,数据质量非常不规律,难以实现高标准的数据融合连接。

通过现象看本质,通过历史洪流的发展找规律,数库发现制造业的思维最值得借鉴,汽车能够走进千家万户,源于流水线的发明,它彻底改变了汽车的成本结构及生产效率。同样,让数据真正“走进千家万户”,满足产融数字化所带来各行各业多场景的数据需求,现有基于人工处理方式的结构化数据生产方式必须被彻底颠覆,数据生产也需要“流水线”,而且是“自动化流水线”。用制造业思维思考,数库充分利用人工智能技术,将这些前沿科技融入到结构化数据的生产流程中,并实现无缝的人机结合,让高度标准化、结构化数据的自动化量产成为可能,从而形成数据“冶炼”工厂概念。

其次,解决从海量实时资讯中精准提取决策精华,也就是一个“准”字。数库认为,实现精准的决策精华信息提取,必须“手脑并用”。自然语言技术只是工具,配合工具的知识体系才是实现精准提取的关键。比如高中生和医科大学生同时阅读一本医学教材,高中生虽然能够认识教材中所有的汉字,但并不能理解其中的含义,更无法举一反三;而医科大学生不仅可以理解其中含义,还可以举一反三。差距就是大学生脑中拥有“医学知识体系”作为垂直领域的知识库来帮助其深刻理解字里行间的含义。

由此,我们将知识体系与自然语言算法深入融合起来,实现“手脑并用”才能够实现精准提取,能够不断积累迭代垂直领域的知识体系积累,是提升自然语言解析精度的关键。同时,数据量产形成的金融及产业知识体系提升高频资讯的提取精准度,高频资讯的精准提取反哺知识体系,反向再提升数据量产精准。这样,“量”与“准”相辅相成。

最后,谈一下“智”,只有打破数据孤岛,实现链接后才能产生智慧。由于产业关系是唯一可连接市场全量企业的关系,数库通过十年的努力,将市场全部产业及产品进行了标准化处理并实现上下游链接,进而完成一张完整的标准化产业网络,每个标准产品节点上都可以对接数据。

这样一个基于产业网络整合连接后的数据体系,既实现了基于产业上下游结构的数据关联,解决了数据孤岛及信息盲点的问题,同时,由于基于产业的数据结构与实体经济运转规律高度拟合,可进一步挖掘上下游传导及关联效应,为进一步决策建模提供优质土壤。

总的来说,“量”、“准”、“智”的结合形成了以产业逻辑消化解析全量数据信息,可以打造基于产业逻辑的全量数据引擎。

沈鑫提到,大道至简的道理告诉我们,数据“基本功”越扎实,越可以轻松应对产融数字化各类决策场景。比如在金融机构中,银行对公业务的营销及风控,基于另类数据的量化投资,资管、债券舆情监控,ESG投资主题场景;在政府项目上,产业大脑,智慧招商引资场景;在企业服务方面,大企业的供应链应控、产业舆情监控,以及中小企业的B2B精准营销、企业资讯头条等服务。数库在这些场景中的服务都是基于同一个,也就是上述基于“量、准、智”而形成的产融数据引擎,为客户实现了低成本定制,快速部署及简单易用的解决方案,从而创造客户价值。

image.png

沈鑫表示,未来,我们希望基于数库产融数据引擎的不断壮大,让数据智能为更多的行业及企业,实现真正的产业数字化场景落地,让数据智能进一步驱动产融数字化转型。

[Source]

本文系未央网专栏作者发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!

本文为作者授权未央网发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!

本文版权归原作者所有,如有侵权,请联系删除。

评论


猜你喜欢

扫描二维码或搜索微信号“iweiyangx”
关注未央网官方微信公众号,获取互联网金融领域前沿资讯。