扫描分享
本文共字,预计阅读时间。
在银行业数智化转型过程中,如何实现数据智能到认知智能的变迁,使得NLP自然语言理解技术真真实实地落地商业,是行业内关切的问题。新锐人工智能公司虎博科技副总裁谭悦在面向500+银行业、金融科技等领域众多业内专家分享时,便从数据、场景和案例三个方面,分享了新一代金融知识智能实践与应用。
从数据智能到认知智能
关于知识智能,大家都会经常提到知识库、知识图谱。其中较为经典的场景包括搜索、推荐,以及知识图谱的推理等。
以此为切入点,虎博科技把底层数据到上层用户的应用场景中所欠缺的知识提炼步骤打通,将语义的关联和业务的理解,通过虎博平台化的产品,以自助化的模式提供给金融客户。
虎博对数据和知识提炼的过程分为以下步骤:
①整合底层数据,包含外部数据+客户积累数据;
②基于数据进行信息提炼、知识挖掘,构建大数据语义模型,进而实现知识图谱的挖掘和推理;
③依托语义模型的建设,针对用户特定场景提供语义理解和决策支持。
虎博产品体系,贴近行业知识的解决方案
数据源类型是以文本、语音为主的非结构化数据,再结合虎博的信息采集平台和数据治理平台与银行内部的数据进行打通,把外部的资讯、另类数据和网络舆情相关的数据,按照客户的特定场景进行采集与融合,构建一个针对特定行业场景的数据集市。
之后,虎博AI中台会做大量的数据提炼工作,包括信息抽取、语义理解、知识图谱构建、风险事件的挖掘。虎博针对金融(尤其是银行)客户的特定场景做深度定制,同时将定制的过程以中台化的方式自助地开放给客户。
在此过程中涉及到知识中台的建设,主要功能是负责构建实体属性的关联关系,其中涉及到知识图谱推理、分析或者是图计算的场景,均以平台化方式呈现。
智能化时代下,无论是银行、券商或者保险的APP,都有搜索框的形态。最初是从基础产品或者功能的关键词进行搜索,到进一步的语义理解,再到现在可以将业务理解中的关联关系,也在用户的搜索中呈现,就变成了一个可以理解用户需求的智能化机器人。
由于虎博最早是从搜索业务做起的,在搜索智能方面,虎博服务了非常多的金融客户,形成了自有的垂直领域算法模型,可以契合不同金融领域细分行业的需求。
虎博核心产品矩阵
典型场景一:智能搜索
服务对象:C端用户、银行(或金融机构)内员工
银行智能搜索是目前各大银行的典型需求之一。除信用卡APP外,许多银行也推出了自己的理财平台,其中都包含相应的搜索入口。
用户的问题可能要匹配银行传统业务,以及提供对应的增值服务或理财产品,还需要与现下市场热点相关的内容,甚至是商品。例如招行掌上生活的内容越来越丰富,部分板块更像银行的“美团点评”,与用户的生活息息相关,通过这种方式不断增加用户使用银行产品的频率。
虎博提供能够帮助客户实现自定义搜索和数据管理的中台,其智能搜索架构区别于传统互联网垂直搜索的核心在于:基于金融领域结构化的知识库、语义模型,通过底层的深度学习模型对海量内容进行训练,实现理解上百万中文词汇在语义层面的关联关系。
典型场景二:智能知识库
目前机构内现存的一个明确问题,是积累了大量的数据,但数据之间、系统之间是割裂的,这些信息需要平台将知识进行融合,形成层次化。
具体可分为:
①各个异构数据源的打通。包括银行现有外部第三方系统、业务文档、历史存量数据以及外部采用数据等,这些信息将从整个文件存储角度和知识库管理角度打通。
②文档、传统知识库以及基于文档的业务管理。按照部门、权限、关键字进行搜索,针对文档的内容和文档之间的关联进行知识管理和提炼。
③构建与业务相关的分类、标签、数据提炼的体系。这一步需要应用大量的自然语言处理模型,例如数据抽取、摘要、情感分析,甚至是机器翻译。
典型场景三:NLP算法中台
虎博的算法中台可以满足无AI基础的客户进行无门槛操作,自助式完成数据导入、训练和发布,使算法更贴近不同业务的需求,效果提升更加明显。
典型场景四:舆情风控
由于传统金融风控各家都有比较成熟的体系在运作,例如一些企业在暴雷前,网络上已经有大量的负面舆论在不断发酵,它可能存在于公众号、知乎、贴吧、微博等等这样的自媒体中,很多信号是比较离散、微弱的,但是连在一起就可以看到暴雷前的趋势。所以虎博在做的是从舆情角度对公司、债券和对应的产品进行关联的人物或者他们所在的行业、业务的风险的识别。
虎博的舆情风控系统可覆盖包括社交媒体在内的全网信息源,根据不同业务需求,将事件中涉及的主体、人物、情感正负面、事件主题等信息提炼出来,且不断地挖掘相关热点和相对应特定的风险类型,将所有信息可视化。
此外,如315的投诉场景、大众点评的负面评价等散落在互联网各个地方的另类数据,也可汇总到统一的舆情分析平台上,不仅可以对银行的声誉风险进行防控,还可以进行客户及其所对应产品的风险预警。
虎博产品核心特征:以理解业务为前提,以智能为核心
在很多场景下,用户并不一定理解银行内的业务描述,所以通常以口语化方式提问。我们要从底层的数据中做深度挖掘,虽然用户的问题只是一个短句,但是在底层做检索或者分析时,由平台来进行大量的语义和关联关系的计算,最终将结果以数据化、卡片化的模式呈现给用户。
在智能化人机交互过程中要做大量的知识提炼工作,比如我们所看到的一篇新闻、一个产品说明书,如果是有经验的人他才能理解或者向用户讲解,但整个过程需要大量的人工介入。
而现在很多内容机器已经可以进行阅读和理解,并提炼出关键的知识点和数据,将信息以直观的方式反馈给用户。在这个过程中,我们会做大量的数据文本解析、语意理解、知识点挖掘、抽取和关联的工作。并最终以多样化形式呈现给用户。
除了数据图表型、图文、知识点关联关系呈现外,还有以问答式搜索,模拟机器人进行多轮对话的方式。
虎博提供的定制化服务能够满足不同机构客户对应的场景和特殊业务需求,从用户意图的理解出发,对产品和内容推荐优先级进行排序。而此过程需要大量的运营管理工具,总结来说知识中台、算法中台、搜索中台,这些都是可以为客户提供私有化部署的工具,并与内部系统、业务、数据进行对接。
非常感谢您的报名,请您扫描下方二维码进入沙龙分享群。

非常感谢您的报名,请您点击下方链接保存课件。
点击下载金融科技大讲堂课件本文系未央网专栏作者发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!
本文为作者授权未央网发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!
本文版权归原作者所有,如有侵权,请联系删除。