清华大学金融科技研究院孵化
金融科技与金融创新全媒体

扫描分享

本文共字,预计阅读时间

导读:资管科技被称为金融科技的下半场,涵盖投研、交易、风控、营销等多场景;其中智能投研因其业务地位的核心性,可谓是“资管科技的明珠”。我们认为,“智能投研”的核心目标,是通过“数据中台”和“知识图谱”,将“HI”与“AI”有机结合,系统性的对抗个体相较于市场的信息不对称与认知不对称,从而帮助资管机构构筑起可持续、可解释、可追溯的投资研究平台能力,提升核心竞争力。基于过去3年在智能投研领域的实践案例与探索思考,笔者提出:智能投研已经进入“3.0时代”——在本文中,笔者将从建设价值、概念剖析和建设方法论三个维度,解读我们对智能投研3.0体系的理解与实践。

一、Why:重新审视投研系统建设的价值

资本市场是一个典型的非完美博弈市场。投资的本质是基于时间维度做价格预测,赚预期差的钱。预期差来自于信息不对称与认知不对称。信息不对称会导致信息盲点,导致“他知我不知”;而认知不对称所带来的认知盲点,会令人无法充分利用已获得的显性信息,导致“只知其一,不知其二”。

诚然,投资中有很多艺术的成分,即不确定性,因为它本身是相当复杂的群体博弈;如何捕捉预期差,不同的方法论孕育出了不同的投资流派。而在此文中,我们仅探讨其可解释、可模拟、可追溯的部分;因为上述三个特质代表着这部分能力的可沉淀与可复用

基于上文定义的狭义框架,若我们把传统的“研究-投资”过程抽象,那么:市场上的所有信息都是模型的输入端(input),而决策过程是中间的复杂函数(由人脑来执行,基于一定的研究框架或者投资框架),输出端为一个投资信号(基于研究模型)或者投资决策(基于投资模型)。

然而,现实中,人脑是有限注意的(limited attention),再资深的研究员和基金经理都会有不同程度的信息盲点和认知盲点;而研究团队的价值正是帮助投资团队持续对抗组织相较于市场的信息不对称与认知不对称

基于以上论述,想要在资本市场上捕捉预期差,获取超额收益,研究团队需要履行好两大核心职能:

一者,克服信息不对称,扩充组织的信息集,并提升其时效性,以获取信息优势;

二者,克服认知不对称,掌握更广域的知识,建立更完备的框架体系,以甄别更深层、更长期的价值;

因此,建设投研系统,最根本的就是帮助研究团队在这两项职能上强化效力,固化能力,实现研究端向投资端可持续、可衡量、更高效的转化。在这里,首当其冲的,是强调“系统化”,因为“系统化”是组织“熵减”的基础;进一步的,在“投研”的基础上再加上“智能”二字,核心强调信息技术对上述目标达成的牵引与赋能;最终,我们希望通过“系统化”和“智能化”的建设,打造企业“平台级”的“研究-投资”能力。

二、What:如何定义智能投研与智能投研3.0?

第二部分,探讨我们对“智能投研”的理解。

如何定义“智能投研”?我们围绕四个关键词来释义:智能、投研、系统、平台。

何谓投研?狭义者,可以定义为”面向投资的研究”,主体为“研究”;广义者,可以将其拆解,涵盖“投资”与“研究”,我们常说的“投研一体化”指的就是希望实现研究端和投资端的高效联动。在实际的需求分析时,不能将“投资”与“研究”混为一套。

何谓智能?它可以是一个概念,所谓“智能化”是指“事物在网络、大数据、物联网和人工智能等技术的支持下,所具有的能满足人的各种需求的属性”;是传统“信息化”、“数字化”等建设的终极目标。从方法论上,我们提出“智能=数据+逻辑”,强调技术对投研业务的牵引与赋能。

何谓系统?它可狭义理解一套具象的信息技术系统;亦可以将之广义理解为一个”系统化“的理念,系统化是对抗组织“熵增”的底层思维之一,强调对流程的梳理、抽象和规则化定义;对共性能力进行抽离、封装与产品化。

何谓平台?同样的,它也可以狭义的理解为一个具象的系统平台;亦可以理解为一种生产关系与组织形式,强调核心能力的固化和平台对人的赋能,如果每个人都是资源,那么通过“平台化”建设让有限资源发挥更大的价值,通过全局统筹来优化资源配置,在同等投入之下,让组织获取更高产出。

那么,过去的“智能投研”做了什么?我们立足中国本土,将国内“智能投研”的发展划分为3个阶段:

阶段一:智能投研1.0阶段,载体为金融数据与资讯终端,典型代表为Wind、ifind等SaaS金融资讯软件,旨在提供给专业人士一个垂直、及时、全面的信息平台。作为第一代资管领域军备竞赛的红衣大炮,当前此类软件已成为每一个投研人员的必备工具,由于行情数据与财务数据的信息不对称所导致的交易机会在机构投资者之间被基本消除。

这个阶段的典型特征是:

(1)由第三方机构独立提供,无须内部IT团队参与;

(2)软件终端形态,高度产品化、标准化、同质化;

(3)核心为外部公开信息的集中采编、整体与呈现;

(4)内容为传统资讯与数据,无法从信息层面,产生超额收益。

阶段二:智能投研2.0阶段,核心强调的是如何利用技术来提高研究员的研究能力,主要是面向研究部门,核心受众对象为研究员,旨在提升研究工作的效率和效益;围绕研究业务本身展开。

在这个阶段,出现了不少A(AI)、B(Big Data)、C(Cloud)与研究业务结合的产品,典型代表为智能搜索,另类数据,图表解析等,帮助研究员获取信息优势,提升部分dirty Work的效率。

这个阶段的典型特征是:

(1)产品与技术由第三方机构提供,但需要内部IT团队轻度参与(需要私有化部署与运维);

(2)围绕某项前沿技术,寻找与业务结合的落地场景,相对孤立;

(3)形态呈现多样化,包括数据,软件,算法等;

(4)围绕研究工作效率提升这一核心命题展开。

阶段三:智能投研3.0阶段,要进一步强调研究业务的外部性,包括对投资端的转化,和对公司平台能力建设的转化,以实现公司投资能力的可持续、可追溯、可解释;强调对金融机构盈利能力的综合贡献。

在这个阶段,一方面我们不仅满足于对研究工作的效率提升,更关注于公司研究平台能力的建设和向收入端的转化。客户需要的不再仅仅是一个一个孤立的组件,或者一个标准化的软件产品;而是一套因地制宜的解决方案——可以根据每家公司的经营特性、发展规划、IT建设能力与阶段来个性化设计与落地,强调业务闭环与自主可控。

我们认为,在大资管时代下,建立智能投研3.0体系,对金融机构提升中长期核心竞争力至关重要。

这个阶段存在以下典型特征:

(1)in-house团队的持续壮大

  • 内部IT团队和业务部门均更深入的参与建设,将内部建设与外部产品与技术有机集合;
  • 上升到公司战略层面,前瞻的机构往往会设立专项小组甚至部门,通过组织架构调整与制度建设来提升机构数智化转型的步伐,投研数智化是该组织的核心课题之一。

(2)对第三方厂商提出更高的要求

  • 首先,从业务上,对厂商的业务理解与全局思维提出更高的要求;
  • 其次,从技术上,厂商需要掌握更前沿的技术能力与更前瞻的技术理解;
  • 第三,从角色上,厂商不再仅是做被动的需求实现,更要做到主动的业务赋能。

(3)强调开放生态、自主可控的重要性

  • 强调公司平台能力的建设,因此机构需要占主导角色,做到自主可控;
  • 对上游的数据方与下游的应用方都提出开放的要求,并将开放性纳入选型关键要素之一。

(4)强调场景延展与业务闭环思维

  • 建设目标的服务对象延展至大资管的全域业务(包括投资、财富管理等),这与大资管时代研究业务的服务场景延展密不可分;
  • 从以“管理”为核心转向以”业务“为核心:强调系统建设对业务的赋能与反哺,强调建设投入的效果真正反映在业务价值的提升上。

三、How:如何打造智能投研3.0体系?

前文提到,投资研究的核心目的是帮助投资者对抗相较于市场对手的信息不对称与认知不对称,从而捕捉市场预期差,对风险资产做出更准确的跨期定价,获取超额收益。

那么“智能投研”就是依托技术进步,提升投研业务整体的TFP(全要素生产率),实现机构层面投入产出比的提高,构筑起机构平台化、可持续、更高效的研究与投资能力。

我们认为,“智能投研3.0”体系的建设要围绕三个特征目标展开:

(1)平台化

具体来讲,就是通过系统建设打造公司的平台能力,提升对员工的赋能。

简单地理解,就是公司不会因为某一位研究人员的流动,导致对应行业出现研究能力的迅速崩塌;而在公司建设的平台上,B级人才可以做出A级的工作绩效,而A级人才可以成长为S级人才,从而缩短人才的培养周期,同时提高平台对于人才的粘性。

那么要实现上述目标,我们就必须实现投研系统化,只有系统化,才能真正意义上实现规模效应。

(2)系统化

如何实现系统化,我们认为需要做到以下4点:

1)业务数据化;

2)数字资产化;

3)流程标准化;

4)投入产出(I/O)最大化。

我们一一解读:

首先,业务数据是最具有机构异质性的数据,将业务数据结构化留痕,是数智化的基础设施,一方数据是讲好业务故事的原料之一;

第二,是数据资产化,资产是预期会给企业带来经济利益的资源;我们不是要单纯地“存”数据,而是要“用“数据,因此需要一套低代码、可视化的工具,让业务人员可以灵活、便捷、个性化的取用到能辅助其业务增值的数据,用工具武装自己,能用数据,用好数据,讲好业务故事;

第三,是流程标准化,所谓建立SOP(standard operating procedure);这条核心是面向合规风控的场景,将规范都定义在后台,信息自动流转,主动预警;从而降低管理成本,规避操作风险;

最后,是投入产出最大化,这个其实也是所有建设的最终目标,强调转化,所有投入向收入转化;将共性、规律性、重复性的东西抽离出来进行固化,建立所谓中台,能够有效降低边际成本,让有效资源效用最大化。

以上4点,我们认为也是投研数智化建设的核心方法论。“智能投研3.0”的体系建设需要围绕这四点方法论来展开设计。

(3)智能化

最后,所谓智能化就很好理解了,在系统中增加更多智能化的组件,让可以由规则来定义的动作都交给系统来完成,从而解放出人力,来从事更加富有创造力和挑战性的研究工作。其中,我们强调智能化的“可解释性”,事实上,金融企业对”可解释性“的要求远高于其他行业。

在“智能投研3.0”阶段,我们需要抓住以下3个关键词:

关键词一: +AI

即将AI技术,落地于金融资管业务场景,实现深度融合。我们不能盲目夸大算法的应用场景,但也绝不能忽视算法对智能化建设的价值。核心是要找对场景,解决一个封闭问题,通过场景的延展和语料的积累,小步快跑,以小逐大。

关键词二:低代码

即用低代码思维实现大数据模型的搭建与运算。低代码这个理念,在很多行业都已经是一个畅销词了。在金融行业亦如是,技术和业务不能割裂,但让业务去学习代码又是一个不切实际的想法,而通过代码封装,将函数、算法进行原子化、产品化的方式,可以有效的将业务与技术在流程上串联。

关键词三:可视化

即强调可视化。数据可以可视化,逻辑可以可视化,模型可以可视化,通过可视化,同样是进一步压缩信息传递与加工路径,形成能力的固化。

总结上文,“平台化、系统化、智能化”是“智能投研3.0”的核心建设目标,这是一个长期的系统工程;体系之庞大,建设之难度,丝毫不亚于传统的交易体系,不能一蹴而就。

通过多年探索与实践,我们提出,“智能投研3.0”体系建设的“业务三部曲”和”技术四阶段“两大核心纲领。

首先是“业务三部曲”纲领。

第一步,先实现业务数据化、数据资产化,做好数据工作;围绕4个模块展开,数据融合、知识沉淀、流程管理与绩效考评,将整个流程先在业务系统中打通。

第二步,去着力构筑研究中台能力,包括能力的提升与平台固化,这里包括之前提到的业务数据的管理、研究逻辑的管理、策略模型的管理;进一步的,当研究能力可以相对标准化、产品化之后,我们就能够以更低的成本,和更少的产能约束,更好更有效的实现跨部门的业务协同,更大程度的发挥研究成果的外部性,提升研究业务对公司收入的转化效应。

第三步,我们希望做到全域的信息化、数字化、智能化。将一期、二期打造的模块进行进一步的数据串联,形成一套归一化、标准口径的数据流,并将之流向离钱更近的投资口,辅助投资决策,无论是基本面、还是量化、还是量化基本面,都可以根据其投资流派与风险收益目标,来取用适合自己的数据和应用。

最终,公司的投研一体化系统成为一个超级大平台,内外部产生的数据、开发的系统,都成为平台中的一个个可热插拔的应用,每家公司均拥有自己个性化的数据湖和应用商城,由机构来定义数据模型和接口规范,让外部的供应厂商来主动对接,从而从数据层面到应用层面都实现自主可控。

上述的“三部曲”纲领是从业务角度出发的行动路线;而在实践中,IT部门则还需要从技术角度去规划系统建设的落地,此时,需要把握好以下四个阶段性目标,且有次序的落实:

阶段一:线上化

线上化是最基础的一步。很多服务流程本来是在线下执行的,比如各种文件的传输、审批流程。线上化可以大幅度提高效率,并且更好地存档记录。

阶段二:数据化

线上化之后的第二个阶段就是数据化。通过对企业和企业用户的多维度数据的展示,更好地提供个性化服务、提高管理水平。

阶段三:自动化

自动化是提高效率的必然阶段。当一些服务流程标准化之后,可以通过一些技术手段替代人力。尤其是一些固定通知、固定动作。

阶段四:智能化

智能化是通过一些算法和规则实现系统的集中调度,一般认为是在自动化的基础上做智能化。(注释:实际上,智能化是一个综合的系统,企业内部服务人员的标准化动作是固定的,但这些动作应该对哪些用户执行、在什么阶段执行则应该由系统进行分发。将人与系统紧密的结合起来,系统为人赋能,提高人的生产效率。)

在本节,我们梳理了“智能投研3.0”建设的整体目标,并从业务和技术两个角度,探讨了推动建设任务落实的行动纲领。

四、Core:数据中台与知识图谱是智能投研3.0的基础设施

最后,“智能投研3.0”的体系建设道阻且长,我们强调:必须要将基础设施建设放在首位。

什么是“智能投研3.0”的基础设施?我们提出一个简单朴素的设计哲学:智能=数据+逻辑。

- 数据层面:用“数据中台”来丰富投研可运用的数据,帮助业务人员获取信息优势,拓宽数据使用边界。即,在成本可控的情况下,持续提升信息端的数量与质量(模型输入端),减少整体组织的信息盲点,对抗“信息不对称”。

- 逻辑层面:用“知识图谱”来承载投研逻辑,将数据转化为知识;帮助机构实现研究框架沉淀和结构化表达。即,让系统来更多的固化和执行能用规则定义的模型,提供给投研人员以更高价值密度的信号,以降低基础信息加工对人脑时间和空间的占用,在有限资源下,更多的克服整体组织的认知盲点,对抗“认知不对称”。

因此,在这个体系下,我们强调:知识图谱与数据中台,是智能投研3.0的基础设施。

通过“数据中台”,我们可以组织所有多源异构数据流(包括结构化和非结构化的),将其映射至一套统一的模型之中,并进行归一化封装,从而实现数据层对业务层的敏捷响应,降低数据长期的管理成本,提运升用效率。——业务需求是敏捷多变的,会随着外部市场环境、监管环境以及内部组织架构、战略方向的调整动态变化,且日趋高频;而数据与数据模型相对是稳定的,维护好强大的数据中台,可以在保持后台IT架构相对稳定的同时,对高频变化的前台业务需求形成高效响应,成为变速齿轮。

而通过“知识图谱”,我们通过人机结合的方式,将机器的计算能力的优势及人的思维逻辑相结合,令各自优势发挥到极致——人思考并提出问题、判断需要哪些数据,而机器则负责查找数据和识别规律,二者共同解决问题。不同于直接提供解决方案的算法黑箱,基于“知识图谱”给出的投资信号是具有极强的业务含义与可解释性的。

关于如何构建面向投研的“数据中台”与“知识图谱”,我们将在后续的文章中与大家分享。

五、小结

最后,我们强调“大道至简”,“智能投研”的目标不是为了让机器取代人的决策,而是为人提供辅助。围绕“数据融合”和“人机结合”这两个理念,通过构建统一数据本体,以及统筹“HI(人)”+“AI(机)”各自的比较优势,构筑起全新的数据处理方式。

如果说“新基建”的核心就是在传统的物流和人流当中加一个数字流——通过人流、物流、数字流产生产业流和资金流,变成价值流。那么“智能投研3.0”体系,本质上是定义了一种新型的数据处理与流转方式,是资管领域的“新基建”。

(作者:金箫,北京熵简科技有限公司联合创始人,深耕资管科技,专注于数据中台在金融领域的落地与智能投研整体解决方案的业务架构设计;曾任职于中信证券股份有限公司 ,清华大学五道口金融学院金融硕士 、中央财经大学金融学士。)

[Source]

本文系未央网专栏作者发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!首图来自图虫创意。

本文为作者授权未央网发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!首图来自图虫创意。

本文版权归原作者所有,如有侵权,请联系删除。首图来自图虫创意。

评论


猜你喜欢

扫描二维码或搜索微信号“iweiyangx”
关注未央网官方微信公众号,获取互联网金融领域前沿资讯。