扫描分享
本文共字,预计阅读时间。
文/中信证券股份有限公司宋群力、徐畅泽、胡振宁、张俊灵
(本文为“证券机构数字化转型与证券科技创新”征文活动精选文章。)
中信证券人工智能团队成立于2017年初,致力于打造行业领先的人工智能应用研发,部署,运行统一云平台,提供统一的数据,算力和研发运行环境。并在此智能云平台基础上,打造行业领先的人工智能金融科技产品。智能云平台是中国证券业内最早一批针对人工智能应用建立的云平台。目前已经在我司智能投资、智能投顾、智能算法交易、智能客服、智能舆情、智能风控等领域发挥作用。
一、人工智能云平台
图1 中信证券智能云平台
实现任何一个人工智能应用需要以下这些基础的服务:数据,算力资源、研发平台及运行环境。人工智能云平台的核心功能就是针对这些资源搭建了相应的服务跟模块,整合和维护以满足客户研发和运行人工智能应用的需求:
- 金融数据服务:对接内部所有行情源及各历史行情数据、历史宏观数据源,提供因子研究工具及自定义的因子数据定时维护与共享服务;
- 研发平台:支持各种机器学习算法及多种深度学习模型和框架(LSTM模型、Tensorflow/ Keras 等框架)的运行,提供开发工具和模型代码生成工具;
- 多租户算力平台:共享多GPU计算资源,支持多租户的云服务调度系统。支持多机多卡并行训练,提供超参搜索功能;
- 策略回测:支持对训练出的模型进行历史数据回测及实盘模拟交易(完全仿真中信证券的交易场景,防对敲、模拟撮合及滑点);
- 绩效分析:对训练后的模型进行回测及实盘交易绩效评估和风险度量,提供绩效评估基准和风险度量指标的计算分析报告;
- 交易接口与模型推理执行框架:提供将平台训练、回测并优化好的策略打包提交到生产环境并与交易系统对接的API。
研发平台分别提供了在线的模块化SaaS开发工具;和面向专业开发者,基于PyCharm IDE的客户端。可以帮助用户降低使用及进入机器学习量化领域的门槛,同时满足专业开发人员大规模工程开发的需求:
- 模块化开发平台:可视化的机器学习和深度学习模型搭建与开发工具平台,方便快速构建机器学习的量化应用;
图2 模块化开发平台
- 表达式引擎:用户可能之前积累很多指标与公式但若把开发环境迁移到机器学习的工具平台上,就会需要从基础数据开始从头开发所有指标和因子的难题。表达式引擎提供了通用的解决方法,用户不再需要繁琐的编程从头实现;
图3 表达式引擎
- 多客户端使用模式:方便不同需求的专业用户
图4 多客户端使用模式
- 从开发/测试环境到生产环境以及相应的异地生产灾备环境。智能云平台的运行环境针对开发/测试用户的诉求提供了大功率的8 GPU运行环境,用户开发测试和训练完毕的模型,可以直接部署到使用低功耗GPU服务器的生产环境之中,同步提供了安全高效的多租户隔离地生产运行环境。最后系统还为生产环境提供了异地灾备及定期的数据同步服务。
图5 异地生产灾备环境
二、智能投资框架
桥水基金创始人雷·达里奥在《原则》一书中说到 “投资是一个反复的过程。您下注,失败(有时很痛苦),学习新知识并重试。在这个艰难的过程中,您可以通过不断的反复试验来改进自己的决策”[1]。自达尔文阐明自然运作方式以来,这一原则对我们显而易见,这对于交易决策也适用。这种直观的想法在人工智能领域被称为强化学习(Reinforcement Learning)。
强化学习[2]是智能体(Agent)以试错的方式进行学习,通过与环境进行交互获得的奖惩值(Reward)指导行为,目标是使智能体获得最大的奖惩值。强化学习把学习看行动-评价过程,智能体基于当前策略选择一个动作用于影响环境,环境接受该动作后状态(State)发生变化,同时产生一个奖惩值反馈给智能体,智能体基于奖惩值和当前状态(State)再选择下一个动作,选择的原则是使受到奖励的概率增大。选择的动作不仅影响立即奖惩值,而且影响环境下一时刻的状态及最终的奖惩值。强化学习中的奖惩值是智能体对所产生动作的好坏作一种评价,智能体在行动-评价的环境中获得知识,改进行动方案以适应环境。
投资交易本质上是一个通过连续决策(每隔一段时间决定是否下单,下单数量和价格),在完成设定的目标量的前提下,获得更好的成交均价的过程。如图6所示,算法交易可以抽象成一个强化学习过程。智能体(Agent)代表算法交易策略。基于当前的市场状态(State)和上一步的奖惩值(Reward),智能体会生产一个交易指令(Action),交易指令的执行又会影响委托,成交,行情,实时绩效,账户信息等交易环境(Environment),从而产生一个新的状态和奖惩值。对于买入的算法指令,当成交均价小于市场均价时,奖惩值为正;对于卖出算法指令,当成交均价大于市场均价时,奖惩值为正。正的奖惩值反馈到智能体会使其强化类似的下单决策;负的奖惩值反馈到智能体会使其倾向于避免类似决策再次发生。 通过正负奖惩值不断滚动的反馈刺激调整其内部参数,使得智能体更大概率跑赢市场均价。
图6 深度强化学习智能交易
深度强化学习[3](Deep Reinforcement Learning)本质上是深度神经网络(DNN)和强化学习的结合,是目前人工智能领域最前沿的科研领域之一。深度强化学习将深度学习的感知能力和强化学习的决策能力相结合,是一种更接近人类思维方式的人工智能方法。深度学习具有较强的感知能力,但是缺乏决策能力;而强化学习具有决策能力,无法处理感知问题。因此,将两种机器学习方法结合起来,优势互补,为复杂系统的感知决策问题提供了解决思路。谷歌人工智能DeepMind团队带头人david Silver将深度强化学习定位为可以解决任何人类工作的通用人工智能方法,宣称通用人工智能(AI)= 深度学习(Deep Learning)+强化学习(Reinforcement)[4]。实践中,我们熟悉的AI围棋选手AlphaGo[5],AI星际争霸选手AlphaStar[6]的核心算法理论便是深度强化学习。 强化学习的投资决策能力上文已经介绍了。在深度强化学习中,深度神经网络的作用又是什么呢?实际上深度神经网络被用来挖掘交易状态(State)和交易指令(Action)之间的内在关系,并基于当前交易状态,输出最大可能获得奖励的交易指令。
三、智能投顾
“AI投顾”是中信证券人工智能团队基于智能云平台自主研发的智能投顾产品,目前7个系列智能投顾组合产品覆盖了市场上主流的策略类型,已在中信证券官方APP“信e投”上发布:
- 图灵系列-智能ETF大类资产配置FOF策略
- 明斯基系列-智能股票精选多头策略
- 麦卡锡系列-智能场外基金大类资产配置FOF策略
- 纽厄尔系列-智能衍生品跨品种,跨期套利策略
- 西蒙系列-智能结构性理财收益增强策略
- 费根鲍姆系列-智能T+0日内高抛低吸策略
- 瑞迪系列-智能Smart Beta策略
图7 中信证券信e投APP AI投顾板块
2019年累计服务客户989万次,日均服务客户2.7万次。智能投顾产品主要服务公司中小客户。由于人工投资顾问的数量有限,成本高,质量参差不齐,大部分的中小客户很难得到满意的投资咨询服务。“AI投顾”提供专业,全面,透明,便捷的投资建议,开放专业机构级的投资策略给中小客户使用。
目前国内市场上的智能投资投顾产品以传统量化模型为主,资产配置或者交易决策依靠人工专家经验为主,机器为辅,将投资自动化当成投资智能化。智能投资投顾策略实际上可以扩展到所有的策略类型和证券类型;业务类型涵盖财富管理、资管、自营交易等业务;服务客群包括长尾客户、高净值个人客户和机构客户。
人工智能团队自主研发的一套通用人工智能投资框架,旨在运用深度强化学习理论,通过学习历史市场数据,训练机器进行二级市场投资,实现无人投资(无投资经理,无交易员,无研究员)。投资全流程没有人工干预,所有投资交易决策由机器独立完成,并且机器会根据当前市场环境和账户资金持仓情况自主持续学习调整策略以适应新的市场环境。依托智能云平台提供的数据,算力和运行环境资源,目前我们研发出的7个系列智能投资投顾产品,覆盖各主流策略类型:FOF,股票多头,商品期货跨品种套利,CPPI,T+0,Smart Beta,算法交易;各主流证券类型:股票,ETF,商品期货,股指期货,场外基金,债券;各券商主流业务类型:财富管理,自营交易,资产管理,股票销售;各客户类型:机构客户,高净值客户,长尾客户。
智能投顾产品截至2020年6月2日收益情况表:
表1 智能投顾产品收益表
四、智能算法交易
算法交易是指通过使用计算机程序来执行用户提前设置的交易指令的方法。用户设置交易指令的标的,买卖方向,目标执行量,交易时间,价格限制等参数,算法交易程序根据用户的执行指令参数,自动将交易指令拆分,分布到若干个时间段内,每个时间段内下单的时机、价格,数量由交易算法进行判断。算法交易被券商,基金以及其他机构交易者广泛使用以便更好地管理市场冲击成本、机会成本和风险。
根据各个算法交易中算法的主动程度不同,可以把算法交易分为被动型算法交易、主动型算法交易两大类:
被动型算法交易例如TWAP(时间加权平均价格)算法,在算法实际执行前就已经设定好了下单总笔数,每笔委托下单量,时点和价格类型(例如最新价)等,不会根据市场的状况主动选择交易时机和交易数量。该策略的目标是减少算法实际成交均价与市场成交均价的差异。
主动性算法交易基于被动型TWAP算法,但是会根据市场状况主动选择交易时机,数量和价格类型。该策略的目标是在同等条件下,能比被动型TWAP以更好的价格执行完交易指令。
传统主动性算法交易策略基于日内交易员的主观经验,将主动选择交易时机,数量和价格的方法程序化。计算机主要起到的是固化交易员策略经验,提高下单执行效率的作用。算法交易策略的有效性主要依赖交易员的主观经验。
半智能主动性算法交易策略基于人工智能方法生产的短期价格涨跌预测信号和日内交易员的主观经验选择交易时机,数量和价格。例如,如果正在执行一个买入指令,此时得到一个看涨的信号,算法基于此信号加大此刻下单数量,价格由挂在买一盘调整为吃卖一盘口等。相比传统主动性算法交易,机器有了一定的辅助下单决策能力,不完全只是一个执行交易的工具。
中信证券自主研发的全智能算法交易策略AITWAP3,旨在运用深度强化学习理论,通过学习历史A股Tick行情数据,训练机器学习算法交易策略(交易时机,数量和价格类型的选择)。所有下单决策由机器独立完成,并且机器会根据当前市场环境每日持续学习调整策略以适应新的市场环境。自2019年12月23日实盘上线至2020年5月27日,累积交易9134次,总成交金额约13.2亿元,平均绩效优于市场VWAP 2.54‱(2.54个BP)。 2019年1月2日到2019年11月15日A股全市场股票回测平均绩效优于市场VWAP 1.79‱(1.79个BP)。
图8 AITWAP3智能算法交易
五、智能资讯应用
智能资讯语义处理应用,通过采集公开资讯,借助云平台的算力,对公开舆情进行情感分类、主体和风险事件识别,为业务部门提供智能舆情监控,智能公告摘要,并实时推送风险事件信息。
智能资讯项目,通过监控业务部门关注的监控标的,极大的提高了业务部门对市场舆情覆盖的范围和实时性,助力业务人员提高风险识别和业务机会发现能力。舆情应用目前覆盖公开资讯网站200多家,覆盖主流资讯频道2000多个,日采集并处理资讯平均5万多条。
图9 智能资讯平台首页图
六、智能风险识别应用
通过系统实时抓取新闻事件,利用自然语言处理技术将相关的上市主体和风险事件提取出来,并分析其对哪些上市公司主体有正负面影响,从而指导业务人员做出风控和投资决策,相比人工风控,效率更高,响应速度更快,系统处理流程框架如下图。
图10 智能资讯NLP处理流程框架
平台底层使用集群管理系统Kubernetes管理所有的服务器硬件。Kubernetes是Google开源集群管理系统,在Docker技术的基础上,构建全新的容器管理的分布式架构领先方法,实现了部署运行、资源调度、服务发现、弹性伸缩和动态扩展等一系列完整功能。同时扩展多层次的安全防护和准入机制、多租户应用支撑能力、透明的服务注册和发现机制、内建智能负载均衡器、强大的故障发现和自我修复能力、服务滚动升级和在线扩容能力、可扩展的资源自动调度机制以及多粒度的资源配额管理能力。
系统自动挖掘的风险事件范围较广,聚合性较差,不能很好的表征市场行为。我们通过建立简单的市场体系框架,对风险事件进行约束和聚集,将事件风险抽象为主体风险事件、产品风险事件、宏观/行业风险事件三个大类,每个大类包括若干小类的二级金融风险事件。在这个框架的基础上,不断完善和细分子事件,达到构建整个金融风险事件体系的效果,事件整体分类如下图所示。
图11 风险事件体系框架
(一)主体风险事件
侧重描述具有公司属性的市场主体所涉及的事件,包括上市公司、非上市公司、债券发行主体等等。一般来讲,一个主体可能在多个市场参与不同的金融活动,例如股票、债券、证券投资等。不同金融活动可能产生或面临不同的风险事件,主体风险事件进一步细分为七个主要部分,包括运营风险事件、财务风险事件、法律风险事件、投融资风险事件、股东风险事件、治理风险事件和外部风险事件。
(二)产品风险事件
产品风险主要面向特定金融产品进行监控,产品包括股票、债券、公募基金、私募基金、理财产品和资产管理等产品,特定产品会发生特定的产品风险。例如一支基金产品有风险,并不会影响某个主体的所有基金,一个主体有风险暴露,可能会涉及这个主体下面所有金融产品。
(三)宏观/行业风险事件
宏观风险主要分为行业风险和宏观风险,行业风险关注某个产业或细分行业的特定风险事件,比如产业转型、地区行业政策等影响,宏观风险主要统计常见宏观指标,如利率、汇率、就业、财政支持等指标。
七、智能文档抽取应用
基金托管合同由于合同要素多且复杂,提取合同要素需要大量时间来进行人工录入和校验,为简化这一过程,需要AI赋能嵌入到合同要素智能提取、智能解读,利用机器学习的自然语言处理技术实现对合同的高精度解读,完成全量字段智能抽取,帮助客户实现合同管理的人工智能赋能升级,提高工作效率,简化工作流程。
托管业务涉及的几千份合同,每个合同含有200多个业务要素需要关注。通过人工抽取,每份合同需要30分钟左右,现在使用机器进行智能文档自动抽取,每份合同2分钟之内完成处理,云平台提供的托管私募基金合同要素抽取和OCR服务,大大提高了部门处理托管合同的运营效率。
图12 托管合同智能要素抽取系统
八、 智能客户外呼应用
在智能客服方面,智能外呼系统通过拟人化的机器人外呼,可大量减少人工座席的回访外呼工作量, 按照2019年系统统计数据,减少约76%的人工外呼工作量,智能外呼机器人在服务过程中需要对姓名、机构名称、合约信息、业务信息变量进行准实时语音合成,采用云平台GPU服务资源,可确保个性化语音合成声音效果的准确性和与固定播报话术的连贯性,经实际上线验证,合成效果几乎没有机器人的痕迹。
图13 智能外呼系统架构图
九、智能投研与自动报告
随着上市公司数量逐步增多,一个行业研究员需要覆盖研究的公司也逐步增多,及时全面的掌握相关个股和行业的各类舆情、公司公告事件需要大量人力投入。基于这个应用切入点,我们完成了智能研报生产与研究覆盖提醒的服务。
基于人工智能等技术自主开发的智能投研系统,每日会及时生成当天个股全景和行业跟踪报告,每交易日系统自动生成个股研报、北线资金流向、宏观流动性日报、行业日报、ETF基金日报和债券ABS等6类报告。
图14 自动报告系统首页
提醒研究员进行研究报告覆盖,特别是关于重大盈利风险事件,会同步列出行业内相似公司的相关数据,供研究员分析和比对,对于公告中涉及的各类事件,每日自动生成公告摘要报告,及时推送各个行业研究组,大大节省了研究员获取资讯和个股事件的时间,使研究员更专注于深度报告撰写和公司深度研究。
研究报告中,一般估值数据是研究报告的灵魂,估值数据主要对上市公司各类指标进行预测,进而以此模型为基础进行上市公司业绩和股价预测,估值数据一般为两年历史数据和未来三年预测数据,一个典型的估值模型常见预测指标数据包括营业收入、营业收入增长率、净利润、净利润增长率、每股收益(EPS)、毛利率、净资产收益率(ROE)、每股净资产、市盈率(PE)和市净率(PB)等指标。因这些数据主要来源于上市公司披露的定期报告和业绩预告,数据频率相对较低。为了能更加准确的进行盈利预测,我们捕获风险事件中关于以上相关指标的影响数据,提前对某些预测指标的数据进行修正,我们对某上市股票进行了PE修正,研究员在年报发布之前就通过研究报告进行了比较准确的PE预测覆盖,取得了比较好的应用效果,如下图所示,基于风险事件提前对某上市公司PE指标进行了修正。
图15 某上市公司PE指标修正
十、总结
本文介绍了中信证券人工智能云平台智能云平台建设以及基于智能云平台实现人工智能投资、投顾、算法交易、智能客服、智能舆情、智能风控等金融科技创新产品,为我司的数字化转型奠定了良好的基础。
[1] Ray Dalio,Principles,Simon & Schuster , 2017
[2] Yuxi Li,deep reinforcement learning: an overview,ArXiv, 2018
[3] Human-level control through deep reinforcement learning, V. Mnih et al., Nature, 2015.
[4] David Silver, Deep Reinforcement Learning, Google DeepMind
[5] David Silver,Mastering the game of Go with deep neural networks and tree search,Nature,2016
[6] Kai Arulkumaran, AlphaStar: An Evolutionary Computation Perspective, CoRR, 2019
非常感谢您的报名,请您扫描下方二维码进入沙龙分享群。
非常感谢您的报名,请您点击下方链接保存课件。
点击下载金融科技大讲堂课件本文系未央网专栏作者发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!首图来自图虫创意。
本文为作者授权未央网发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!首图来自图虫创意。
本文版权归原作者所有,如有侵权,请联系删除。首图来自图虫创意。