扫描分享
本文共字,预计阅读时间。
文/北京金融控股集团有限公司董事长范文仲
在党中央、国务院的高度重视和决策部署下,数字经济已经成为我国高质量发展的新引擎。数据要素作为数字经济的核心生产要素,已成为推动产业升级、优化经济结构和打造经济增长点的战略性资源。实现数据要素从资源到资产再到资本的价值化演进,是数字经济发展的核心目标。
数字金融创新将为长期经济增长提供新的动力
当今世界正在处于大变革时代,它不同于普通的经济周期,而是人类发展史的机制转换(vegime switch),或者称为历史的跃迁(historical leap)时期,众多金融业态和商业模式正在发生颠覆性转变,并对经济社会生活产生重大影响。
首先,人类社会的商品化程度大大增加。例如,家庭内部、亲朋之间的互助活动,包括餐饮、家政、看护等服务越来越多地依靠商业外包来完成,从而把未被利用的社会家庭资源转化为商业化活动和经济资源,大幅提升社会经济总量和财富总量。
其次,商品交换从产权交换转变为使用权交换。以前由于支付手段较为落后,商品交换大多是产权交换,即“一手交钱一手交货”。如今通过支付创新,可以准确衡量每个个体对物品资源的使用时间和产生费用,并且进行小额支付。商品交换逐渐从产权交换转变为使用权交换,共享经济应势崛起。现在共享的很多是耐用消费品,如单车、汽车,未来还会有更多的生产设备、房屋可以共享,碎片化经营租赁将成为时尚。这些支付创新将会给人类经济活动和生活方式带来巨大影响。
此外,客户信息和行为画像越来越全面、丰富,客户信用评估从单维度指标向全维度信用评级体系转变。在互联网时代,每一个人都是“透明人”,网络对一个人的了解可能会超越人对自身的理解,变得“比你还懂你”。传统商业银行衡量借款客户的信用风险,更多是从客户的历史还款表现和其他财务信息来判断,目前在大数据技术的推动下,信贷机构对借款客户的信用评判正在尝试从多维度来进行,通过过往购物、住宿、旅游的消费数据、税收记录以及交通处罚等信息来对客户进行精准画像,未来还可以从借款客户的社会关系等非个人维度全面了解其信用情况。
展望未来,数字金融发展的两大新趋势值得高度关注和积极推动:一个是数字的资产化,另一个是金融的智能化。
数字的资产价值挖掘将有效提升社会经济资本水平
经历过Web1.0、Web2.0之后,我们迈入了Web3.0时代。Web1.0时期的主要特点是“读”(reading), 用户行为模式主要是对既有信息的搜索和浏览,代表公司包括国外的谷歌(Google)、雅虎(Yahoo)、网景(Netscape)和国内的新浪、搜狐、百度等。Web2.0时期的主要特点是“写”(writing),用户可以在互联网上发布个人信息和商品,进行更加充分的互动交流和交易,代表平台包括国外的推特(Twitter)、亚马逊(Amazon)、脸书(Facebook)和国内的微信、微博、淘宝、抖音等。而在Web3.0时代,人类社会将进入万物互联、数字孪生的时代,其特点是“资本化”(capitalizing),在互联网世界产生的数据和信息将会成为个人的资产和资本,代表公司还没有出现。
当前,数据作为核心要素资源,虽然具有普遍的使用价值,但资产属性还没有充分体现。只有实现确权、流通和交易后,数据才会从社会资源转变成可量化的数字资产,再通过金融创新演变为生产性的数字资本,真正释放其内在价值。从数字资源到数字资产再到数字资本的演进,正是数字经济发展的核心目标。数字经济将为未来中国经济增长提供强大的资本来源,这才是真正的供给侧结构性改革。
以企业数据为例,通过登记确权、实现价值化的企业数据,可以转变为企业资产,帮助做大做优企业资产规模,实现净资产和融资空间的提升、资产负债率的下降。也就是说,企业数据增值可以推动企业收入和利润的增加,实现现金流的改善,进而带动地区税源种类、税收规模、生产总值、劳动生产率的提升,形成经济增长的新动力和新引擎。要实现这个目标并不容易,需要做好诸多基础性工作。
首先,做好企业数据确权工作,对数据资源进行盘点梳理,推动建立企业数据资产报表体系。按照不同维度,企业数据资源可分为管理数据、生产数据、应用数据三大类。其中,前两类数据属于企业自有数据,权属较为清晰;第三类数据具有较高的市场价值,但权属往往存在争议。成熟形态企业数据则可以分为原始数据、统计数据、数据产品。其中,原始数据未经加工,单位量价值较低且较为敏感;统计数据是原始数据经计算加工后形成的数据;数据产品是在统计基础上设计出的企业征信画像、产品质量评级等,经过脱敏后可以对外提供。企业应按照不同维度建立数字资源管理报表体系,如数据地图或数据字典,并明确主责部门和主责岗位,设立首席数字官,进行统一的数据资源规划管理。
其次,实现企业数据评估入表,挖掘资产价值。在模拟企业数据资产入表探索中,有两个痛点问题。一是如何对数据资产进行准确评估。目前常用的定价方法有三种,包括成本法、收益法、市场法。在没有交易的情形下,只能用成本法定价,成本法的基础是可靠计量;在有交易的情形下,可用收益法定价;在大量反复交易的情形下,可用市场法定价。三种定价方法相辅相成,可从成本法先起步。二是如何进行数据资产入表。可将不交易的数据资产计入无形资产、交易的数据资产计入存货,但对于只交易使用权、不交易所有权的数据资产来说,可能更适合计入无形资产。国际上关于数据资产入表的探索较为滞后,建议我国在此领域进行持续创新。
最后,先试点后推开,稳妥推进企业数据开发利用试点工作。企业数据资源的开发利用,在很多领域尚无先例可循和法规支撑。为了稳健推动创新,建议优先选取数据资源丰富的国有企业或是在数据治理方面有一定基础的中小企业作为试点,同时在会计、法律、评估等领域邀请头部专业中介机构参与联合创新。建议在数据要素市场建设基础好的地区开展试点,不断完善配套制度建设,待成熟之后再向全国推广,逐步建立起更为广泛的数字经济基础设施和制度体系。
目前,北京金控集团旗下的北京国际大数据交易所,正在国资部门和经信部门的大力支持下,积极推进市属国企的企业数据确权创新试点,通过先行先试,努力打造一批示范样板和数据创新应用场景。
金融智能化将是未来的核心竞争力
在ChatGPT掀起巨大热潮和广泛关注之后,可以预见生成式AI大模型技术的发展将会对各个行业造成深远的影响。现在传统金融机构还在依靠分支机构获客,依靠专业员工提供投资和银行服务。未来金融机构的竞争力将不在于资产规模、分支机构数量和金融从业人数,而是取决于数据库的规模、算力的强弱。建立在通用大模型基础上的金融垂类专业模型,注定会取代那些标准化强、重复性高、有明确程序规范的传统银行、证券、保险业务。
但是,人工智能大模型的发展需要突破两大瓶颈——数据和算力。这两个要素既耗费资源,又耗费资金,导致很多人认为只有大公司才能训练大模型,小公司没有可能。然而,如果能够发挥我国体制机制优势,大力推动技术和制度创新,小公司也完全有可能训练大模型。
从数据来看,随着机器学习特别是深度学习理论的演进,人工智能大模型的训练越来越依赖合格数据的提供。中小科技企业要发展人工智能技术,通常面临三方面困难:缺乏数量足够大的多模态数据集;无法保证数据来源的合法合规性;数据质量不高,可用度较低。因此,为解决中小科技企业面临的数据难题,笔者提出如下建议。
一是建设公共多模态人工智能训练用大数据集。建议从国家层面建设统一的大数据集,归集包括书籍、期刊、论文、公文、新闻、会议、图片、报表、语音、视频等各类高质量数据。当前,北京国际大数据交易所(以下简称北数所)作为北京统一的数据要素资源交易平台,正积极推动跨领域多模态数据集的建设,对接涵盖出版物、医疗影像、行政文书、法院判决书等各类数据资源。建议进一步发挥北数所独特的公信力优势和数据资源汇聚能力,加强与各类数据源机构的合作,向广大人工智能机构提供统一高效的数据服务。
二是探索解决数据涉及的知识产权合规性问题。人工智能模型训练所用的部分数据,如书籍、期刊、论文等,可能存在知识产权争议。建议从法律法规层面进行研究,在知识产权部门的支持下先行先试,逐步出台明确训练用数据集合规性问题的规章制度。
三是提高训练用数据集的可用度。人工智能模型训练用的数据集来源分布广泛,格式千差万别,质量参差不齐。为了达到人工智能大模型训练的要求,原始数据需要经过多次清洗加工,训练过程还需要进行人工标识和校准,上述工作均需专业人员完成。当前国内相关产业并不发达,从业人员数量不多、专业性不强,虽然拥有海量数据,但标识库质量等仍然难以满足模型训练需求。建议政府规划专项资金并制定引导政策,对相关产业进行扶持,构建产业生态,助力人工智能发展。
同时,随着数字经济时代的全面开启,算力作为基础支撑,赋能作用日渐凸显。特别是面对国际高端芯片供应体系“卡脖子”风险,以及ChatGPT引爆下各国人工智能领域竞速发展的挑战,算力已成为数字经济时代的关键生产力和核心竞争力。
然而,我国算力市场发展面临以下挑战。第一,高质量算力资源不足且较为分散,GPU 芯片A800增量受限制,A100存量严重不足,进一步支撑人工智能大模型训练存在一定难度,并且逐步成为新的“卡脖子”问题。第二,基于算力需求多样化、碎片化的特点,算力资源供需错配的情况时有发生。第三,算力基础设施属于重资产和资本密集型行业,具有前期投入大、技术迭代快、建设门槛高等特点,其建设运营需要消耗巨大的时间成本和资金成本,远远超出了中小微企业的承受范围。基于此,笔者提出以下建议。
首先,大力发展聚合计算先进技术,解决“卡脖子”问题。强化关键核心技术攻关,针对当前算力需求多样化的特点,大力发展异构计算、异构集成、堆栈封装等先进技术,采用不同的架构、工艺和集成组合方式,将低质量的算力聚合起来执行高质量的计算任务。科学组合不同类型的算力单元,实现计算密度、性能和效率的大幅提升,支持人工智能大模型训练等重点场景的应用和发展。
其次,打造统一的算力交易和调度平台,用好碎片化冗余算力。以北京为例,建议打造全市统一的算力交易市场,构建“1+N”模式,即一个综合算力交易平台和N个算力调度平台。智能统筹调度北京市以及张北、廊坊、乌兰察布、大同等周边城市各类算力资源,通过算力交易平台智能实现算力资源的最优匹配,为大量中小人工智能企业训练大模型提供价格低廉的普惠算力,推动数字技术全产业链融合创新,支持北京建设全球人工智能创新高地。
再次,加大金融财政支持力度,进一步降低中小企业算力和数据的使用成本。由于模型训练需要大量算力和数据,若按照市场零售价格付费,中小科技企业将无力承担。建议参照政府对新能源车辆补贴的模式,在产业发展初期对中小企业购买人工智能算力和数据集提供适当的资金补贴,后期通过不断提升数据和算力供给质量和供给能力,逐步降低生产加工成本,涵养和培育持久的数据和算力流通生态。
最后,既要对我国发展前景充满信心,也要牢记历史上的教训。中国曾是世界上最早的纸币发行者,包括北宋的“交子”、元朝的“中统钞”、明朝的“大明宝钞”,但是由于风险配套制度没有跟上,这些朝代都发生过纸币体系崩溃的金融危机,导致中国最终退回到白银支付,并被西方超越,可谓“起了个大早赶了个晚集”。因此,一定要铭记,金融创新始于数据、兴于技术、成于制度,不仅要在技术上进行持续攻关,也要在管理制度、法律环境上进行配套创新,加大基础理论研发力度,积极培育创新型社会中介组织,这样才能行稳致远,实现可持续发展。
(本文刊发于《中国金融》2023年第16期)
非常感谢您的报名,请您扫描下方二维码进入沙龙分享群。
非常感谢您的报名,请您点击下方链接保存课件。
点击下载金融科技大讲堂课件本文系未央网专栏作者发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!首图来自图虫创意。
本文为作者授权未央网发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!首图来自图虫创意。
本文版权归原作者所有,如有侵权,请联系删除。首图来自图虫创意。