清华大学金融科技研究院孵化
金融科技与金融创新全媒体

扫描分享

本文共字,预计阅读时间

人工智能驱动金融数字化,集成了机器学习算法、标注系统、数据业务标准等系统模块,拥有一整套完整的数据自动化处理流程,能够覆盖对现有上市企业所有公开报告的数据提取,可以有效识别电子版文档和扫描件图片(结合OCR技术),结合数库积累的大量容错集,可以生产出高度标准化的元数据;实现数据的规模化生产。

2020中国金融科技创新大赛

参赛单位:数库(上海)科技有限公司

案例名称:DAS-文档数字化解决方案

案例简介:

人工智能驱动金融数字化,集成了机器学习算法、标注系统、数据业务标准等系统模块,拥有一整套完整的数据自动化处理流程,能够覆盖对现有上市企业所有公开报告的数据提取,可以有效识别电子版文档和扫描件图片(结合OCR技术),结合数库积累的大量容错集,可以生产出高度标准化的元数据;实现数据的规模化生产。

创新技术/模式应用:

1、技术创新:系统具备深度学习、图像识别、NLP文本处理及各类算法为核心;

2、机器学习能力:只需要进行少量样本的标注就可以训练一个成熟的模型,并由机器进行自动提取、标注、质检和发布;

3、生产标准化:数据提取逻辑高度复用,通过模型固化在系统中,确保数据的准确性和高效性;

4、生产快速:针对不同的行业不同的业务需求,只要构建训练模型,即可快速生产;

5、自动化质检:可以根据不同的业务需求,配置相应的质检规则,完成数据生产自动化质检;

6、插拔式提取算法:支持可插拔的接口,通过加载所需的算法,能够按需从文字部分里面提取特定的指标数据,再生成相应的指标表格;

7、特有的容错体系:系统以数库多年积累的数据容错集为基础库;

项目效果评估:

1、生产模式转变:由人工手工处理转变为机器自动化处理,可实现7*24小时生产;

2、生产投入快:从耗时培训人员处理文档,转变为只要构建、训练模型, 1-2周即可投入生产;

3、生产效率高:手工处理1篇文档1人天, DAS只要几秒即可处理完成;

4、数据准确率高:自动化质检代替人工质检,标准化的质检逻辑保障了高准确率,准确率可达95%以上;

5、生产效益大:与传统人工生产相比,产生同样效益的情况下,只需1/10成本;

6、行业痛点:解决了需要投入大量经验丰富的人员手工维护的行业痛点;

[Source]

本文系未央网专栏作者发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!首图来自图虫创意。

本文为作者授权未央网发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!首图来自图虫创意。

本文版权归原作者所有,如有侵权,请联系删除。首图来自图虫创意。

评论


猜你喜欢

扫描二维码或搜索微信号“iweiyangx”
关注未央网官方微信公众号,获取互联网金融领域前沿资讯。