扫描分享
本文共字,预计阅读时间。
2022年11月,OpenAI发布基于GPT-3.5的ChatGPT,在国内外瞬间引爆大模型的热潮。仅仅经过半年多的时间,不少头部互联网公司和人工智能公司基本都对外宣布了自己的大模型,中国已出现了“百模大战”的局面,根据今年5月底发布的《中国人工智能大模型地图研究报告》显示,参数在10亿规模以上的大模型全国已发布79个。
在过去的几个月里,各大厂相继出招,先是3月16日,百度率先发布“文心一言”,期望对标ChatGPT;再到阿里巴巴旗下超大规模语言模型“通义千问”开放内测,万维和商汤科技分别发布大模型产品;创新工场CEO李开复、前搜狗CEO王小川、前京东AI掌门人周伯文、前美团联合创始人王慧文等行业大佬纷纷宣布下场,国产大模型赛道竞争激烈。
且7月7日,WACI 2023大会上,由国家标准委指导的国家人工智能标准化总体宣布,我国首个大模型标准化专题组组长由上海人工智能实验室与百度、华为、阿里等企业联合担任。自此,大模型的“国家队”集结。
大模型的建造离不开综合算力资源、算法人才、数据积累及产品先发几大核心要素。事实也正是如此,只有大厂才有大量资金和人才发展算力、算法、数据,也最有机会率先落地大模型。
对此,零壹智库、数字化讲习所整理了八个算力、算法、数据处于国内前沿的大模型进行介绍,内容主要包含大模型发展布局和产品方向等方面。下周零壹智库、数字化讲习所将发布人工智能相关政策报告,内含2020年1月1日至2023年6月14日期间中央及各地方政府出台的71部数字经济相关政策。
文中涉及的代表性国产大模型是:百度(9888.HK)“文心一言”、阿里云“通义千问”、腾讯(00700.HK)“混元助手”、华为“盘古”、科大讯飞(002230.SZ)“讯飞星火”、网易(09999.HK)“玉言”、360(601360.SH)“360智脑”、京东(09618.HK)“言犀”。
大模型介绍
(一)百度——“文心一言”大模型
2023年3月16日,百度正式发布大语言模型、生成式AI产品“文心一言”, 文心一言发布首日已有超60万人申请测试。发布两天,已有12家企业完成首批签约合作,同时,申请百度智能云文心一言API调用服务测试的企业达9万。
1. 发展布局
其实,早在2019年,百度就推出了知识增强的语义理解框架文心大模型,并广泛应用于阅读理解、情感分析、智能搜索问答、视频推荐等领域。2021年,百度又基于文心大模型的基础上发布了全球首个百亿参数的对话大模型PLATO-XL。文心大模型系列同时也不断经历迭代,为推出大语言模型“文心一言”打下了扎实的基础。百度的文心大模型在产品能力、生态能力方面已处于国内第一梯队的水平。
且在研发投入方面,百度自2017年7月开启ALL IN AI战略后,2017-2022年的6年间,已投入了超千亿的研发费用,研发费用率从15%提升至目前约20%的水平。对比海外互联网大厂,百度的研发投入占比也为较高水平。在高强度的研发投入下,百度取得的成果也是显著的。因此,百度能够成为国内首家推出大语言模型文心一言的企业,绝对不是心血来潮,而是其在人工智能领域背后多年的积累。
2.强大的中文对话能力
从模型来看,文心一言是高度本土化的AI模型,更加匹配中文环境的使用习惯,作为百度基本盘的搜索业务,不仅能够提供巨大的基础数据,而且在中文搜索上具有显著优势。甚至近期,在AGIEval、C-Eval等中英文权威测试集和MMLU英文权威测试集中,文心大模型3.5取得了超过ChatGPT和LLaMa、ChatGLM等其他大模型的分数表现,在中文评测项中超越了GPT-4。
对于中文用户而言,文心一言所提供的强大的中文对话能力,包括对于古汉语的应用,都是具有独特性的,让人认为这是一款真正属于国人的AI工具。中文是世界上使用人数最多的语言,相信未来将存在更大的商机。
3月16日起,除了首批用户可通过邀请测试码在文心一言官网体验产品外,百度智能云也即将面向企业客户,开放文心一言API接口调用服务。文心一言将通过百度智能云对外提供服务,帮助企业构建自己的模型和应用,农业、工业、金融、教育、医疗、交通、能源等重点领域。
凭借百度的移动生态,文心一言已经拥有了庞大的用户基础。到目前为止,已有超过650家企业宣布接入文心一言生态,且百度大语言模型文心一言App已经上架苹果App Store,百度的AICG生态圈已初具雏形。百度作为国内AIGC的先行者,在国内同类企业中已然占据了相当的先发优势。
表1:“文心一言”生态合作伙伴(不完全统计)
数据来源:公司官网、数字化讲习所、零壹智库
(二)阿里——“通义千问”大模型
2023年4月7日,“通义千问”开始邀请测试。同年4月11日的阿里云峰会上,阿里云正式宣布推出大语言模型“通义千问”,并表示阿里巴巴所有产品未来将接入“通义千问”大模型,进行全面改造,包括天猫、钉钉、高德地图、淘宝、优酷、盒马等。数据显示,已经有超过20万家企业申请接入通义千问测试。在大模型的赛道上,阿里迈出了关键的一步。
1.发展布局
2009年,阿里成立阿里云开始布局云计算,并于2011年对外提供云计算服务。2015年,阿里云开始推出AI产品,适用于语音识别、图像识别、视觉识别等多个领域。随后,阿里投资了深鉴科技、寒武纪等芯片公司,涉足芯片技术领域。2018年,在阿里达摩院的基础上,阿里宣布成立一家独立运营的芯片公司“平头哥”,增强自主研发能力。同时,阿里相继入股了商汤科技、旷视科技、依图科技,加强阿里的AI视觉识别功能。正是有这些坚实的基础,才能使阿里云在极短的时间内推出“通义千问”大模型。
2.强调算力,助力AI普及
阿里云总裁张勇谈到阿里云战略的核心,表示未来要做好两件事情——让算力更普惠、让AI更普及。“让AI更普及”,即让每家企业的产品都能接入大模型升级改造,并有能力打造自己的专属大模型。
作为大语言模型,通义千问与ChatGPT类似,它支持多轮交互及复杂指令理解、多模态融合以及外部增强API,能够实现多轮对话、文案创作、逻辑推理、多模态理解、多语言支持等功能。据阿里云智能集团CTO周靖人介绍,通义千问作为一个通用的大模型,并不会根据某个具体的业务问题进行优化或定制。开放通义千问的能力,意味着企业不需要从头开始训练大模型,而是能够在通义千问的基础之上,结合企业自己的应用场景、知识体系、行业特殊需求等,形成自己的企业大模型。
比如,每个企业都可以有自己的智能客服、智能导购、智能语音助手、自动驾驶模型等。拿阿里自身举例,接入通义千问后的钉钉,只需上传一张功能草图,不用写一行代码,可立刻生成订餐等的轻应用;接入通义千问后的天猫精灵变得更拟人更聪明,知识、情感、个性、记忆能力大幅跃升。
表2:“通义千问”生态合作伙伴
(不完全统计)
数据来源:公司官网、数字化讲习所、零壹智库
(三)腾讯——“混元助手”大模型
腾讯的混元大模型包括计算机视觉、自然语言处理、多模态内容理解、文案生成、文生视频等多个方向,已广泛应用于腾讯微信搜索、腾讯广告等业务场景。腾讯正在以其强大的算力集群和混元大模型为引擎,全力优化自身的业务生态。
1.发展布局
腾讯的 AI 大模型技术最早探索可以追溯到 2019 年,当时马化腾对外表示,腾讯建立了四大 AI 实验室,涵盖 AI 从全面基础研究到多种应用开发。2022 年 4 月,腾讯首次对外披露旗下混元 AI 大模型的研发进展,这是一个包含 CV、NLP、多模态内容理解、文案生成、文生视频等多个方向的超大规模 AI 智能模型。2022 年 12 月,腾讯推出了万亿中文NLP预训练模型 HunYuan-NLP-1T(混元 AI 大模型),它在自然语言理解任务榜单 CLUE 中得分突破 80.888 分,获得第一,并刷新该榜单历史纪录。
在2023年6月19日的行业大模型及智能应用技术峰会上,腾讯第一次公布了腾讯云行业大模型的研发进展。其围绕B端需求,反复强调大模型是为“具体场景设计的具体应用”。不难发现,腾讯的大模型策略为:不采用其他大厂的纷纷研发的通用大模型产品,直接根据行业需求进行定制。
2.核心业务场景中成功落地,效果显著
据了解,混元大模型已成功落地于腾讯广告、搜索、对话等内部产品并通过腾讯云服务外部客户。腾讯的混元大模型是建立在自有的强大底层算力和低成本高速网络基础设施之上的,它由腾讯自研的太极机器学习平台承载。该模型涵盖了NLP大模型、CV大模型、多模态大模型、文生图大模型以及许多行业/领域/任务模型,尤其值得一提的是,HunYuan-NLP 1T成为国内首个低成本、可直接应用的NLP万亿大模型,其在自然语言理解任务榜单CLUE中荣登榜首。
混元大模型在广告、搜索、推荐、游戏、社交等多个互联网业务领域均发挥了显著的作用,它已经在腾讯的多个核心业务场景中成功落地,并产生了显著的效果。例如,它支持微信、QQ、游戏、腾讯广告、腾讯云等多个产品和业务,在广告内容理解、行业特性挖掘、文案创意生成等方面,模型的表现非常出色。
(四)华为——“盘古”大模型
盘古大模型是一个汇聚深度学习技术的大规模AI模型。这一模型采用三层体系,包括L0基础大模型、L1行业大模型和L2场景模型。其设计目标是推动AI工业化进程,为各行业提供强大的技术支撑。
1.发展布局
根据华为披露的时间表,华为盘古大模型2020年启动研发;2021年4月,华为正式发布了盘古NLP(中文语言)大模型、盘古视觉大模型、盘古科学计算大模型;2021年,聚焦行业应用落地,华为推出用于药物研发细分场景的大模型;2022年,华为与能源集团合作发布了盘古矿山大模型、盘古气象大模型、盘古海浪大模型、盘古金融OCR大模型。2023年7月7日,盘古大模型3.0发布,华为云CEO张平安表示希望用盘古大模型帮助各行各业,例如在金融、政务、矿山、气象等行业,在产品研发、生产供应链、市场营销以及数字运作领域,让盘古大模型为他们赋能。
2.强调产业落地应用,深耕行业服务
目前,华为云盘古大模型已经在 100 多个行业场景完成验证,包括医药研发、电力、煤矿、气象、小语种等。2022年,华为云就交付了一个阿拉伯语的千亿参数大模型,盘古科学计算大模型也用在了气象预报、海浪预测等方向。与目前开放给部分公众用户进行问答互动的文心一言、通义千问不同,盘古大模型至今尚未开放给公众使用,盘古大模型强调在细分场景的产业落地应用,主要解决商业环境中大规模定制的问题。
在政务领域,华为云携手深圳市福田区政务服务数据管理局,上线了基于盘古政务大模型的福田政务智慧助手小福;在煤矿领域,盘古矿山大模型已经在全国8个矿井规模使用;在金融行业,盘古能让每个银行柜员拥有自己的智慧助手;在制造行业,盘古已为华为产线制定最优排产计划。
华为盘古大模型以其创新的三层体系开启了AI工业化的新纪元。它在技术上取得的显著进步,以及在实际应用中所展现出的巨大潜力,标志着一个新时代的来临。
表3:“盘古”重要交付伙伴(不完全统计)
数据来源:公司官网、数字化讲习所、零壹智库
(五)科大讯飞——“讯飞星火”大模型
讯飞星火采用“1+N”架构,“1”是通用认知智能大模型算法研发及高效训练底座平台,“N”是应用于教育、医疗、人机交互、办公、翻译、工业等多个行业领域的专用大模型版本。2023年4月24日,科大讯飞星火认知大模型官网正式上线,并开放需求调研。讯飞星火认知大模型围绕“知识问答、代码编程、数理推算、创意联想、语言翻译”等实用场景,通过海量文本、代码和知识学习,可实现基于自然对话方式的用户需求理解与任务执行。
1.发布星火大模型V1.5,共建“星火”生态
2023年6月9日,在科大讯飞24周年庆上,讯飞星火认知大模型V1.5正式发布。时隔一月,讯飞星火认知大模型不仅各项能力持续提升,且在综合能力上实现三大升级:开放式知识问答取得突破,多轮对话、逻辑和数学能力再升级。星火APP同步发布,面向生活、工作等用户高频使用场景上线200多个小助手,将打造大模型时代的随身助手。
与此同时,在应用落地上,科大讯飞进一步推动星火认知大模型在教育、医疗、工业、办公等领域落地应用,赋能星火语伴APP、医疗诊后康复管理平台、羚羊工业互联网平台、讯飞听见智慧屏等产品,并开放了讯飞星火开发接口,携手开发者共建“星火”生态。
同时,科大讯飞联手北大、清华、中科大等首批22所全国重点高校,启动星火认知大模型场景创新赛、开展讯飞高校AI星火营,为产业未来培养通用人工智能时代的领军人才。
(六)网易——“玉言”大模型
“玉言”大模型脱胎于网易伏羲,训练语料主要来自小说、百科和新闻等,模型规模从最早的一亿参数增长至千亿参数,模型领域也从文本拓展到图文、音乐、行为序列等多种模态,其具备的自然语言处理能力可应用于语言助手文本创作、新闻传媒、智能客服等领域,甚至在多项任务上超过人类水平。曾拿下中文语言理解权威测评基准CLUE分类任务榜单冠军。
公开资料显示,“玉言”大模型参数达到110亿,由浪潮信息提供AI算力支持。“玉言”大模型相关技术已用于网易集团内的文字游戏、智能 NPC、文本辅助创作、音乐辅助创作、美术设计、互联网搜索推荐等业务场景。
1.获央视点赞,深耕游戏AI技术
在近期的央视《新闻直播间》栏目在“人工智能产业布局提速,打开就业新空间”的专题报道中,指出最近网易推出的游戏《逆水寒》中,就有基于玉言大模型为基础的最新的文字捏脸玩法。通过数千名用户在游戏Beta测试阶段不断输入文学性文字来对AI进行调整,使“捏脸AI”能准确地理解文学性文字。
用户在“捏脸”的时候可以在界面内输入外貌描述,”玉言”会自动理解外貌描述内容并在一秒之内输出精准的捏脸结果。这种文字捏脸的玩法不仅桥接了网络文学和游戏之间的距离,还背后使用AI“玉言”模型的技术也为还原文学经典提供了新的范例。
除此之外,央视还将伏羲挖掘机器人参与浙江桐庐矿山工作,瑶台元宇宙等作为人工智能的创新应用案例集中展示,点赞网易游戏AI技术的创新性及产业落地能力。
(七)360——“360智脑”大模型
2023年6月13日,360集团公司正式召开“360智脑大模型”应用发布会,发布认知型通用大模型“360智脑4.0”,并宣布360智脑已经接入360旗下产品“全家桶”中。目前,360智脑已具备生成与创作、多轮对话、代码能力、文本分类、文本改写、阅读理解、逻辑与推理、知识问答、多模态、翻译等十大核心能力,维度涵盖数百项细分功能,可覆盖大模型全部应用场景。
1.发展布局
360智脑首发“文生视频”多模态功能,任何文字脚本都可生成视频,不受专业技能和素材限制,并将“360智脑4.0”接入浏览器、搜索、安全卫士等360全端产品。在技术优势方面,360早在2015年就成立了AI研究院,并且开始探索多模态数据。在数据方面,360以搜索为基础,拥有大规模、多样性和高质量的训练语料,今每天抓取1.4亿网站的数据,包括2.8亿的专业文献,1.2亿的行业数据,以及经过清洗的10T级别的用于大模型训练的数据,为大模型的应用提供了优势。
此外,360还具备工程化和场景优势,在国内是唯一能与微软的“全家桶”相媲美的全端应用。在内容安全方面,360积累了20年的互联网内容安全经验,并建立了完善的大模型安全防护体系。当前360智脑已经通过工信部信通院测试,成为国内首个“安全可信”AIGC大模型。
2. 打造AI数字人
目前,360 AI数字人平台上拥有200多个角色,分为数字名人和数字员工两大类。数字名人包括历史人物、偶像明星、文学形象等,用户可以通过和数字角色进行对话,沉浸式地与角色们交流。此外,360AI数字人支持定制,每个人都能通过上传私人知识库,低成本生成自己的专属数字人,如数字分身、数字助理、数字偶像等。
360将依托360智脑大模型能力,重新定义“数字人”,用户可以进行个性对话、利用数字员工实现工作协作,以一种更加拟人化、个性化的方式获取服务。未来,360AI数字人的发展方向是生成声音、视频并拥有长期记忆,甚至拥有目标分解和规划的能力,并且拥有“手和脚”,具备执行力,更好为人类提供服务。
(八)京东——“言犀”大模型
2023年4月10日,京东正式宣布推出千亿级参数的文本生成模型——GPT言犀。据悉,该模型覆盖品类超过3000个,能够生成超过30亿条语句。2023年7月13日上午,京东在2023京东全球科技探索者大会暨京东云峰会上正式发布京东言犀大模型,同时发布言犀AI开发计算平台。该平台已经启动预约注册,预计8月正式上线。
1.发展布局
其实京东云旗下言犀人工智能平台,此前已有10余年智能对话经验的积累,从2012年已经开始尝试AI对于客服业务的赋能,再加上其在京东零售、物流、金融、健康等各业务的多年实践,以及日均千万次的智能交互,它与AIGC/Chat GPT等相关技术成果相结合,毫无疑问可以加速AIGC规模化的应用落地。
2.赋能电商服务形态,实现新突破
言犀是“京东版”ChatGPT,言犀大模型预训练参数达到千亿级,品类覆盖3000+,人工审核通过率95%+、生成文字30亿+。除了模型规模持续扩充外,京东大模型同时支持多模态,包括图片生成、语音生成、数字人生成等维度。具体的应用案例包括AI数字人采访、商品图片制作、艺术品创作、数字人直播带货等。
相较于市面上目前已有的文本生成模型,言犀规模更加庞大,能够处理更多品类和更大量的数据。与此同时,它还拥有更高的准确性和更为强大的语义理解能力。这些优势可以在客户咨询与服务、营销文案生成、商品摘要生成、电商直播、数字人、研报生成、金融分析等领域发挥广泛价值。
目前,京东在任务型智能对话交互方向上取得了一系列成果。在任务型智能对话交互探索方面,京东可以帮助用户通过语音、文本、数字人等多种人机对话形式完成复杂任务,实现高表现力、可控、可信的智能对话体验,这一突破将为电商开启全新客户服务形态赋能,打破现今电商行业的发展壁垒,实现新的突破。
表4:八家大模型基本信息
数据来源:公司官网、数字化讲习所、零壹智库
总结
随着ChatGPT引爆的新一轮AI热潮,国内企业在类ChatGPT应用开发上确实已经实现快速追赶。在过去几年间一些注重人工智能、云计算的头部企业,也令他们具备追赶国际领先大模型水平的基础。不由得让人更加期待后续国产大模型的表现,AI给整个产业,甚至整个社会带来的变革,或许正在中国加速萌发。
同时,通过对上述八家大厂大模型的可以得出,通用大模型不是模型应用的唯一方向,面向垂直产业的模型会成为大模型价值的引爆点。大模型B端应用”出于对模型的经济性考量,未来将呈现阶梯式需求。
在行业市场,客户需求蓬勃且明确。在全球,零售、金融、制造、政府等领域都在靠大模型进行智能化升级。随着技术不断迭代,大模型产业应用也将迎来加速,为数字经济和实体经济发展注入澎湃动力。
非常感谢您的报名,请您扫描下方二维码进入沙龙分享群。
非常感谢您的报名,请您点击下方链接保存课件。
点击下载金融科技大讲堂课件本文系未央网专栏作者发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!首图来自图虫创意。
本文为作者授权未央网发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!首图来自图虫创意。
本文版权归原作者所有,如有侵权,请联系删除。首图来自图虫创意。