扫描分享
本文共字,预计阅读时间。
北京时间6月11日,某果在全球开发者大会上公布了自家最新AI战略——将最新的“苹果AI”(Apple Intelligence)技术集成到最新款的产品中,并将OpenAI家的王牌产品ChatGPT引入。消息发布后,苹果股价第二天大涨7.26%,创历史新高,可见市场对于二者强强联手的未来十分看好。
6月20日,根据华尔街日报的消息,苹果正为自家AI寻找中国合作方,从而通过差异化竞争打开中国市场,实现Think Globle , Act Local的操作。目前,根据第三方消息,与苹果接触的公司主要有百度、阿里等几个目前国内头部的几个大模型开发商。
今天,飒姐团队就从我们目前为国内几家AI大模型厂商的合规建设经验,为大家讲讲,国内AI大模型怎么做才能成为“果家御用AI”,以及,为未来与其他大厂的合作打下坚实的合规基础。
01 苹果为什么需要国产大模型?
一个简单的回答:主要因为两个原因,其一,根据我国法律和行政法规的规定,在我国运营AI大模型需要履行严格的备案手续,《生成式人工智能服务管理暂行办法》第二十条明确规定:“对来源于中华人民共和国境外向境内提供生成式人工智能服务不符合法律、行政法规和本办法规定的,国家网信部门应当通知有关机构采取技术措施和其他必要措施予以处置”;其二,在AI大模型赖以维生的大数据方面,我国法律“卡”的越来越严,境外主体获取中国数据的成本极高。
因此,苹果与其付出巨大的合规成本,将自家苹果AI硬搬到我国落地实装,不如在我国挑选一家合适的AI大模型厂商合作共赢来得快。这样一来,不仅大大节约了自身的合规成本,也并不会影响下一代产品推出的速度。
当然,该种做法也不是没有弊端,最明显的一点就是,该种做法可能导致苹果产品出现明显的“地区性差异”,不同地区的AI大模型功能不一样、侧重点不一样,所带来的用户体验自然也是不一样的,这一点还有待大家在苹果AI产品实际落地后,进行横向测评才能得出最终结论。
目前来看,苹果与我国大厂在AI大模型方面深度合作绝对是一件好事,这不仅能让我国大厂从苹果“暴利”中分一杯羹,更重要的是,这是一个将自家AI产品推向世界、推向亿万C端客户的捷径。
可以预见的是,一旦苹果开了这个本地化合作的头,如果其他境外大厂想要通过AI赋能产品打入中国市场,与中国厂商的合作将会是一个可能的选择,那么,我国大模型厂商除了将产品做好外,如何合规操作才能使自己成为对外合作的“最优选”?答案是:做好自家大模型合规备案以及数据训练合规。
02 AI大模型合规备案的规定与实操经验
2023年我国公布了《生成式人工智能服务管理暂行办法》,其中第十七条规定:“提供具有舆论属性或者社会动员能力的生成式人工智能服务的,应当按照国家有关规定开展安全评估,并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续。”因而,目前在实践中,大部分(特别是语言类)的AI大模型运营者,都需要对自家大模型进行算法备案。在我国目前针对AI大模型产品的规范性文件方面,备案申请人还需要重点参考:《生成式人工智能服务管理办法》《互联网信息服务深度合成管理规定》《互联网信息服务算法推荐管理规定》《生成式人工智能服务安全基本要求(征求意见稿)》等规范性文件的相关规定。
飒姐团队提示,根据实践经验,所谓“具有舆论属性或者社会动员能力生成式人工智能服务”产品,一般具有以下属性:
1.主要面向C端用户使用的产品,特别是To C且收费的AIGC产品;
2.市场占有率高且原本就是知名行业大厂做出来的产品;
3.具有外资属性或被境外企业控制的厂商做出来的产品。
根据公开渠道的消息,苹果AI目前尚未在我国履行备案手续且没有听说有相应的计划。这 可能与我国备案标准相关,根据飒姐团队目前为各家大模型厂商提供合规服务的过程中积累的经验来看,凡是使用了境外大模型或者数据接口的产品,基本上无一通过备案。另外,网信部门在备案过程中更加倾向于(或者说更加鼓励)国内厂商自研的大模型,对于直接购买境外公司大模型后再进行改装的,通过率相较自研产品大大降低。
从以上实操经验来看,苹果AI大模型即使真的拿到中国来进行合规备案,也几乎没有通过的可能,因此不如与我国大模型厂商合作来得简单方便。
03 AI大模型数据训练的规定与实操经验
众所周知,数据是AI大模型的生命,如果没有庞大的数据作为训练基础,即使算法强如GPT,也只能沦为一个平庸而不实用的AI产品。因此,国内厂商在使用数据训练AI大模型时就需要额外注意训练数据的合规获取、合规处理等问题。
目前我国尚未建立起一套完整的AI大模型数据合规处理体系,相关规定不仅较为抽象概括且散在多个规范性文件中,例如《生成式人工智能服务管理暂行办法》第十九条规定:“有关主管部门依据职责对生成式人工智能服务开展监督检查,提供者应当依法予以配合,按要求对训练数据来源、规模、类型、标注规则、算法机制机理等予以说明,并提供必要的技术、数据等支持和协助。”
这就要求我们在实践中,去参考更加具体的标准和规范,来实现大模型数据合规。目前飒姐团队在与技术团队配合审查AI大模型数据及算法合规性的实务工作中,主要参考以下五个国产技术安全标准:
《信息安全技术 生成式人工智能服务安全基本要求》
《信息安全技术 生成式人工智能预训练和优化训练数据安全规范》
《信息安全技术 生成式人工智能人工标注安全规范》
《网络安全标准实践指南一生成式人工智能服务内容标识方法》
同时飒姐团队建议,想要做好AI大模型数据合规,还需要参考目前国际上AI技术较为发达、领先的国家或司法管辖区的相应规范。以近期欧盟中央数据监管机构欧洲数据保护委员会(EDPB)发布的《ChatGPT工作组工作报告》为例,未来欧盟将会主要从五个主要维度对AI大模型及泛AIGC产品进行合规审查:(1)合法性,即个人数据的处理是否符合《通用数据保护条例》等相关数据相关法律法规的规定;(2)公平性,即AIGC产品在利用数据训练时,不得造成第三方的利益损害、歧视等;(3)公开性,即数据收集时,需要向被收集者告知其数据可能被用于模型训练;(4)准确性;以及,(5)保护数据主体权利,例如撤回同意权、更正个人数据权、删除权等。
04 写在最后
合规建设是不可或缺的基石,要成为“果家御用AI”并与其他大厂大成合作,国产AI大模型厂商就需要在合规建设、数据安全、隐私保护、算法公正性等方面做出表率,只有这样,才能在激烈的市场竞争中脱颖而出,赢得用户的信任和市场的认可。
非常感谢您的报名,请您扫描下方二维码进入沙龙分享群。
非常感谢您的报名,请您点击下方链接保存课件。
点击下载金融科技大讲堂课件本文系未央网专栏作者发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!首图来自图虫创意。
本文为作者授权未央网发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!首图来自图虫创意。
本文版权归原作者所有,如有侵权,请联系删除。首图来自图虫创意。