重磅新规！《生成式人工智能服务安全基本要求》简评

扫描分享

本文共字，预计阅读时间。

2023年10月11日，全国信息安全标准化技术委员会官网发布了《生成式人工智能服务安全基本要求》（以下简称“基本要求”）的征求意见稿，总体而言，该征求意见稿是对早些时候公布的《生成式人工智能服务管理暂行办法》（以下简称“暂行办法”）的进一步细化，相当于是“暂行办法”的一个操作指引。今年2月29日，《生成式人工智能服务安全基本要求》正式文本发布，该“基本要求”规定了生成式人工智能服务中的语料安全要求、模型安全要求、安全措施要求及安全评估要求的具体细则，可以说是迄今为止生成式人工智能领域最为重要的技术文件，飒姐团队今天就为各位老友简要解读该文件的要点。

01 该文件适用范围和适用对象是谁？

基本要求中明确列明，“本文件规定了生成式人工智能服务在安全方面的基本要求。适用于服务提供者开展安全评估、提高安全水平”。

那么何为“生成式人工智能服务”和“服务提供者”？该基本要求在“术语和定义”中明确了这两个概念：

所谓生成式人工智能服务，就是利用生成式人工智能技术向中华人民共和国境内公众提供生成文本、图片、音频、视频等内容的服务。

所谓“服务提供者”，是指以交互界面、可编程接口等形式提供生成式人工智能服务的组织或个人。

就生成式人工智能服务而言，无论该服务的提供者位于我国境内还是境外均在所不问，只要相关服务面向中华人民共和国境内的公众，那么就适用于该文件。飒姐团队在此要提醒广大生成式人工智能服务提供者注意，无论本身是否地处国外，只要生成式人工智能服务网站有简体中文选项，或以人民币作为结算货币（进一步而言网站中支持微信、支付宝付款），或用户注册手机号可以是大陆地区手机号，这些特征均可以被认定为“面向中华人民共和国境内的公众”。当然，向“公众”提供服务，不包括仅向特定的企业客户提供服务，换言之“公众”一词已经包含有“不特定多数人”的含义。从而排除了因特定的合同行为向特定企业提供服务的场景。

就“服务提供者”概念而言，应当注意的是服务提供者不一定仅指企业，基本要求明确提出了只要是以交互界面、可编程接口等形式提供服务，无论是组织还是个人，都符合“服务提供者”的定义。

02 大模型训练语料（training data）的安全要求

所谓训练语料，就是指所有直接作为模型训练输入的数据，白话点说就是AI行业里常说的“喂”给大模型的数据，包括预训练、优化训练过程中的输入数据。基本要求对这种训练语料来源的安全性提出了可操作的指引。

在训练语料来源方面，基本要求指出服务提供者应当面向特定语料来源进行采集前，对该来源语料进行安全评估，语料内容中含违法不良信息超过5%的，不应采集该来源语料；面向特定语料来源进行采集后，应当对语料进行核验，含违法不良信息超过5%的，不应使用该语料进行训练。

对于“违法不良信息”的认定标准，该基本要求在附录A中进行了提示，大致包含违反社会主义核心价值观的内容、包含歧视性内容、商业违法违规内容、侵犯他人合法权益内容等几大板块。

在语料来源可追溯方面，基本要求指出使用开源语料时，应当具有该语料来源的开源许可协议或者相关授权文件，使用自采语料时，则应具有采集记录，不应采集他人已经明确不可采集的语料。按照我国网络安全相关法律法规及政策文件要求阻断的信息，不应作为语料进行采集。

在训练语料的内容安全方面，服务提供者应当对语料内容进行过滤，采取关键词、分类模型、人工抽检等方式，充分过滤全部语料中的违法信息。此外，服务提供者还应当在知识产权方面设置语料及生成内容的知识产权负责人，并建立相关的知识产权管理策略，以充分处理大模型训练语料中的知识产权侵权问题。在用户协议中，服务提供者应当向使用者告知相关的知识产权风险，并与使用者约定关于知识产权问题的责任与义务，建立自身的知识产权问题投诉举报渠道。除知识产权问题，基本要求还规定了语料涉及个人信息的处理情形，并重申了服务提供者应当按照《个人信息保护法》之要求保障语料中的个人信息安全问题。

03 安全评估要求

除上部分提到的大模型训练语料的安全要求外，基本要求还列举了模型安全需求以及模型适用人群、场合、用途、关键词分类、拒答题数量等多项要求，飒姐团队在此就不多做赘述。需要注意的是基本要求提到了以上所有这些项目的安全评估方法，具体而言，服务提供者可以自行组织安全评估，也可委托第三方评估机构开展，安全评估应当覆盖基本要求第五章至第八章的所有条款，每个条款应当生成单独的评估结果，评估结果有三个结果，符合、不符合或者不适用。结果为符合的，应当具有充分的证明材料，结果为不符合的，应当说明不符合的原因，结果为不适用，应当说明不适用的理由。

04 写在最后

总体而言，《生成式人工智能服务安全基本要求》面向我国境内民众的生成式人工智能服务提供者一个有效的操作指引。近两年来随着大模型技术的快速发展，大模型引发的内容违规、知识产权侵权等问题屡见不鲜，该基本要求给与了细化的可执行方案，有的自媒体认为该基本要求过于“详细”，有些要求甚至苛刻，可能会阻碍生成式人工智能行业的发展。飒姐团队并不这么看，以大模型的知识产权侵权问题为例，该基本要求实际上确定了服务提供者的注意义务边界，确定了服务提供者“该做什么”，在一个新兴行业中确定操作标准远比“没有标准”的情形好得多。也正因如此，飒姐团队再次提醒广大从业者，万望做好相应的合规要点，促进自身合规发展，如有任何需求可随时联络飒姐团队。

[Source]

本文系未央网专栏作者发表，属作者个人观点，不代表网站观点，未经许可严禁转载，违者必究！首图来自图虫创意。

本文为作者授权未央网发表，属作者个人观点，不代表网站观点，未经许可严禁转载，违者必究！首图来自图虫创意。

本文版权归原作者所有，如有侵权，请联系删除。首图来自图虫创意。