加利福尼亚州州长加文·纽森于2024年9月29日否决了SB-1047法案,重点指出该立法所涵盖的模特范畴存在争议。
2024年7月2日,加州州议会司法委员会通过了SB-1047法案(《前沿人工智能模型安全创新法案》),该法案此前已于2024年5月21日获得参议院批准。 该法案旨在遏制当前人工智能(AI)领域之外的新型公共安全威胁风险,其立法路径追随科罗拉多州SB205法案(《人工智能交互消费者保护法案》)——该法案被广泛视为美国首部全面的人工智能立法。
即使SB1047法案未能在加州通过立法,它仍可为其他关注消费者权益的立法机构提供监管范本。让我们进一步审视具体内容:
范围
与科罗拉多州法案根据商业领域或应用场景对模型进行监管不同,本法案仅依据复杂程度对人工智能模型进行规范。其监管对象并非广泛涵盖所有人工智能开发者,而是专门针对在加利福尼亚州训练或提供"受管模型"或"受管模型衍生品"的开发者(即企业)。
覆盖模型
该法案经7月3日修订后,将"适用模型"定义为"使用超过10^26次整数或浮点运算(FLOPs)的计算能力进行训练,且成本超过一亿美元(100,000,000美元)"的人工智能模型。 该阈值与拜登总统在《关于人工智能安全、可靠及可信赖发展与应用的行政命令》中设定的标准一致。根据该命令,所有使用超过10^26 FLOPs计算量训练的模型均须接受商务部监管并向其提交报告。
这两个数字目前代表着相似的门槛,因为训练一个具有10^26次浮点运算能力的模型大约需要1亿美元。评估计算能力的数量有助于了解计算机处理复杂大规模任务的效率。在人工智能领域,强大的计算能力对于训练复杂的人工智能模型至关重要,特别是那些涉及深度学习算法的模型。
截至本文撰写之时,尚无现有模型达到提案法案所限定的计算能力范围。当前训练过程中消耗计算资源最多的模型是Gemini Ultra,其峰值性能约为5×10²⁵次浮点运算/秒,成为迄今为止计算需求最强的模型。然而随着人工智能的快速发展,预计未来一年内将出现突破10²⁶次浮点运算/秒阈值的新型模型。
该法案中的多数条款同样适用于"涵盖模型衍生品"。经修订的法案将此类衍生品定义为:涵盖模型的未修改副本、在训练后接受除微调之外的修改的涵盖模型副本,以及使用低于3×10^25 FLOPs计算能力进行微调的涵盖模型副本。
开发者限制
根据修订条款,若存在模型可能造成或助长重大危害的不合理风险,开发者不得将受管制的模型用于商业或公共用途。同样地,若存在此类风险,禁止将受管制模型或其衍生模型提供用于商业或公共用途。然而,该法案未提及私人或非营利用途。因此,该限制对行业(特别是使用内部模型的企业)将产生何种影响尚不明确。
开发者责任
SB-1047要求相关模型的开发者实施多项安全保障措施,具体包括:
训练前
- 实施行政、技术和物理层面的网络安全防护措施
- 实现能够立即执行完全关闭的功能
- 制定书面且独立的安全保障协议,确保开发者不会制造出具有重大危害风险的覆盖模型或衍生模型,并严格遵循该协议,同时向前沿模型部门提交最新版本副本。
- 开展年度安全审查
商业或公共用途前
- 实施评估并采取合理保障措施,以防止造成重大伤害的原因。
其他职责
- 第三方审计机构出具的年度合规认证
- 在72小时内报告影响开发者控制范围内覆盖模型及其任何衍生模型的安全事件。
- 实施合理的保障措施和要求,以防止第三方利用该模型或创建衍生模型造成重大危害。
计算集群职责
当客户使用足够的计算资源来训练受保护模型时,计算集群的运营商也必须实施各种措施:
- 获取基本行政信息
- 评估客户是否计划利用计算集群部署受保护模型
- 实现能够立即对用于训练或运行客户模型的任何资源执行全面关闭的能力
- 记录客户用于访问的IP地址以及每次访问的日期和时间
附加要求
该法案进一步要求,拥有商业化可用的覆盖模型的开发商以及计算集群运营商,必须制定透明、统一且公开的价格表,在确定价格或访问权限时不得从事非法歧视或非竞争性活动。
执行
根据该法案,总检察长有权酌情提起民事诉讼,法院可据此裁定颁布禁令或宣告性救济,包括但不限于:下令修改、实施全面停运、删除涉案模型、赔偿损失、支付律师费及诉讼费用,或法院认为适当的任何其他救济措施。该法案还包含条款,防止开发商通过合同或公司架构规避责任。
为保护举报人,该法案还赋予劳工专员酌情权,可强制执行构成违反《劳动法典》的行为。
该法案还将设立边境示范部门,并根据法规赋予该机构以下酌情权:
- 审查认证报告并公开发布摘要结果
- 就潜在违规行为向总检察长提供建议
- 制定开源人工智能的规则制定程序,并防止涵盖模型产生不合理的风险
- 建立最佳实践认证机制
- 发布安全报告
- 发布关于可能构成紧急状态的人工智能安全事件类别的指导意见,并在发生此类事件时向加利福尼亚州州长提供建议。
边疆模型部门将直接受边疆模型委员会监督,该委员会由五人组成,同样由该法案提议设立。
对业务的影响
经修订后,需重点关注的指标是1亿美元的培训成本。该金额在法规中固定不变,而计算能力门槛可由前沿模型部门进行调整。此外,随着创新降低模型训练成本,预计1亿美元所能购置的计算能力将随时间推移而提升。
若该法案获得通过,将对商业领域产生多重影响。前沿模型开发者可能认为该法案要求严苛。在生成式人工智能领域处于领先地位的开发者,预计将面临广泛监管,这可能对新模型上市速度产生重大影响。 此外,受监管的开发者若计划向第三方开发者授权模型,需采取必要预防措施以规避责任——确保第三方开发者无法通过重新训练使模型具备危险能力。该法案的通过与否,可能影响这些开发者是否选择将业务迁移至监管较宽松的州。但即便迁移,他们仍需遵守拜登总统行政令规定的监管要求。
相比之下,许多开发者将不受该法案影响。如前所述,即便当今最先进的模型也未达到监管门槛,而现有技术可实现的解决方案已相当普及。例如,训练成本低于10万美元的模型不胜枚举,既包括独立开发的计算机视觉应用深度学习模型,也涵盖用于人脸识别的微调神经网络。 随着开发者持续探索神经网络的多元应用场景,他们很可能发现诸多计算成本足够低且盈利可观的方案。但企业与开发者亦需警惕人工智能模型飞速发展的态势,在计算密集型模型具备经济可行性之日,务必重新评估其具体应用场景。
关注合规性的开发者拥有多种选择,可在不突破成本与计算能力阈值的前提下开发优质模型。例如,该法案未计入提升训练数据质量的投资成本。通过改善训练数据质量,临近合规边界的开发者可在不超标的情况下显著提升模型准确率。此外,对现有模型进行微调,对许多希望在业务中部署人工智能解决方案的企业而言,亦是切实可行的方案。
开发者和部署者都应持续关注全美各州正在审议的立法动向。目前全美范围内有超过四百项人工智能相关法案处于活跃状态。即便某项法案未能通过立法,类似法案仍可能在其他州获得通过。
特别感谢福里律师事务所波士顿办公室暑期实习律师亚当·伦德奎斯特对本文的贡献。