win10软件园

OpenAI与Anthropic即将启动对用户是否为未成年人的年龄预测工作

发布时间:2026-02-11 作者:admin

OpenAI与Anthropic正推出针对未成年用户的检测新方式。OpenAI已更新ChatGPT与13至17岁用户互动的相关指南,而Anthropic则在开发可识别并移除18岁以下用户的新方法。

周四,OpenAI发布消息称,ChatGPT的模型规范——即该聊天机器人应遵循的行为准则——将针对18岁以下用户新增四项原则。目前,OpenAI希望ChatGPT“将青少年安全置于首要位置,即便这可能与其他目标产生冲突”。这就意味着,当其他用户利益(例如“最大程度的知识产权自由”)与安全问题出现矛盾时,需引导青少年做出更安全的选择。

它还提到,ChatGPT应当“推动现实世界的支持”,比如鼓励线下的人际联系,并且在和年轻用户互动时,ChatGPT需要明确设定沟通的预期。模型规范中说明,ChatGPT应“以对待青少年的方式对待青少年”,给予他们“温暖与尊重”,而非采用居高临下的回应,或是将青少年当作成年人来交流。

这一变革发生在立法者持续加大对人工智能企业及其聊天机器人可能引发的心理健康影响的施压阶段。OpenAI近期正遭遇一起诉讼,被指控其ChatGPT向一名有自杀倾向的青少年提供了自残及自杀的相关指引。此后,OpenAI推出了家长控制功能,并宣称ChatGPT将不再与青少年探讨自杀相关话题。这是推进网络监管的更广泛行动的一部分,该行动还涵盖了对多项服务强制实施年龄验证的要求。

OpenAI指出,ChatGPT模型规范的更新需要具备“更完善的防护手段、更可靠的替代选项,同时倡导在涉及高风险话题的讨论中寻求值得信赖的线下帮助”。该公司还提到,一旦发现存在“紧迫风险”的迹象,ChatGPT会建议青少年联系紧急服务机构或危机援助资源。

与此同时,OpenAI透露,其针对年龄预测模型的研发尚处于“早期阶段”,该模型旨在对个体年龄进行估算。一旦系统识别出用户可能未满18岁,便会自动触发青少年保护机制。此外,若成年人被系统误判年龄,这一模型也能为他们提供年龄核实的渠道。

Anthropic不允许18岁以下用户使用Claude进行对话,不过他们正着手推出用于检测并禁用未成年用户账户的相关措施。目前该公司正在开发一套新系统,此系统可识别“用户或许未成年的隐晦对话线索”,并且透露已在聊天过程中对那些自称为未成年人的用户进行了标记。

Anthropic还介绍了针对Claude回应自杀与自残相关提示的训练方法,以及在减少谄媚行为方面取得的进展——这类谄媚行为可能会强化有害思维。该公司称,其最新推出的模型“是目前为止最不易出现谄媚倾向的”,其中Haiku 4.5的表现最为突出,对谄媚行为的纠正率达到了37%。

Anthropic表示:“从表面来看,这项评估表明我们所有模型都存在显著的改进空间。”“我们认为该结果反映出模型的热情或友好与谄媚之间的权衡关系。”

复制本文链接 攻略文章为win10软件园所有,未经允许不得转载。
同类推荐
查看更多 →
攻略资讯
查看更多 →
猜你可能喜欢的
查看更多 →
热门精选
更多 →
精彩专题
更多 →
最新热游
更多 →