资讯
IT之家 8 月 17 日消息,人工智能公司 Anthropic 昨日宣布为 Claude Opus 4 与 Claude Opus 4.1 推出新功能:在极少数情况下,模型可主动结束对话。该功能主要针对持续性的有害或辱骂性互动,典型案例类似用户索取可能导致大规模暴力或恐怖行动的信息。Anthropic 表示此举并非为了保护人类用户,而是为了保护 AI ...
该功能主要针对持续性的有害或辱骂性互动,典型案例类似用户索取可能导致大规模暴力或恐怖行动的信息。Anthropic 表示此举并非为了保护人类用户,而是为了保护 AI 模型本身,同时也与模型对齐和安全措施相关。
markdown Anthropic 近日宣布为其 Claude AI 系列模型,尤其是 Claude Opus 4 和 4.1 版本,引入一项重要更新:在特定情况下终止对话的功能。这一举措引发了业界对 大语言模型 ...
Anthropic宣布为其最新大型模型新增一项能力——在"罕见、极端且持续有害或滥用用户交互"情况下终止对话。值得注意的是,该公司表示此举并非为了保护人类用户,而是为了保护AI模型本身。 需明确的是,Anthropic并未宣称其Claude AI模型具有感知能力或会因用户对话受到伤害。用其原话说:"我们对于Claude及其他大语言模型当前或未来的潜在道德地位仍高度不确定。" ...
如果我在用电钻时钻头松了,我去敲打电钻对我不好——这会让我在得不到想要的东西时养成暴力反应的习惯。这对电钻肯定也不好。用语言对AI做同样的事必定一样糟糕,甚至更糟。 Ken ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果