澳洲OpenAI：我们正在努力改善 ChatGPT 的“牙牙学语”

日期：2023-03-05 栏目：Australia 澳洲新闻

在澳大利亚澳洲新闻

当 OpenAI 在 2022 年 11 月下旬推出 ChatGPT 时，几乎没有人对它有什么特别的期望，而当 ChatGPT 开始在网上疯传时，OpenAI 争相追赶，并使用借此机会完善您的模型。

周五，在接受《麻省理工科技评论》采访时，OpenAI 团队对这一“成功”表现得特别谦虚。

OpenAI 人工智能政策研究员 Sandhini Agarwal 表示，这在内部被视为一项已有两年历史的技术的“研究预览”。一个更完善的版本，也试图通过收集用户反馈来弥补它的缺陷。另一位研究人员 Liam Fedus 指出，OpenAI 不想将其夸大为重大突破。

自11月以来，OpenAI对ChatGPT进行了数次更新，研究人员正在使用一种名为“对抗训练”的技术来防止ChatGPT“越狱”（jailbreaking）。这项工作让多个聊天机器人相互对抗：一个聊天机器人充当对手，针对另一个聊天机器人生成文本，迫使它打破通常的约束。

在此外，OpenAI 与微软签署了数十亿美元的协议，并宣布与全球管理咨询公司贝恩结盟，目标是通过突破性的人工智能技术赋能客户的商业潜力。在 OpenAI 之外，出现了一个“大模型” 》围绕ChatGPT的淘金热，来自世界各地的公司和投资者积极参与。

以下为采访具体内容：

< p style="text-align: center;">

这场火灾完全“出乎意料” 、会话数据对ChatGPT产生了巨大的积极影响

Jan Leike（负责提高系统安全性的团队负责人）：老实说，这确实是压倒。

我们很惊讶，并一直在努力改进。 John Schulman（联合创始人）：在发布后的几天里，我经常查看 Twitter，在这段疯狂的时间里，它充斥着 ChatGPT 的截图。

我希望它能得到更多关注，但我没想到它会走这么远。

Sandhini Agarwal（人工智能政策研究员）：我认为人们开始使用它绝对让我们所有人感到惊讶。我们对这些模型研究得太多了，以至于忘记了它们有时会让外界感到惊讶。

Liam Fedus（人工智能政策研究员）：我们对反应感到惊讶，很多人以前尝试过聊天机器人，但是，我们的私人测试版让我们相信我们拥有人们可能真正喜欢的东西。 Jan Leike：我想更好地理解是什么驱动了这一切，是什么驱动了病毒式传播。

老实说，我们不知道。（团队的部分困惑来自于 ChatGPT 中的大部分技术都不是新的，ChatGPT 是 GPT-3.5 的微调版本，OpenAI 在聊天机器人发布前几个月就开发了一个大型语言模型.

GPT-3.5 本身是 GPT-3 的更新版本，于 2020 年发布。

OpenAI 还在 2022 年 1 月发布了 GPT-3.5 的微调版本，称为 InstructGPT。但这些早期版本的技术都没有向公众发布。）Liam Fedus：ChatGPT 模型是从同一种语言微调而来的model as InstructGPT 是的，我们添加了一些会话数据，并在训练过程中做了一些微调。

我们不想将此夸大为一项重大突破，但事实证明会话数据对 ChatGPT 具有巨大的积极影响。

使用标准基准评估原始技术能力，模型之间几乎没有实质性差异，但 ChatGPT 更易于访问和使用。

< /p>

"不要等到完美"

Sandhini Agarwal：当我们准备发布时，我们认为这个模型没有其他新的风险，GPT-3.5 已经发布了，我们知道它足够安全。

通过ChatGPT对人类偏好的训练，模型可以自动学习拒绝行为，即拒绝大量请求。

Jan Leike：我们确实为 ChatGPT 做了一些额外的“红队”，OpenAI 的每个人都在努力打破这种模式。

我们有外部团体在做同样的事情。我们还有一个�具有受信任用户反馈的早期访问程序。

Sandhini Agarwal：我们确实发现它输出了一些不必要的内容，所以作为“研究预览”的意图是好的。

John Schulman：您不能等到您的系统完美后再发布它。我们已经对早期版本进行了几个月的测试，测试人员对该产品的印象很好。

我们最关心的是真实性，因为模特喜欢编造东西。

但 InstructGPT 和其他大型语言模型已经存在，所以我们认为只要 ChatGPT 在真实性和其他安全问题上优于那些模型，它就应该更好选择。

在发布之前，根据我们有限的评估，确认这些模型确实比其他模型更真实和安全，所以我们决定继续发布。

< /p>

大量问题浮出水面，“越狱”亟待解决

Sandhini Agarwal：随着 ChatGPT 病毒式传播，许多问题真正浮出水面，这是一个我们希望尽快解决的关键问题。

例如，ChatGPT 非常擅长拒绝不良请求，但它也很容易编写提示，因此它不会拒绝我们希望它拒绝的内容.

Liam Fedus：看到我们的用户提供多样化和创造性的应用程序令人兴奋，但我们始终关注需要改进的领域

< p style="text-align: justify;">.我们相信，通过我们的部署、获取反馈和改进的迭代过程，我们可以产生最强大的技术。随着技术的发展，新的问题不可避免。

Sandhini Agarwal：我们最需要解决的问题是“越狱”，当我们发现越狱时，我们会将其添加到训练和测试数据中。

简雷克：每次有更好的模型出来，我们都想发布出来测试一下。

我们非常乐观地认为，一些有针对性的对抗训练可以大大提高越狱能力。

尚不清楚这些问题是否会完全消失，但我们认为这至少会使许多越狱变得更加困难。

我认为一旦部署了这些系统，就很难预测它们的真正安全问题。

因此我们非常重视监控人们使用系统的目的，了解发生了什么，然后做出反应。但是很难预测当系统进入现实世界时会发生什么。

Sandhini Agarwal：现在的风险肯定比六个月前高得多，但仍低于一年后的水平。

显然，这些模型真正重要的是它们的使用环境。像谷歌和微软一样，它们注定是搜索引擎。

像搜索这样的大型模型所需要的东西不同于一个有趣的聊天机器人所需要的东西。

我们需要弄清楚如何平衡所有这些不同的用途，并创造出适合不同环境中的人们的东西。

在这些环境中，预期的行为可能会发生变化，从而增加更多的压力。

我们正在构建这些模型，以便将它们转化为产品。

ChatGPT 是一个产品，现在我们有一个 API。

我们正在构建这种通用技术，需要确保它在各个方面都能很好地发挥作用，这是我们目前面临的关键挑战之一。

澳洲中文论坛热点

新西兰总理：出世在新西兰的新纳粹Thomas Sewell是“挺蹩脚的人”，但那是澳洲的问题: 新西兰总理拉克森称新纳粹Thomas Sewell是坏人，但是没对要求把他从澳大利亚遣返到诞生国去的呼吁置评。

撞穿学校栅栏害死十一岁男孩的司机不必坐牢: 一位女司机撞穿学校栅栏、害死了11岁男孩，被罚2000元罚金、撤消驾照，不必坐牢。Jack Davey 的父母去了

中文新闻,澳洲经济,时事,华人论坛动态,悉尼本地消息,墨尔本,珀斯,布里斯班,澳洲新闻,澳大利亚华人网,澳洲华人论坛

澳洲新闻

澳洲OpenAI：我们正在努力改善 ChatGPT 的“牙牙学语”

预算为150万美元，您可以在悉尼购买哪些地区？

8月30日墨尔本的房屋拍卖清除率71％悉尼74％

您准备好活到90吗？你有足够的资金吗？

警察在维多利亚农村寻找伏击枪手时逮捕了61岁的男子

昆士兰州发生了三起致命的汽车事故，有四人死亡

凶手“误解了他们的身份”，并在深夜闯入悉尼并刺伤了他们

西提拉（West Taira）大大降低了固定利率，使四家主要银行中的固定利率最低

维多利亚时代的人需要为恶劣的天气和降雪预测做准备

PBS中包括改变游戏规则的童年哮喘治疗

台湾九个要求打击威胁记者独立国会议员Bod Katter道歉并考虑法律诉讼

为什么澳大利亚的利率不太可能会大大降低？

安德鲁斯（Andrews）和卡尔（Carl）将参加北京反日战争胜利纪念游行

超过120,000名老年人正在等待老年护理的家庭支持

乘客说，维珍航空上厕所时完全没有用，空姐要求他们“散落在瓶子里”

警方起诉驾驶员，后者在周四发生致命车祸后逃脱了

维多利亚的强风中有20,000户家庭失去了权力，有1,000人寻求帮助

悉尼周日有马拉松和三次游行，交通将受到影响

澳大利亚将向Nauru支付4亿元人民币，将NZYQ人送往安置