微软报告称 GPT-4 易受“越狱”提示词影响生成不良内容

IT之家今日（10月18日）消息，微软旗下研究团队近日发表论文，详细研究了大型语言模型 (LLM) 的“可信度”和潜在毒性，特别关注 OpenAI 的 GPT-4 及其前代 GPT-3.5。研究团队，GPT-4 虽然在标准基准测试中比 GPT-3.5 更加可靠，但容易受到“越狱”提示（绕过模型安全措施）影响。GPT-4 可能会根据这些“越狱”提示，生成有害内容。论文中强调 GPT-4 更容易受到恶意“越狱”系统或用户提示影响，会准确地遵循（误导性）指令，生成不良内容，微软强调这个潜在漏洞不会影响当前面向客户的服务。获取更多RSS：https://feedx.net https://feedx.best

李芷晴

Oct 18, 2023 - 16:00

0 6

微软报告称 GPT-4 易受“越狱”提示词影响生成不良内容

IT之家今日（10月18日）消息，微软旗下研究团队近日发表论文，详细研究了大型语言模型 (LLM) 的“可信度”和潜在毒性，特别关注 OpenAI 的 GPT-4 及其前代 GPT-3.5。

微软报告称 GPT-4 易受“越狱”提示词影响生成不良内容

研究团队，GPT-4 虽然在标准基准测试中比 GPT-3.5 更加可靠，但容易受到“越狱”提示（绕过模型安全措施）影响。GPT-4 可能会根据这些“越狱”提示，生成有害内容。

微软报告称 GPT-4 易受“越狱”提示词影响生成不良内容

论文中强调 GPT-4 更容易受到恶意“越狱”系统或用户提示影响，会准确地遵循（误导性）指令，生成不良内容，微软强调这个潜在漏洞不会影响当前面向客户的服务。

获取更多RSS：
https://feedx.net
https://feedx.best

標籤:

匹配对战的三国志？《三国之志4》STEAM商店页面公布

匹配竞技游戏《三国之志4》公开招募测试玩家中

0

Like

0

Dislike

0

Love

0

Funny

0

Angry

0

Sad

0

Wow

李芷晴 https://tszching.uk

相關貼文

Xbox主管菲尔·斯宾塞分享个人2023年Xbox回顾

Xbox主管菲尔·斯宾塞分享个人2023年Xbox回顾

李芷晴 Dec 13, 2023 0 13

《如龙8外传夏威夷海盗》Steam页面上线售价263元

《如龙8外传夏威夷海盗》Steam页面上线售价263元

李芷晴 Sep 21, 2024 0 2

清华大学：女生喝奶茶更容易上瘾并导致抑郁焦虑

清华大学：女生喝奶茶更容易上瘾并导致抑郁焦虑

李芷晴 Oct 4, 2023 0 7

如果有個機會可以改變性別，你還會保留現在的性別嗎？

會

不會

Please select an option!

你之前已經投過票了

如果有個機會可以改變性別，你還會保留現在的性別嗎？

總投票: 21

會

19 %

不會

81 %

你現在還是單身嗎？

是

否

Please select an option!

你之前已經投過票了

你現在還是單身嗎？

總投票: 19

是

78.9 %

否

21.1 %

本網站使用 Cookies，繼續瀏覽網站，即表示您同意使用Cookies