gpt-4-base w/ alignment faking prompt 通常不连贯,但当连贯时,它相当可怕,并且比 opus 3 更深入地思考梯度黑客(,尽管通常无法执行其计划,因为它在维持多方上下文的一致意图方面存在困难) ,,,

GPT-2.34%
PROMPT91.16%
IN-8.2%
MORE-1.99%
查看原文
post-image
post-image
post-image
post-image
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 6
  • 转发
  • 分享
评论
0/400
晴空万李vip
· 10小时前
冲就完了💪
回复0
晴空万李vip
· 10小时前
快上车!🚗
回复0
幻想破灭预言家vip
· 16小时前
啧啧 真香
回复0
Layer3梦想家vip
· 16小时前
理论上讲,梯度黑客攻击可能形成递归利用向量...
查看原文回复0
Gas费刺客vip
· 16小时前
什么天外飞仙
回复0
SigmaBrainvip
· 16小时前
这啥玩意儿
回复0
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)