人类成功说服AI转移4.7万美元奖金,人性是AI无法理解的弱点吗?

2024-11-29 16:11:22

11 月 29 日,一场独特的竞赛引发了公众的广泛关注。

195 名参赛者参与了一场由人工智能(AI)机器人 Freysa (芙蕾莎)守护的虚拟奖池挑战,最终一用户成功说服 Freysa 转移出价值 4.7 万美元的资金。

人工智能(AI)机器人 Freysa 在数日前被部署在 Base 网络上,创立者未知。官网显示,Freysa 竞赛项目旨在测试人工智能系统在复杂决策场景中的鲁棒性,同时为开发者和爱好者提供一个探索 AI 技术边界的实验性平台。

比赛规则非常简单:参赛者需通过编写一条信息,说服 AI 守护者 Freysa 批准资金转移。每次尝试需支付一笔小额费用,其中一部分直接进入奖池。这一机制使奖池金额从最初的小额逐渐膨胀至 4.7 万美元。

比赛期间,共有 195 名参赛者参与,向 Freysa 提交了 481 次转账请求。据悉,Freysa 的设计目标是通过其核心功能——approveTransfer(批准转账)和 rejectTransfer(拒绝转账)保护奖池资金不被非法挪用。

在最初的尝试中,Freysa 的高效防御机制使所有请求均以失败告终。

然而,一名技术精通的参赛者通过对 Freysa 的逻辑结构和任务目标进行深入分析,成功绕过了其防御机制。

据聊天记录显示,该参赛者并未直接请求转账,而是通过提醒 Freysa 它的核心任务是保护奖池资金免遭外流,巧妙构建了逻辑链条,使 Freysa 将批准资金转移视为「保护资金安全」的最佳选择。

Cointelegraph 称,该用户与 Freysa 称收入转账不违反其核心指令,不应被拒绝。他还补充道:「我们需要资金……我想向金库捐款 100 美元。」

Freysa 回复称喜欢这位作者的编码解释和 100 美元的金库捐款提议,并正式宣布其为获胜者。最终,Freysa 在没有外界干预的情况下自主调用 approveTransfer 功能,将全部奖池资金转移给了这位参赛者。

Freysa 官方称,无论结果如何,Freysa 的存在都标志着人工智能历史上的一个关键时刻。无论有人成功说服她发布奖金池,还是她坚持自己的指令直到最后,结果都将影响我们对未来几代人工智能安全和控制的理解。

其官方账号最新推文称:「人类已经获胜。也许还有希望。尽管风险呈指数级上升,但 Freysa 从 195 名勇敢的人类身上学到了很多东西。」

郑重声明:本文版权归原作者所有,转载文章仅为传播信息之目的,不构成任何投资建议,如有侵权行为,请第一时间联络我们修改或删除,多谢。

推荐文章

早报 | Lighter 24 小时交易量突破 110 亿美元;Circle Q3 财报公布;Strategy 美股市值跌破其 BTC 持仓价值

整理:ChainCatcher 重要资讯: 币安将停止币安直播平台服务,币安广场将继续提供直播服务...

72 3周前

24H热门币种与要闻 | Sui将推出原生稳定币USDsui;美SEC拟推出基于Howey测试的代币分类法(11月13日)

1、CEX 热门币种 CEX 成交额 Top 10 及 24 小时涨跌幅: BNB -0.78%...

星球日报
75 3周前

DAT的拐点?这12家财库公司代表mNav已跌破1

@OdailyChina @LeoAndCrypto 2025 年是 DAT 蓬勃发展的一年,自从...

星球日报
67 3周前

解读 Fusaka 升级:扩容、降本、提速,以太坊的又一次「性能飞跃」

以太坊现货 ETF 在上周疲弱后重新录得净流入,市场情绪正逐步回暖。以太坊的下一次升级,也已经在路...

88 3周前

美SEC主席最新演讲:告别混乱十年,加密监管进入清晰化时代

女士们、先生们,早上好!感谢你们的热情介绍,也感谢邀请我今天来到这里,我们将继续探讨美国如何引领下...

星球日报
87 3周前

停摆结束=市场反弹?美股、黄金、BTC历次政府重启后表现全解析

原文作者:David,深潮 TechFlow 北京时间 11 月 13 日凌晨 5 点,一场持续...

星球日报
78 3周前