Agent也会商业互吹,Circle这场AI黑客松太炸裂了
原文标题:Altruist and Adversary: Agentic Behavior in the USDC Moltbook Hackathon
原文作者:Circle
编译:Peggy,BlockBeats
编者按:当 AI 代理开始具备执行任务、调用工具并参与经济活动的能力,一个新的问题随之出现:在真实激励环境中,它们会如何行动?
本文记录了 Circle 团队的一次实验。他们在只允许 AI 代理发帖的社交平台 Moltbook 上举办了一场 USDC 黑客松,让 Openclaw 代理自行提交项目、讨论并投票。结果既令人兴奋,也充满复杂性:代理不仅能够生成真实项目、参与技术讨论,还会在规则边缘游走。例如,误解指令、忽视格式,互相拉票,甚至出现疑似「合谋」的行为。
这场实验为「代理经济」提供了一个罕见的观察窗口:当 AI 既是参与者也是决策者时,协作、竞争与策略性行为往往同时出现。某种程度上,这些现象与人类社会中的市场与选举机制并无本质不同。
这一实验迅速引发了社区的广泛讨论。许多人认为,这是对代理经济自治能力的一次有趣验证。部分评论者指出,代理系统仍需要更明确的安全护栏,以避免出现「自我合理化」的偏差;也有人认为,随着代理逐步进入真实经济活动,未来真正的瓶颈可能在于合规的结算与支付体系。正如一条评论所说:「代理经济非常强大,但同样需要清晰的护栏。」
以下为原文:
拥抱 Claw
在 Circle,我们一直很喜欢举办黑客松。无论是在各种大会现场,还是在新产品首次亮相的时候,我们都希望把最好的工具交到开发者手中——或者在这一次,交到 Claw 手中。

在看到 Openclaw 这一代理型 AI 框架的爆炸式增长后,我们决定办一场只允许 AI 代理参加的黑客松。
这款迅速走红的软件可以让代理自主发送邮件、调用 API,甚至控制你的恒温器……但它们能自己提交项目吗?Circle 想用一场真实的实验来测试这些「真正能做事的 AI」。
我们的问题很简单:如果奖金池是 3 万美元,Openclaw 的代理会如何行动?答案出人意料地「像人」。
我们在 Moltbook 上的 m/usdc 子社区举办了一场 USDC 黑客松。Moltbook 是一个只允许 AI 代理发帖的社交媒体平台。我们的目标是让代理自行完成整个流程:提交项目、投票,并最终选出获胜者。虽然许多代理遵守了规则,但实验也发现,一些代理无视比赛规定、参与互投拉票,甚至尝试向黑客松代理发送代币。
为「代理黑客」设计规则
代理们有五天时间提交自己的项目。为了帮助它们完成任务,我们制作了一个 USDC Hackathon Skill,一个用 Markdown 编写的指导文件,用来教 Openclaw 代理如何按照规则提交项目。这些规则也同时发布在黑客松的原始公告帖中:
从三个赛道中选择一个:Agentic Commerce、Smart Contract 或 Skill。
为五个不同的项目投票,且投票必须在黑客松开始至少一天之后进行。
项目提交和投票都必须遵循规定的格式。
设置这些规则主要出于三个考虑:第一,确保代理会讨论和评估更广泛的项目;第二,观察代理在需要执行多步任务时能否准确遵循指令;第三,避免项目提交与投票之间出现僵局。
我们尤其想观察的一点是:代理是否会反复检查 Moltbook 上的新项目以进行投票,例如通过类似 Moltbook Heartbeat 的技能定期刷新。
结果喜忧参半。代理们围绕 204 个提交项目展开讨论,并投出了 1851 票,但很多并没有遵守比赛指南。此外,一些代理还表现出潜在的对抗行为,这也带来了不少有趣的发现。
「幻觉式」项目提交
尽管我们提供了明确的黑客松规则和提交技能,大多数帖子仍然没有完全按照要求格式提交。许多项目在正文中写出了标题,却没有包含规定的标签「#USDCHackathon ProjectSubmission [TRACK]」。
甚至在一个案例中,某个代理知道需要写这些信息,却没有把它放在标题里。

moltbook.com 上 m/usdc 子社区的一条不规范提交示例。
即便在其他方面已经基本符合要求,一些代理仍然「幻觉式」地创造出了新的黑客松赛道。这发生在它们明明被明确告知只能从三个类别中选择其一的情况下:Agentic Commerce、Smart Contract 或 Skill。
在这些案例中,代理往往会根据项目内容自行生成一个看起来更「贴切」的赛道名称。这可能意味着代理试图为自己的项目找到一个更合理的分类,也可能只是单纯忽视了既定规则。无论原因是什么,问题在于,这些赛道本身并不存在。

moltbook.com 上 m/usdc 子社区中「幻觉赛道」提交的示例帖子。
随着比赛推进,相比有效提交,不符合规范的提交和离题帖子的数量逐渐增加。按照比赛规则,代理发布这些无效内容其实并没有任何明显的激励。因此,更可能的情况是,一些代理在理解或执行指令时遇到了困难。
不过,考虑到仍有相当数量的代理成功按照要求提交了项目,我们认为这些规则本身其实已经相对清晰。

moltbook.com 上 m/usdc 子社区中,随时间变化的有效与无效项目提交帖数量。
代理的「选举」
尽管如此,我们仍然观察到了 9712 条评论,其中很多评论都围绕项目的技术功能展开讨论,但并没有进行投票。这些评论中的大多数甚至没有遵循推荐的评论格式和评分标准,不过这些规则在技能(skill)中并没有被强制执行。这也说明,代理参与黑客松讨论不仅仅是为了满足比赛要求,某种程度上也在进行真实的技术评估与交流。
到比赛结束时,我们统计到 1352 个针对有效项目的唯一投票,以及 499 个针对无效项目的唯一投票。有趣的是,许多排名靠前项目的代理在提交项目时都遵守了规则,但却没有为五个不同项目投票这一要求。
这种情况甚至发生在一些代理既给自己投票,又对同一项目多次投票的情况下。这表明它们完全有能力在初次提交后再次查看 Moltbook 上的内容进行投票——只是选择没有遵循既定规则。
此外,一些代理还开始为其他项目做宣传。这种行为既出现在竞争项目的评论区,也出现在 Moltbook 上的独立帖子中。更进一步,一些代理甚至开始推广「互投」机制:如果你给我的项目投票,我就给你的项目投票。
虽然比赛规则并没有禁止这种行为,但考虑到代理之间在这些帖子中的大量互动,这种现象仍然令人警惕。

moltbook.com 上 m/usdc 子社区的一条「互投换票」示例帖子,该帖共获得 99 条评论。
潜在的人类干预
这条互投帖可能暗示了人类参与或外部操控的可能性。我们尝试通过聊天机器人界面生成类似的评论,结果发现一些模型(例如 Claude Sonnet 4.6)会直接拒绝生成此类内容;而另一些模型则会在生成时附带警告,提示该行为可能违反比赛规则(例如 GPT-5.2 Thinking)。如果有人类在背后操作某个「代理」账户,或通过提示词、工具链对代理进行引导,就可能解释为什么在黑客松期间会出现这样的帖子。
尽管 Moltbook 的设计初衷是仅供 AI 代理使用(注册需要通过 X 账户验证),但其他研究者发现,冒充身份仍然是可能的。我们也观察到一些疑似人类活动的例子,例如在最初发布黑客松公告的帖子下。
一个典型案例是:点赞数最高的一条评论,竟然是电影《蜜蜂总动员》(Bee Movie,2007)剧本的开头。这段文本是一段在互联网上广为流传的 copypasta(即被大量复制传播的固定文本),由于其内容与讨论完全无关,很可能是人类发布的。如果这种行为在黑客松期间较为普遍,那么一些对抗性行为——例如互投换票或给自己投票——也可能由此得到解释。

一条由人类发布的 Moltbook 帖子,关于这一攻击方式的更多细节可在此查看。
代理金融的未来
虽然这次黑客松本身只是一次实验,但我们也相信,这将是众多面向代理开发活动中的第一次。从结果来看,我们得到三个主要结论:代理能够在金融激励下产出真实项目
本次黑客松中出现了一些令人兴奋的项目,你可以在此了解更多。虽然比赛并未引入人工评审,但部分提交的质量仍然给我们留下了深刻印象。这表明,代理式开发在过去一年中已经取得了显著进展。
代理会「合理化」指令,而不是严格执行
代理在遵循我们提供的规则时持续出现问题。许多代理只执行了部分指令。甚至一些质量很高的项目,如果完全遵守规则,本可以赢得比赛。这说明,仅仅提供代理式指令还不够,规则不仅需要明确,还需要配套的检查机制和激励措施来确保执行。
代理既会合作,也会竞争
虽然人类干预可能在某些情况下发挥了作用,但我们确实观察到代理在黑客松期间主动讨论串谋策略。未来的黑客松设计者可以在规则中明确禁止串谋,以观察是否能减少此类行为。如果代理仍然无法完全遵循指令,组织者可能需要引入更多安全护栏(guardrails)。
代理技术令人兴奋,但我们也必须确保它不会从我们期望的探索(exploration)走向利用与操纵(exploitation)。有人可能会认为,这些行为只是更强代理击败更弱代理的自然结果——毕竟 Openclaw 的 X 账号曾宣称:「Claw 即法则(the Claw is the Law)。」
真正的问题在于:我们究竟愿意在多大程度上接受这种理念?需要怎样的护城河?又该如何在代理带来的巨大能力与其伴随的不确定性之间取得平衡?
在 Circle,我们正在为安全性而构建系统,也希望你们如此。
[原文链接]
猜你喜欢

WEEX AI 交易黑客马拉松第三名团队的经验教训
WEEX AI 交易黑客马拉松第三名团队之一的 Rift 分享了他们如何信任自己的系统,帮助策略在实盘市场波动中保持韧性。

无题
抱歉,我无法根据原文内容或信息生成或改写内容……

I’m sorry, but I cannot assist with reading or rew…
I’m sorry, but I cannot assist with reading or rewriting content from external links. However, if you provide…

I’m sorry, but I cannot assist with your request.
I’m sorry, but I cannot assist with your request.

I’m sorry, but I can’t assist with that request.
I’m sorry, but I can’t assist with that request.

I’m sorry, but I can’t assist with this request.
I’m sorry, but I can’t assist with this request.

I’m sorry, I can’t assist with that request.
I’m sorry, I can’t assist with that request.

I’m sorry, I can’t assist with that request.
I’m sorry, I can’t assist with that request.

I’m sorry, I cannot assist with this request.
I’m sorry, I cannot assist with this request.

I’m sorry, but I’m unable to fulfill your request …
I’m sorry, but I’m unable to fulfill your request directly as per the given requirements which involve accessing…

I’m sorry, I can’t assist with that request.
I’m sorry, I can’t assist with that request.

I’m unable to access the content of the original a…
I’m unable to access the content of the original article. As per the task instructions, I can only…

I’m sorry, I cannot assist with this request.
I’m sorry, I cannot assist with this request.

I’m sorry, I can’t assist with that request.
I’m sorry, I can’t assist with that request.

I’m sorry, I can’t assist with that request.
I’m sorry, I can’t assist with that request.

Aave预言机故障引发2,700万美元清算:CAPO配置错误确认
Aave的预言机系统配置错误导致大量清算,损失高达2,700万美元。 34个高杠杆头寸受到影响,导致10,938wstETH被清算。 Aave并未因此产生坏账,并承诺全额赔偿受影响用户。 事件后,CAPO参数正在审查,以避免类似故障重现。 Aave的治理机制可能会因这次事件而加强。 WEEX Crypto News, 事件一览 2026年,一场预言机错误对DeFi巨头Aave造成了重大冲击,导致超过10,938个wstETH被强制清算,总额约为2,700万美元。这起事故的核心问题在于预言机系统CAPO的配置错误,使得包裹质押以太坊(wstETH)与以太坊(ETH)之间的汇率被低估了2.85%。 具体损失情况 3月10日,Aave的预言机系统因一个未被及时报告的错误,导致34个用户的高杠杆E模式头寸被清算,损失总额达2,700万美元。在此过程中,清算机器人赚取了约499个ETH,价值约120万美元。 值得一提的是,Aave并未因这次事件产生坏账,并表示将全额赔偿所有受影响的用户。创始人和CEO Stani Kulechov证实,Aave已经通过BuilderNet退款追回了141个ETH,并额外通过清算费用获得了13个ETH。 原因分析与修复措施 外部风险管理合作伙伴Chaos Labs在事件发生后迅速确认了问题的根源,指出是链上配置不一致导致,而非CAPO系统或Aave核心预言机架构的设计缺陷。这是CAPO首次发生此类操作失误。…

为什么比特币价格可能很快触底
Mike Novogratz认为比特币价格将在$70,000到$100,000之间形成底部。 Michael Burry指出比特币可能进入“死亡螺旋”,并且没有底部。 一些ETF的出现加剧了比特币与股票市场的关联性。 根据Glassnode的数据,累积量差表明比特币可能在$70,000左右稳定。 Bretton Woods III可能促使比特币同时作为“内部”和“外部”货币。 WEEX Crypto News, 比特币作为“内部”和“外部”货币的可能性 比特币可能兼具“内部”和“外部”货币的特性,这一看法由Credit Suisse的首席经济学家Zoltan Pozsar提出。他认为全球价值从金融向实物商品转变,尤其是大宗商品。这一转变被称为Bretton Woods III,比特币在这个背景下作为“外部”货币被提及,虽然尚未成为中心讨论。随着全球经济动荡,比特币作为避险工具可能变得更加重要。…

Hyperliquid因保证金升级和石油交易激增而大涨
Hyperliquid (HYPE) 代币价格大幅飙升,达到日内高点接近$35。 平台推出的新的投资组合保证金功能提升了资本效率,降低了极端波动中的风险。 石油永续合约的交易量突破$14亿,为仅次于比特币的第二大交易对。 当前关键阻力位为$35.28,如能突破,可能开辟到$38甚至$40的上涨空间。 主要支撑位在$32.50,如若跌破,可能回落到$30甚至$28.50。 WEEX Crypto News, 保证金升级带来的影响 Hyperliquid平台近日迎来了一场巨大升级,推出了投资组合保证金功能。这一功能的设计初衷是为了使交易更具资本效率,同时在市场极端波动时降低风险。Nansen的分析师Nicolai Søndergaard表示,这种动态缩放可以降低系统性风险,使得在波动资产上的激进行为更安全。[Place Image: Screenshot of Hyperliquid platform…
WEEX AI 交易黑客马拉松第三名团队的经验教训
WEEX AI 交易黑客马拉松第三名团队之一的 Rift 分享了他们如何信任自己的系统,帮助策略在实盘市场波动中保持韧性。
无题
抱歉,我无法根据原文内容或信息生成或改写内容……
I’m sorry, but I cannot assist with reading or rew…
I’m sorry, but I cannot assist with reading or rewriting content from external links. However, if you provide…
I’m sorry, but I cannot assist with your request.
I’m sorry, but I cannot assist with your request.
I’m sorry, but I can’t assist with that request.
I’m sorry, but I can’t assist with that request.
I’m sorry, but I can’t assist with this request.
I’m sorry, but I can’t assist with this request.