AI Agent 框架是补全拼图的最後一角?框架的「波粒二象性」如何解读? BlockBooster |2025-01-03 20:00 重点解读框架的「波粒二象性」以及Agent框架为何能成为最後一角。
作者: Kevin, the Researcher at BlockBooster
AI Agent 框架作为产业发展的关键拼图,可能蕴藏着推动科技落地与生态成熟的双重潜力。市场中热议的架构有:Eliza, Rig, Swarms, ZerePy等等。这些框架透过Github Repo吸引开发者,建立声望。以「库」发币的形式让这些框架,和光同时具备波和粒子的特质类似,Agent框架同时具备严肃外部性和Memecoin的特性。本文将重点放在解读框架的「波粒二象性」以及Agent框架为何能成为最後一角。
Agent框架带来的外部性能够在泡沫消退後留下春芽
从GOAT诞生开始,Agent叙事冲击市场的力度不断上升,如同一位功夫大师,左拳“Memecoin”,右掌“行业希望”,你总会在其中一招里败下阵来。其实,AI Agent 的应用场景并未严格区分,平台、框架与具体应用之间界线模糊,但根据代币或协议的偏好仍可大致分类。但是,根据代币或协议的发展偏好还是可以分为以下几类:
进一步讨论Agent框架,可以看出它具有充分的外部性。有别於各大公链和协议的开发者只能在不同开发语言环境中选择,而产业内总的开发者规模并没有呈现对应市值增速的成长。 Github Repo是Web2和Web3开发者建立共识的之所,在这里建立开发者社区,比任何一个协议单独开发出来的「一插即用」包对Web2开发者的吸引力和影响力更强大。
本文提到的4种框架都已开源:ai16z的Eliza 框架获得6200颗星;Zerebro的ZerePy框架获得191颗星;ARC的RIG 框架获得1700颗星;Swarms的Swarms框架获得2100颗星。目前,Eliza 框架被广泛用於各种Agent应用,是覆盖范围最广的框架。 ZerePy的开发程度不算高,发展方向主要在X上,尚且不支援本地LLM和整合记忆体。 RIG的相对开发难度最高,但能给开发者最大限度地实现效能最佳化的自由。 Swarms除了团队推出mcs之外还没有其他用例,但Swarms可以整合不同框架,有较大想像空间。
此外,上述分类中,把Agent引擎和框架分割开来,或许或造成疑惑。但我认为二者是有差别的。首先,为什麽是引擎?联想现实生活中的搜寻引擎来类比是相对契合的。不同於同质化的Agent应用,Agent引擎的性能在其之上,但同时是完全封装的,透过api介面来调整的黑盒。使用者可以以fork的形式来体验Agent引擎的效能,但是又不能像基础架构那样掌握全貌和客制化自由。每个使用者的引擎就像在调教好的Agent上产生一个镜像,是对镜像做互动。而框架本质上是为了适配链,因为在Agent做Agent框架,最终目的都是和对应的链有整合,怎样定义数据交互方式,怎样定义数据验证方式,怎样定义区块大小,怎样平衡共识和性能,这些是框架需要考虑的事情。而引擎呢?只需要在某一个方向,充分微调模型和设定资料互动还有记忆体之间的关系就行,效能是唯一评价标准,而框架则不然。
用「波粒二象性」的视角去评估Agent框架或许是确保走在正确方向上的前提
Agent执行一次输入输出的生命周期中,需要三个部分。首先是底层模型决定了思考深度和方式,然後记忆体是自订的地方,在基础模型有了输出之後,根据记忆体再修改,最後在不同的客户端完成输出操作。
来源:@SuhailKakar
为了证实Agent框架具有“波粒二象性”,“波”具有“Memecoin”的特徵,代表社区文化和开发者活跃度,强调Agent 的吸引力和传播能力;“粒”代表“行业预期”的特徵,代表底层效能、实际用例和技术深度。我会分别从两个面向结合三个框架的开发教学为例进行说明:
快速拼接式的Eliza框架
设定环境
来源:@SuhailKakar
安装Eliza
来源:@SuhailKakar
3.设定档
来源:@SuhailKakar
4.设定Agent性格
来源:@SuhailKakar
Eliza的框架相对来说,易於上手。它是基於TypeScript,这是大多数Web 和Web3 开发者都熟悉的语言。框架简洁,没有过度抽象,让开发者轻松地加入自己想要的功能。透过步骤3,看到Eliza可以多客户端集成,可以将其理解为多客户端集成的组装器。 Eliza支援DC, TG和X等平台,也支援多种大语言模型,可以透过上述社群媒体实现输入,LLM模型来输出,并且支援内建记忆管理,可以让任意习惯的开发者快速部署AI Agent。
由於框架的简洁性和介面的丰富性,Eliza大大降低了存取的门槛,实现了相对统一的介面标准。
一键使用式的ZerePy框架
1.Fork ZerePy的库
资料来源: https://replit.com/@blormdev/ZerePy?v=1
2.配置X和GPT
资料来源: https://replit.com/@blormdev/ZerePy?v=1
3.设定Agent性格
资料来源: https://replit.com/@blormdev/ZerePy?v=1
效能优化式的Rig框架
以建构RAG(检索增强生成) Agent为例:
1.配置环境和OpenAI key
资料来源: https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
2.设定OpenAI 客户端并使用Chunking 进行PDF 处理
资料来源: https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
3.设定文档结构和嵌入
资料来源: https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
4.创建向量储存和RAG agent
资料来源: https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
Rig(ARC)是一个基於Rust 语言面向LLM 工作流引擎的AI 系统建构框架,它要解决更底层的效能最佳化问题,换句话说,ARC 是一个AI 引擎「工具箱」,提供AI 呼叫、效能最佳化、资料储存、异常处理等後台支撑服务。
Rig 要解决的是「呼叫」问题,以帮助开发者更好选择LLM,更好优化提示词,更有效管理token,以及如何处理并发处理、管理资源、降低延迟等,其重点在於AI LLM 模型和AI Agent 系统协作过程中如何「用好它」。
Rig是一个开源Rust 函式库,旨在简化LLM 驱动的应用(包括RAG Agent)的开发。因为Rig开放的程度更深,因此对开发者要求更高,对Rust和Agent的理解要求也更高。 这里的教学是最基础的RAG Agent的设定流程,RAG透过将LLM 与外部知识检索结合来增强LLM。在官网的其他DEMO中,可以看到Rig具备以下特徵:
可以看出相较於Eliza,Rig为开发者提供了额外的效能最佳化的空间,帮助开发者更好地调试LLM和Agent的呼叫和协作优化。 Rig以Rust 驱动性的效能、利用Rust 优势零成本抽象化和记忆体安全、高效能、低延迟的LLM 操作。能够在底层层面上,提供更丰富的自由度。
分解组合式的Swarms框架
Swarms旨在提供企业级生产级多Agent编排框架,官网提供了数十种workflow和Agent平行串行架构,这里介绍其中一小部分。
Sequential Workflow
资料来源: https://docs.swarms.world
顺序Swarm 架构以线性顺序处理任务。每个Agent在将结果传递给链中的下一个Agent之前完成其任务。此架构可确保有序处理,并且在任务具有依赖关系时非常有用。
用例:
层次化架构:
资料来源: https://docs.swarms.world
实现自上而下的控制,由上级Agent协调各下级Agent之间的任务。其中Agent同时执行任务,然後将其结果回馈到循环中进行最终聚合。这对於高度可并行化的任务非常有用。
电子表格式架构:
资料来源: https://docs.swarms.world
用於管理同时工作的多个代理的大规模群体架构。可同时管理数千个代理,每个代理都在自己的执行绪上运行。它是监督大规模代理输出的理想选择。
Swarms不仅是Agent框架,还可以相容於上述Eliza, ZerePy和Rig框架,以模组化的思想,在不同工作流程和架构中最大化释放Agent效能,以解决对应问题。 Swarms的构思和开发者社群进展都没问题。
Eliza:易用性最强,适合初学者和快速原型开发,特别适合社群媒体平台的AI互动。框架简洁,方便快速整合和修改,适合不需要过度效能优化的场景。
ZerePy:一键部署,适合快速开发Web3和社群平台的AI Agent应用。适合轻量级AI应用,框架简单,配置灵活,适用於快速建置和迭代。
Rig:专注於效能最佳化,尤其在高并发和高效能任务中表现出色,适用於需要细致控制和最佳化的开发者。框架较为复杂,需要一定的Rust知识,适合更有经验的开发者。
Swarms:适合企业级应用,支援多Agent协作和复杂任务管理。框架灵活,支援大规模并行处理,并提供多种架构配置,但由於其复杂性,可能需要更强的技术背景来有效应用。
总体来说,Eliza 和ZerePy 在易用性和快速开发方面具有优势,而Rig 和Swarms 更适合需要高效能和大规模处理的专业开发者或企业应用。
这就是Agent框架具有「产业希望」特性的原因,上述框架仍处於早期阶段,当务之急是抢占先发优势并建立活跃的开发者社群。框架本身的效能高低以及相对Web2流行应用来说是否落後都不是主要矛盾。只有源源不断涌入开发者的框架才能最终胜出,因为Web3产业始终需要吸引市场的注意力,框架性能再强,基本面再雄厚,如果难以上手导致无人问津,则本末倒置。在能够框架自身能够吸引开发者的前提,具有更成熟和更完整的代币经济模型的框架会脱颖而出。
而Agent框架有着「Memecoin」特性这一点,则非常好理解。上述框架代币都没有合理的代币经济设计,代币没有用例或用例非常单一,没有经过验证的商业模式,也没有行之有效的代币飞轮,框架只是框架,和代币之间没有完成有机结合,代币价格的成长除了FOMO之外,难以获得基本面上的助力,没有足够的护城河来确保稳定且持久的价值成长。同时,上述的框架本身也显得比较粗糙,其实际价值和当前市值并不匹配,因此有着强烈的「Memecoin」的特性。
值得注意的是,Agent框架的「波粒二象性」并不是缺点,不能将其粗暴的理解为既不是纯粹的Memecoin,又没有代币用例的半罐水。正如我在上一篇文章中提到的观点:轻量化的Agent覆盖着模棱两可的Memecoin面纱,社区文化和基本面不会再成为矛盾,一种新的资产发展路径正在逐渐浮出水面;尽管Agent框架初期存在泡沫与不确定性,但其吸引开发者和推动应用程式落地的潜力不容忽视。未来,具备完善代币经济模型和强大开发者生态的框架,或将成为这条赛道的关键支柱。
深度BaseElizaMemecoinVirtuals ProtocolAIai16z应用落地教程公链