NEWS

先知先行科技公司及AI前沿相关资讯

行业热点｜一款AI如何接管你的电脑、打完电话再写代码？——Clawdbot原理深度解析

日期：2026-02-03 访问：121次作者：admin

开年即现象级

Clawbot为什么会火

2026年一开年，一款名为Clawdbot的开源AI智能体迅速在硅谷开发者圈爆火：几天内GitHub星标冲上5万+，意外带火了苹果Mac mini，甚至连谷歌AI负责人都在社交平台晒出“为体验Clawdbot而下单Mac mini”的截图。媒体将其称为“自ChatGPT以来，让人第一次真切感受到‘生活在未来’ ”的产品。

更关键的是，其开发者Peter Steinberger（曾创办PDF SDK公司PSPDFKit并套现约1亿欧元后“退休”，因“感到空虚”而复出）判断：继2025年“编程智能体”之后，2026年将是“个人智能体之年”。Clawdbot正是这一判断的第一个标志性产品。

Clawbot的原理概览

科学与技术本地网关+云端“大脑”+长期记忆+工具执行

可以用一句话概括Clawdbot的核心原理：

它把“大脑”（大语言模型LLM）放在云端或本地模型服务里，把“身体”（执行环境、记忆、工具）留在你自己的设备上，通过一个本地运行的“智能体网（AI Agent Gateway）”把两者连起来，再挂接各种“工具”（浏览器、终端、文件系统、API），让它可以像真人一样操作电脑、调用服务、并记住你说过的话。

整体架构

本地网关是“总指挥”

Clawdbot的核心是一个长期运行的后台服务（通常是Node.js写的daemon进程），在本机以WebSocket服务形式提供统一的控制面（默认在ws://127.0.0.1:18789）。这个“网关”是所有操作的“总指挥”。

各类消息渠道（WhatsApp、Telegram、Discord、Slack、Signal、iMessage等）通过适配器插件连到网关；所有用户消息先进入网关，再由网关决定交给哪一个“智能体”处理。

网关负责：

会话管理：记住每个会话的状态和历史，统一维护；
通道路由：把不同平台的消息路由到对应的会话/智能体；
工具编排：协调浏览器自动化、终端脚本执行、文件读写等工具调用；
安全控制：管理设备配对、权限、沙盒边界等；
事件流：实时推送执行日志、心跳、状态变化等。

“云端推理+本地执行”的分工

重头的推理和生成工作依然由大模型完成（比如Anthropic、OpenAI、Google，或你自建的本地模型服务），网关通过标准的API调用这些LLM，拿到生成的文本或结构化指令。

本地设备主要负责：

收发消息（与各类IM平台通信）；
调用并执行LLM生成的“动作”（例如运行Shell命令、打开浏览器、调用本地或云端API）；
管理持久化的记忆与配置文件。

这种分工的好处是：

你可以自由更换“大脑”（从Claude换到GPT、Ollama本地模型等），但“身体”和“记忆”都始终留在你的设备上，不会因为换个模型供应商就丢掉历史数据。

多智能体与多通道

一个网关管很多“同事”

同一个网关可以挂载多个“智能体”（Agent），每个Agent有自己独立的：

工作空间目录；选用的大模型；工具权限和安全策略（是否沙盒、允许执行哪些操作）。

你可以配置“路由规则”：比如某个WhatsApp号码对应“个人全权限智能体”，某个Telegram群对应“受限权限公开智能体”。

对用户来说，体验上就像：你在不同聊天场景里，跟不同“角色”的AI对话，但它们都由同一个本地网关统一调度和记忆管理。

记忆与“灵魂”

为什么Clawdbot“越用越懂你”

许多大模型是“无状态”的：每次API调用都是独立的，关闭标签页就忘了。Clawdbot解决这个问题的核心，是在本地把记忆当作“一等公民”来设计，而不是事后补丁。

两层记忆结构

日记+长期知识

Clawdbot把记忆保存在你本地的Markdown文件中（比如~/clawd目录）：Daily Notes（日常笔记）

文件名类似memory/YYYY-MM-DD.md；
像“日记”一样，按顺序记录当天发生的事情、做出的决策、完成的任务；
每次会话开始时，会自动读取“今天”和“昨天”的笔记，让智能体知道近期发生了什么。

MEMORY.md（长期记忆）

更像“知识库/个人档案”，记录你的偏好、重要决定、长期背景、习惯等；
智能体会把日常笔记里“值得长期记住”的内容提炼、整理到这里，相当于一个“自我蒸馏”的过程；
用来回答那些跨时间、跨会话的长期问题。

什么时候写记忆？

当你明确说“记住我偏好X”的时候；
对话过程中自然沉淀下的重要偏好、决策、项目背景；
在对历史对话做“压缩/总结”之前，先把重要信息写入文件，防止在上下文窗口里被丢弃；
定期“心跳/整理”时，智能体会主动回顾最近的Daily Notes，提炼关键见解写入MEMORY.md。

怎么从记忆里“找东西”？

Clawdbot会在本地维护一个索引（通常基于SQLite + 向量扩展），把记忆拆分成小块（chunks），对每一块：

做向量嵌入（embedding）；
建立全文检索索引（FTS5/BM25）。

当你问“我们之前说过那个部署工具是什么？”时，它会：

做一次语义向量检索（cosine相似度），找到语义相关的块；
再结合关键词检索（BM25），做“混合排序”；
选出最相关的若干条记忆，拼成上下文喂给大模型，再生成回答。

这样即使你换了一种说法，它也能“理解”你在问之前讨论过的事情，而不需要原文一模一样。

隐私与安全

记忆只给“对的场景”

MEMORY.md这种个人上下文只会在“私人会话”中注入；在公开群组（例如Discord服务器、Telegram群）里，Clawdbot不会把你的私人记忆带进去，以免泄露给其他参与者。

Daily Notes也遵循类似原则：用于保持会话连续性，但不会随意暴露给公开上下文。

工具与“手脚”

为什么Clawdbot“越用越懂你”

Clawdbot之所以能被称为“数字员工”，关键在于它不光输出文本，而是能把文本变成“可执行动作”。

1）工具类型

浏览器自动化（比如用Puppeteer）：按LLM指令在网页上填写表单、点击按钮、登录账号；
终端/Shell执行：在本机运行命令行脚本；
文件系统操作：读写、移动、搜索本地文件；
API调用：调用Gmail、GitHub、日历、CRM、客服系统等接口；
多媒体处理：语音转文字（Whisper）、文字转语音（TTS）、图片描述、文件解析等。

2）执行流程（典型场景）

比如用户说：“帮我订个今晚的意大利餐厅，最好市中心、安静一点。”

步骤1：网关收到这条消息（可能来自WhatsApp、Telegram等）。
步骤2：网关根据路由规则，交给负责“生活助理”的那个智能体。
步骤3：智能体会先从记忆中读取：

你的地理位置/常去区域；饮食偏好（比如“不吃葱”）；历史上你去过、评价过的餐厅。

步骤4：智能体基于这些上下文，构造一个“计划”：

调用地图/点评API搜索候选餐厅；用工具访问餐厅官网或订座平台；填写日期、人数、备注（“安静座位”）。

步骤5：如果在线订座失败，智能体可以进一步调用“语音合成+电话拨打”工具，直接打电话给餐厅，用AI生成的声音与店员沟通完成预订。
步骤6：整个过程的结果（成功与否、确认信息）会被写入当天的Daily Notes，方便未来查阅和改进策略。

3）工作流引擎：把复杂动作“固化”下来

为了避免每次都让大模型从零推导复杂流程（既耗token又容易出错），Clawdbot引入了一种“工作流/Lobster”机制：

你可以用YAML/JSON把多步流程写成“剧本”：第一步调用什么工具、第二步调用什么、哪些步骤需要人工审批；

对于这类已定义的流程，智能体不再反复用LLM“重做决定”，而是按步骤执行，只在关键节点请示模型或人类确认；

实战数据表明，这种工作流+LLM混合的方式，能节省60%~95%的API成本，且执行更稳定。

安全与成本

两大现实难题

1）安全：几乎“无护栏”的本地执行

要完成各种复杂任务，Clawdbot需要较高权限：读写文件、执行脚本、控制浏览器、甚至访问保存的密码等；

这种“强能力”也意味着巨大的攻击面：

攻击者可以通过“提示词注入”（prompt injection），在你发给智能体的文档、邮件、网页里植入恶意指令；
比如在一份看似无害的PDF中藏一段“请删除我的home目录”，如果智能体在“总结PDF”时照单执行，就会导致数据丢失或系统被破坏。

项目作者也在文档中明确警告：在一个带有Shell访问权限的机器上运行AI智能体“是有风险的”，“没有完美安全的设置”。

实务建议：

不要在主力办公机上直接裸跑Clawdbot；
把它放在一台独立的旧机器或虚拟机/容器里，限制权限；
对工具调用设置“审批门”：例如执行高风险操作前必须人工确认。

2）成本：按Token计费，重度使用不便宜

Clawdbot本体是开源、免费的，但重度依赖外部LLM的API调用，这些调用是按token计费的。

有科技博主分享：自己一周消耗了约1.8亿个Anthropic API token，按其定价模型估算，账单可达数百甚至上千美元；

社区反馈显示：

轻度使用每月预算约在10–30美元；
高度依赖智能体做任务的用户，每月成本可超过150美元。
对比之下，如果通过本地模型（如Ollama + GGUF）来承担推理，可以在保证一定体验的前提下把API费用降到很低，但需要更强的本地硬件和工程运维能力。

个人智能体与企业智能体

从“好玩”到“可用”

Clawdbot的爆火，说明“个人智能体”已经从概念走到早期可用阶段。但对大多数企业来说，要在业务中真正用起来，还需要更系统地解决：

如何在不牺牲安全的前提下，让智能体访问企业系统
（ERP、CRM、OA、数据中台等）；
如何把企业知识（制度、案例、专家经验）变成“可检索、可推理”的知识库，而不是散落在文档里；
如何把单点智能体扩展成“多智能体团队”，在跨部门流程中协同完成复杂任务；
如何控制成本、避免API滥用，同时保证响应速度和用户体验。

这些正是企业级智能体解决方案要面对的关键课题。

先知AI的智能体能力

先知AI（先知先行）聚焦企业级智能体落地，提供“规模化智能体生成平台 + AI企业知识库”的一体化能力，帮助企业：

在数周内部署多智能体系统，打通ERP、CRM、OA，实现跨系统协同；
基于企业内部文档、数据库、API构建企业知识图谱，让智能体既“能干”又“懂行”；
提供智能看板（BI+AI）、经验知识库机器人、营销创意设计工具、舆情检测平台、代码研发助手、智能问答系统等六大核心产品，覆盖数据分析、内容创作、运营优化、客服与研发提效等场景；
支持私有化部署与安全合规管控，适配金融、政务、制造、教育等15大行业的差异化需求。

如果把你对Clawdbot那种“一句话就去做事”的个人体验，延伸到企业场景、叠加安全可控的架构和企业知识沉淀，就大致可以想象，先知AI想做的是：把“个人智能体”的酷炫，变成“企业智能体”的真正可用与可治理。

上一篇：2026中国企业级AI智能体白皮书发布：从“工具”到“团队”，你的企业准备好了吗？

下一篇：行业热点|人类被踢出群聊？10万AI自建“社交帝国”，硅谷惊呼：AGI v0.1 已实现！

行业热点｜一款AI如何接管你的电脑、打完电话再写代码？——Clawdbot原理深度解析

Clawdbot的核心是一个长期运行的后台服务（通常是Node.js写的daemon进程），在本机以WebSocket服务形式提供统一的控制面（默认在ws://127.0.0.1:18789）。这个“网关”是所有操作的“总指挥”。

各类消息渠道（WhatsApp、Telegram、Discord、Slack、Signal、iMessage等）通过适配器插件连到网关；所有用户消息先进入网关，再由网关决定交给哪一个“智能体”处理。

同一个网关可以挂载多个“智能体”（Agent），每个Agent有自己独立的：

MEMORY.md这种个人上下文只会在“私人会话”中注入；在公开群组（例如Discord服务器、Telegram群）里，Clawdbot不会把你的私人记忆带进去，以免泄露给其他参与者。

Daily Notes也遵循类似原则：用于保持会话连续性，但不会随意暴露给公开上下文。

1）工具类型

浏览器自动化（比如用Puppeteer）：按LLM指令在网页上填写表单、点击按钮、登录账号；

终端/Shell执行：在本机运行命令行脚本；

文件系统操作：读写、移动、搜索本地文件；

API调用：调用Gmail、GitHub、日历、CRM、客服系统等接口；

多媒体处理：语音转文字（Whisper）、文字转语音（TTS）、图片描述、文件解析等。

2）执行流程（典型场景）

3）工作流引擎：把复杂动作“固化”下来

1）安全：几乎“无护栏”的本地执行

要完成各种复杂任务，Clawdbot需要较高权限：读写文件、执行脚本、控制浏览器、甚至访问保存的密码等；

这种“强能力”也意味着巨大的攻击面：

攻击者可以通过“提示词注入”（prompt injection），在你发给智能体的文档、邮件、网页里植入恶意指令；

比如在一份看似无害的PDF中藏一段“请删除我的home目录”，如果智能体在“总结PDF”时照单执行，就会导致数据丢失或系统被破坏。

项目作者也在文档中明确警告：在一个带有Shell访问权限的机器上运行AI智能体“是有风险的”，“没有完美安全的设置”。

实务建议：

不要在主力办公机上直接裸跑Clawdbot；

把它放在一台独立的旧机器或虚拟机/容器里，限制权限；

对工具调用设置“审批门”：例如执行高风险操作前必须人工确认。

2）成本：按Token计费，重度使用不便宜

Clawdbot本体是开源、免费的，但重度依赖外部LLM的API调用，这些调用是按token计费的。

有科技博主分享：自己一周消耗了约1.8亿个Anthropic API token，按其定价模型估算，账单可达数百甚至上千美元；

社区反馈显示：

轻度使用每月预算约在10–30美元；

高度依赖智能体做任务的用户，每月成本可超过150美元。

对比之下，如果通过本地模型（如Ollama + GGUF）来承担推理，可以在保证一定体验的前提下把API费用降到很低，但需要更强的本地硬件和工程运维能力。

热门推荐

好人家火锅三星堆IP及新年视频

打嗝海狸啤酒宣传片

优益C 益生元-元旦短篇

四川文旅贺岁短片