跳转到正文内容
博然AI笔记
返回

Moltbot(原Clawdbot):全天候自主AI数字员工指南

更新于

Hi,所有AI爱好者和玩家 我是博然AI笔记作者,让我们一起在2026年继续在人工智能领域深度学习与应用实践!我们貌似每天都在不断学习新的AI知识和技术框架,那么有没有实现项目落地?接下来让我看最近很火的ClawdBot(已改名为Moltbot)项目是如何落地的!

Moltbot(原名为 ClawdBot,意为 CLAW + TARDIS)是一款功能极其强大的 24/7 全天候 AI 智能代理(Agent)。根据来源信息,它不仅是一个聊天机器人,更像是一个拥有“眼睛和手”、能够控制电脑并自主执行任务的数字员工

以下是对 Moltbot 的详细介绍:

  1. 核心定位与愿景

Moltbot 是一个开源项目,旨在连接各种通讯软件(如 WhatsApp、Telegram)与高性能 AI 模型(如 Claude、GPT),使 AI 能够直接在用户的电脑或服务器上执行操作。其愿景是成为一个全职工作的 AI 员工,帮助用户从繁琐的任务中解放出来,甚至支持“一人公司”的运营。

  1. 主要功能特性

• 全权控制电脑: Moltbot 可以在计算机上打开浏览器、填写表单、在 Google Docs 或 Notion 中工作、查看并发送电子邮件、甚至在亚马逊上购物。

• 多平台通讯集成: 用户可以通过 WhatsApp、Telegram、Discord、iMessage、Signal、Slack、Microsoft Teams 等多种常用软件随时随地向 Moltbot 发送指令。

• 持久性记忆系统: 它拥有复杂的记忆机制,能够记录用户的所有谈话、喜好和上下文背景。它会主动从对话中提取关键信息并保存,以便在未来的任务中提供更具相关性的帮助。

• 主动性(Proactivity): 它不只是被动响应。通过 Cron 任务和 Heartbeats(心跳检测),它能定时主动联系用户。例如:

    ◦ 早报(Morning Brief): 每天早上 8 点主动发送天气、个性化新闻、待办事项清单以及它在你睡觉时完成的工作汇总。

    ◦ 每日研究报告: 根据用户的业务和兴趣,在下午主动发送深度研究报告。

• Vibe Coding(氛围编程): 这是 Moltbot 的一大亮点。用户只需口头描述需求,它就能自主编写代码、创建 Pull Request、构建完整的应用程序(如看板系统或文件查看器)并上传到 GitHub。

  1. 技术架构与部署

• 网关模式(Gateway): Moltbot 作为一个长期运行的网关进程,管理着所有渠道连接和控制台。

• 支持模型: 它支持多种顶级 AI 模型作为“大脑”,包括 Claude 4.5 Opus(被认为最具个性和智能)、GPT-5.2 以及 MiniMax 等廉价模型。它还支持运行本地模型以保护隐私。

• 部署环境: 它可以运行在本地的 Mac Mini、Mac Studio(Alex Finn 推荐将其放在桌面上作为物理存在的 AI 助理),也可以部署在 **AWS EC2 等云端服务器(VPS)**上,以实现 24/7 不间断运行。

• 扩展性: 拥有完整的**技能(Skills)插件(Plugins)**体系,可以不断扩展其控制第三方应用的能力(如 Spotify、Obsidian、GitHub 等)。

  1. 安全与隔离

由于 Moltbot 拥有极高的电脑访问权限且没有传统 AI 的“限制器(Guardrails)”,为了安全起见,官方建议:

• 环境隔离: 最好将其安装在独立的虚拟机、VPS 或备用电脑(如 Mac Mini)上,而不是你的日常主电脑上,以防误操作个人文件。

• 沙箱机制(Sandboxing): 支持在 Docker 环境中运行代理,以限制其对宿主机文件系统的访问权限。

• 账户隔离: 建议为它创建独立的 Gmail 等第三方应用账户。

  1. 使用心态

博然AI根据信息来源发现,使用 Moltbot 需要将其视为真实的人类员工。用户应该通过大规模的“头脑风暴(Brain Dump)”让它了解你的一切——包括职业、目标、喜好等,从而建立良好的工作关系。正如社区评价所言,Moltbot 的出现标志着 AI 从单纯的“工具”向“队友”的本质转变。

MoltBot的技术原理详解

MoltBot是一款基于 Node.js 开发的 24/7 全天候 AI 智能代理网关。其核心原理是作为“中间层”,将各种通讯软件(WhatsApp, Telegram 等)与高性能 AI 模型(Claude, GPT 等)以及本地计算机控制权无缝连接。

以下是 MoltBot 的技术原理及其使用的技术栈解析:

  1. 核心技术原理

• 中心化网关架构 (Gateway Architecture): MoltBot 的核心是一个长期运行的网关进程 (moltbot gateway)。它充当单一信号源,管理所有聊天渠道的连接、WebSocket 控制平面以及与 AI 代理的 RPC 通信。

• 多代理路由 (Multi-Agent Routing): 系统支持将不同的通讯账号或联系人路由到彼此隔离的 AI 代理(Agent)。每个代理拥有独立的工作区 (Workspace)持久性记忆 (Memory) 和会话上下文

• 主动性机制 (Proactivity):

    ◦ 心跳检测 (Heartbeat): 代理会定期(默认 30 分钟)被“唤醒”,读取 HEARTBEAT.md 检查清单并自主决定是否需要主动联系用户。

    ◦ Cron 任务: 内置调度程序,用于执行精确到分钟的定时任务(如发送早报)。

• 环境隔离与安全: 支持通过 Docker 运行代理,实现文件系统隔离。同时具备提权模式 (Elevated Mode) 的准入控制,保护主机安全。

• Vibe Coding(氛围编程): 原理是让 AI 代理直接控制开发工具(如 Claude Code 或 Codeex CLI),自主编写代码、创建 Pull Request 并上传至 GitHub。

  1. 技术栈 (Technology Stack)

运行环境与语言

• 运行时: Node.js (版本要求 ≥ 22)。

• 开发语言: TypeScript

• 模块加载: 使用 jiti 在运行时加载 TypeScript 插件模块。

平台集成技术 (Channels)

• WhatsApp: 使用 Baileys 库对接 WhatsApp Web 协议。

• Telegram: 使用 grammY 框架通过 Bot API 实现通信,支持草稿流式传输。

• Discord: 基于 discord.js 的 Bot API。

• Slack: 使用 Bolt SDK 和 Socket 模式集成。

• iMessage: 通过 imsg CLI (macOS) 进行本地集成。

• Signal: 集成 signal-cli,通过 HTTP JSON-RPC 和 SSE(服务器发送事件)进行通信。

AI 模型与后端

• 支持模型: Anthropic (Claude Opus 4.5/Sonnet)、OpenAI (GPT-5.2)、MiniMax、DeepSeek 等。

• 本地模型: 支持运行本地模型以保证隐私。

• 代理接口: 使用 Pi (RPC 模式) 作为底层编码代理路径。

存储与记忆

• 向量数据库: 插件支持 LanceDB,用于实现长期记忆的自动检索与捕获。

• 数据存储: 使用 SQLite 存储 Matrix 等插件的加密状态;配置和会话信息存储为本地 JSON 文件。

界面与交互

• TUI (Terminal UI): 提供基于终端的交互界面。

• Web 控制台 (Dashboard): 基于浏览器的管理界面,默认运行在 18789 端口。

• 移动端: 提供 iOS 和 Android 节点,支持 Canvas 绘图表面、摄像头集成等。

部署相关

• 容器化: 提供 Docker 支持。

• 云服务: 适配 AWS EC2 (Ubuntu)、Railway、Render 和 Northflank 等云平台。

• 内网穿透: 推荐使用 Tailscale (Funnel) 或 Cloudflare Tunnel 来暴露 Webhook 端口。


分享这篇笔记:

下一篇笔记
Agent Skills(智能体技能)的本体构建、核心机制与全球产业应用实践深度分析