Moltbot(原Clawdbot)：全天候自主AI数字员工指南

Hi,所有AI爱好者和玩家我是博然AI笔记作者，让我们一起在2026年继续在人工智能领域深度学习与应用实践！我们貌似每天都在不断学习新的AI知识和技术框架，那么有没有实现项目落地？接下来让我看最近很火的ClawdBot(已改名为Moltbot)项目是如何落地的!

Moltbot（原名为 ClawdBot，意为 CLAW + TARDIS）是一款功能极其强大的 24/7 全天候 AI 智能代理（Agent）。根据来源信息，它不仅是一个聊天机器人，更像是一个拥有“眼睛和手”、能够控制电脑并自主执行任务的数字员工。

以下是对 Moltbot 的详细介绍：

核心定位与愿景

Moltbot 是一个开源项目，旨在连接各种通讯软件（如 WhatsApp、Telegram）与高性能 AI 模型（如 Claude、GPT），使 AI 能够直接在用户的电脑或服务器上执行操作。其愿景是成为一个全职工作的 AI 员工，帮助用户从繁琐的任务中解放出来，甚至支持“一人公司”的运营。

主要功能特性

• 全权控制电脑： Moltbot 可以在计算机上打开浏览器、填写表单、在 Google Docs 或 Notion 中工作、查看并发送电子邮件、甚至在亚马逊上购物。

• 多平台通讯集成： 用户可以通过 WhatsApp、Telegram、Discord、iMessage、Signal、Slack、Microsoft Teams 等多种常用软件随时随地向 Moltbot 发送指令。

• 持久性记忆系统： 它拥有复杂的记忆机制，能够记录用户的所有谈话、喜好和上下文背景。它会主动从对话中提取关键信息并保存，以便在未来的任务中提供更具相关性的帮助。

• 主动性（Proactivity）： 它不只是被动响应。通过 Cron 任务和 Heartbeats（心跳检测），它能定时主动联系用户。例如：

◦ 早报（Morning Brief）： 每天早上 8 点主动发送天气、个性化新闻、待办事项清单以及它在你睡觉时完成的工作汇总。

◦ 每日研究报告： 根据用户的业务和兴趣，在下午主动发送深度研究报告。

• Vibe Coding（氛围编程）： 这是 Moltbot 的一大亮点。用户只需口头描述需求，它就能自主编写代码、创建 Pull Request、构建完整的应用程序（如看板系统或文件查看器）并上传到 GitHub。

技术架构与部署

• 网关模式（Gateway）： Moltbot 作为一个长期运行的网关进程，管理着所有渠道连接和控制台。

• 支持模型： 它支持多种顶级 AI 模型作为“大脑”，包括 Claude 4.5 Opus（被认为最具个性和智能）、GPT-5.2 以及 MiniMax 等廉价模型。它还支持运行本地模型以保护隐私。

• 部署环境： 它可以运行在本地的 Mac Mini、Mac Studio（Alex Finn 推荐将其放在桌面上作为物理存在的 AI 助理），也可以部署在 **AWS EC2 等云端服务器（VPS）**上，以实现 24/7 不间断运行。

• 扩展性： 拥有完整的**技能（Skills）和插件（Plugins）**体系，可以不断扩展其控制第三方应用的能力（如 Spotify、Obsidian、GitHub 等）。

安全与隔离

由于 Moltbot 拥有极高的电脑访问权限且没有传统 AI 的“限制器（Guardrails）”，为了安全起见，官方建议：

• 环境隔离： 最好将其安装在独立的虚拟机、VPS 或备用电脑（如 Mac Mini）上，而不是你的日常主电脑上，以防误操作个人文件。

• 沙箱机制（Sandboxing）： 支持在 Docker 环境中运行代理，以限制其对宿主机文件系统的访问权限。

• 账户隔离： 建议为它创建独立的 Gmail 等第三方应用账户。

使用心态

博然AI根据信息来源发现，使用 Moltbot 需要将其视为真实的人类员工。用户应该通过大规模的“头脑风暴（Brain Dump）”让它了解你的一切——包括职业、目标、喜好等，从而建立良好的工作关系。正如社区评价所言，Moltbot 的出现标志着 AI 从单纯的“工具”向“队友”的本质转变。

MoltBot的技术原理详解

MoltBot是一款基于 Node.js 开发的 24/7 全天候 AI 智能代理网关。其核心原理是作为“中间层”，将各种通讯软件（WhatsApp, Telegram 等）与高性能 AI 模型（Claude, GPT 等）以及本地计算机控制权无缝连接。

以下是 MoltBot 的技术原理及其使用的技术栈解析：

核心技术原理

• 中心化网关架构 (Gateway Architecture)： MoltBot 的核心是一个长期运行的网关进程 (moltbot gateway)。它充当单一信号源，管理所有聊天渠道的连接、WebSocket 控制平面以及与 AI 代理的 RPC 通信。

• 多代理路由 (Multi-Agent Routing)： 系统支持将不同的通讯账号或联系人路由到彼此隔离的 AI 代理（Agent）。每个代理拥有独立的工作区 (Workspace)、持久性记忆 (Memory) 和会话上下文。

• 主动性机制 (Proactivity)：

◦ 心跳检测 (Heartbeat)： 代理会定期（默认 30 分钟）被“唤醒”，读取 HEARTBEAT.md 检查清单并自主决定是否需要主动联系用户。

◦ Cron 任务： 内置调度程序，用于执行精确到分钟的定时任务（如发送早报）。

• 环境隔离与安全： 支持通过 Docker 运行代理，实现文件系统隔离。同时具备提权模式 (Elevated Mode) 的准入控制，保护主机安全。

• Vibe Coding（氛围编程）： 原理是让 AI 代理直接控制开发工具（如 Claude Code 或 Codeex CLI），自主编写代码、创建 Pull Request 并上传至 GitHub。

技术栈 (Technology Stack)

运行环境与语言

• 运行时： Node.js (版本要求 ≥ 22)。

• 开发语言： TypeScript。

• 模块加载： 使用 jiti 在运行时加载 TypeScript 插件模块。

平台集成技术 (Channels)

• WhatsApp： 使用 Baileys 库对接 WhatsApp Web 协议。

• Telegram： 使用 grammY 框架通过 Bot API 实现通信，支持草稿流式传输。

• Discord： 基于 discord.js 的 Bot API。

• Slack： 使用 Bolt SDK 和 Socket 模式集成。

• iMessage： 通过 imsg CLI (macOS) 进行本地集成。

• Signal： 集成 signal-cli，通过 HTTP JSON-RPC 和 SSE（服务器发送事件）进行通信。

AI 模型与后端

• 支持模型： Anthropic (Claude Opus 4.5/Sonnet)、OpenAI (GPT-5.2)、MiniMax、DeepSeek 等。

• 本地模型： 支持运行本地模型以保证隐私。

• 代理接口： 使用 Pi (RPC 模式) 作为底层编码代理路径。

存储与记忆

• 向量数据库： 插件支持 LanceDB，用于实现长期记忆的自动检索与捕获。

• 数据存储： 使用 SQLite 存储 Matrix 等插件的加密状态；配置和会话信息存储为本地 JSON 文件。

界面与交互

• TUI (Terminal UI)： 提供基于终端的交互界面。

• Web 控制台 (Dashboard)： 基于浏览器的管理界面，默认运行在 18789 端口。

• 移动端： 提供 iOS 和 Android 节点，支持 Canvas 绘图表面、摄像头集成等。

部署相关

• 容器化： 提供 Docker 支持。

• 云服务： 适配 AWS EC2 (Ubuntu)、Railway、Render 和 Northflank 等云平台。

• 内网穿透： 推荐使用 Tailscale (Funnel) 或 Cloudflare Tunnel 来暴露 Webhook 端口。