0.3.0 · Runtime Hub · Desktop · Voice

蓬莱

P E N G L A I

把能干活、能听、能说的 Agent,带到桌面、飞书、微信和声音里。

本地 CPU 语音闭环 · 数据默认不出本机

Hub统一运行层 AppMac / Windows Voice本地听 + 本地说
$
蓬莱 PenglaiAgent — 海上仙山,门户中的 AI 管家
0.3.0 新架构

从聊天入口,到个人 AI 运行中枢

桌面、IM、语音、文件、记忆和安全审计进入同一套运行逻辑

一个中枢,多个入口

桌面、飞书、微信、终端、主动消息、语音和文件先进入 Runtime Hub,再交给 GenericAgent 执行。忙时排队、上下文归一、运行记录可追溯。

四层记忆

索引、事实、技能、原始会话分层保存,Markdown 可审计;写入前做安全扫描,避免把提示注入或密钥写进长期记忆。

确定性安全

危险命令、敏感路径、记忆写入、文件外发和日志泄露统一走规则拦截。安全靠确定性检查,不靠模型自觉。

原生桌面发行版

0.3.0 提供 Mac / Windows 安装包、图形化设置向导、多会话工作台、系统托盘、渠道管理、能力管理和融合诊断。

真主动,不扰民opt-in

恶劣天气、语音情绪、早晚锚点和久未联系提醒都会经过勿扰、频率和对话中门禁。像朋友想起你,不像闹钟轰炸你。

能力随时补开

第一次向导没开的,事后一条命令补上:penglai enable voice|tts|companion|intel


技术架构

Penglai Runtime Hub

0.3.0 的核心不是多做几个入口,而是让入口、执行、记忆、语音和安全进入同一个运行中枢

Entries
桌面客户端Mac / Windows、设置向导、多会话工作台、系统托盘
聊天渠道飞书、微信、终端,以及更多 IM 封装
语音 / 文件 / 主动事件语音条、图片、文档、天气、提醒、情绪事件
Runtime Hub InboundEvent 规范化 · FIFO 队列 · TaskRun 审计 · 权限边界 · 上下文事件 · 运行历史
Capabilities
GenericAgent CoreLLM 推理、工具调用、文件产物、任务执行
Memory & SkillsL1 索引、L2 事实、SOP 技能、原始会话
Voice & SafetyFunASR/SenseVoice 听 · MOSS-TTS-Nano 说 · 红线 · memguard · fileguard · 日志脱敏
GenericAgent上游优先的执行核心
Tauri原生桌面壳与系统托盘
FunASR / SenseVoice本地 CPU 听懂语音与情绪
MOSS-TTS-Nano本地 CPU 把文字说出来
优化你能感受到什么结果状态
统一入口飞书、微信、终端、语音、文件、主动消息进入同一运行层上下文一致已验证
消息排队上一条任务没结束时,后续消息不再直接丢失更稳已验证
文件投递图片、视频、PDF、Markdown、Office 按真实产物发送少误挡已验证
日志脱敏key、token、secret、authorization 统一脱敏后再落日志和历史更安全已验证
发行路径桌面安装包、install.sh、PyPI 引导器和源码安装保持一致;Docker 已撤出支持矩阵口径统一0.3.0
和 GenericAgent 的关系 GenericAgent 是执行核心;蓬莱把它变成普通人能安装、接入、长期运行、升级和审计的个人 AI 管家。内核保持上游优先,安装、渠道、语音、记忆卫生、安全和运维由蓬莱补齐。

多个入口,一个中枢

渠道矩阵

桌面、飞书、微信和终端是 0.3.0 的主线;更多 IM 按真实验证逐步开放

渠道接入语音状态
飞书 Feishu扫码建应用 + 队列/按钮/文件✓ 转写+情绪实测
微信 WeChat向导扫码登录(个人号,本机绑定后启用)✓ silk接入中枢
终端 TUI裸跑 penglai 即聊内核
钉钉 DingTalkpenglai enable dingtalk自带 ASR待实测
QQpenglai enable qqwav+情绪待实测
企业微信 WeCompenglai enable wecom自带 ASR待实测
Telegrampenglai enable telegram待实测
Discordpenglai enable discord待实测

✓ 实测 = 真机走完全程 | 待实测 = 代码就绪未跑真机 | 金色标签 = 语音由发行层封装(上游前端原本丢弃语音)。诚实比好看重要。


桌面或命令行

开始安装

普通用户下载桌面客户端;进阶用户用 install.sh、PyPI 引导器或源码安装。0.3.0 不再提供 Docker 路径。

# macOS Apple Silicon · Windows x64 · 图形化向导安装 下载 DMG/EXE,按系统提示安装。首次打开 macOS 可能需要到系统设置 → 隐私与安全性 → 仍要打开。 → GitHub Releases v0.3.0 下载
# 裸机一行,国内走 gh-proxy 镜像 curl -fsSL https://gh-proxy.com/https://raw.githubusercontent.com/kevinchennewbee/PenglaiAgent/main/install.sh | sh
# PyPI 引导器:安装 CLI,首次运行拉取发行仓库;已有安装用 penglai update pip install penglai penglai setup
git clone https://github.com/kevinchennewbee/PenglaiAgent.git cd PenglaiAgent python3 penglai setup # 向导:语言→依赖→模型→渠道→能力面板
蓬莱安装向导实景 / Penglai setup wizard

↑ 安装向导实景:中英双语 · 翻页式步骤 · 渠道一页多选


一路走来

更新日志

从首次开源到今天,每一版都来自真实使用反馈

更新承诺 上游 GenericAgent 的安全类修复,确认问题后 48 小时内同步;功能类更新在确认不冲突且稳定后 72 小时内同步。你只需要一句 penglai update

源起与名字

普通人,也该拥有自己的 Agent

会发微信,就该会用 Agent

我做了十年网络技术、安全和运维,但不会写代码。蓬莱里的代码,是我用 AI 编程工具一句一句说出来的。它想证明一件事:AI 时代,普通人也能为自己造工具。

CLI 很强,桌面应用也很好,但普通人每天真正打开最多的入口,是聊天软件。蓬莱把能干活的 Agent 放进桌面、飞书、微信和声音里,让它在你已经生活和工作的地方出现。

蓬莱是传说中的海上仙山。AI 之于普通人,正如蓬莱之于古人:明明听说它神奇,却被 API、终端、配置和英文文档挡在雾里。蓬莱想做那艘摆渡的船。


站在开源之上

致谢

蓬莱不是从零发明世界,而是把优秀开源能力组装成普通人可用的发行版

GenericAgent执行核心、工具调用、文件产物和 Agent 循环
MOSS-TTS-Nano让蓬莱能用本地 CPU 把文字说出来
FunASR / SenseVoice让蓬莱能在本地听懂语音、情绪和声学事件
Tauri更轻的原生桌面客户端基础

也感谢 Feishu / Lark SDK 生态,以及所有让 AI 工具变得更普通、更可用、更安全的开源项目。


作者在写

关注公众号 KevinAIStack

Personal AI Stack 的长期实践笔记:深度思考 · 实用工具 · 开源项目——蓬莱的开发幕后与新版本记录首发于此

微信公众号 KevinAIStack — 微信搜一搜 KevinAIStack

微信「搜一搜」KevinAIStack,或扫码关注