ai 语音对话，bailing

看代码好像不支持WebRTC，但 readme 说支持？

可以，先给你一个清晰结论：核心语音链路基本可以改成全本地，但“所有功能”想 100% 本地要做一些取舍。

当前各模块：本地 / 云端

ASR（语音识别）
- 当前：FunASR + models/SenseVoiceSmall
- 类型：本地
VAD（语音活动检测）
- 当前：SileroVAD
- 类型：本地（首次可能下载权重，之后本地）
LLM（主对话）
- 当前：OpenAILLM 指向 OpenRouter
- 类型：云端
- 可改本地：可以，改成 OllamaLLM
Memory（记忆总结）
- 当前：也是 OpenRouter
- 类型：云端
- 可改本地：可以，前提是代码支持把 Memory 也走本地模型（当前 memory.py 用的是 OpenAI 兼容调用）
TTS（语音合成）
- EdgeTTS：云端
- GTTS：云端
- CHATTTS：本地
- KOKOROTTS：本地（可能首次拉取 HuggingFace 模型）
- MacTTS：本地（仅 macOS）
RAG
- 代码里 rag.py 基本是注释状态，未在主链路启用
- 你 config 里的 Rag.model_name/url/api_key 是云端配置，但当前主流程里影响不大
插件工具（天气/网页搜索等）
- 多数依赖外部 API/网络
- 类型：云端或联网功能

可以实现“主对话链路全本地”（ASR + VAD + LLM + TTS 全本地）。
但如果你要求“项目全部功能都离线”，要注意：

在 config/config.yaml 里改这几项：

另外：

如果你要，我可以下一步直接给你一份**“最小全本地 config 样例”**（可直接粘贴替换）。另外提醒一下：你现在配置里出现了明文 OpenRouter key，建议尽快在 OpenRouter 后台旋转/废弃这个 key。