☝️ WeClone 是一个号称可以打造一站式数字分身的解决方案。用微信聊天记录微调大语言模型,用语音消息克隆你的声音,再绑定到聊天机器人,实现「你的另一个自己」。目前支持微信、QQ、Telegram、企微、飞书等平台。
⚠️ 本项目未经笔者实践,这次分享单纯是认为思路很有趣,作为纯方案和实践思路可能性的分享。
🎙️ 项目原理简述
▶ 聊天微调:通过 PyWxDump 导出微信聊天记录,预处理后用于微调 ChatGLM3 模型,提升模型对你语气风格的理解。
▶ 语音克隆: WeClone-audio 模块结合微信语音+0.5B模型,实现高质量 TTS(文本转语音),让数字分身“说话像你”。
▶ 聊天绑定:训练好的模型通过 API 接入 AstrBot 等聊天机器人框架,实现跨平台部署。
♻️ 训练与部署流程
➊ 数据准备:导出聊天记录(CSV),放入
./data/csv
目录。 ➋ 数据预处理:执行
qa_generator.py
,清洗并生成问答对。 ➌ 模型微调:使用 LoRA 方法对 ChatGLM3 进行 SFT 微调,推荐显存 16GB 起步。
➍ 语音克隆:需额外安装 xcodec 相关依赖,克隆语音后绑定到聊天机器人。
➎ 聊天部署:通过 AstrBot 接入微信/Telegram 等平台,配置 API 即可上线。
⛄️ 注意事项
▶ 微调模型效果与原始聊天数据质量密切相关。
▶ 默认不支持工具调用,需关闭 AstrBot 的默认工具。
▶ 使用需遵守法律法规,严禁用于隐私侵犯或非法用途。