💬 微信聊天记录+微信语音 = 你的数字分身

☝️ WeClone 是一个号称可以打造一站式数字分身的解决方案。用微信聊天记录微调大语言模型,用语音消息克隆你的声音,再绑定到聊天机器人,实现「你的另一个自己」。目前支持微信、QQ、Telegram、企微、飞书等平台。

⚠️ 本项目未经笔者实践,这次分享单纯是认为思路很有趣,作为纯方案和实践思路可能性的分享。

🎙️ 项目原理简述

聊天微调:通过 PyWxDump 导出微信聊天记录,预处理后用于微调 ChatGLM3 模型,提升模型对你语气风格的理解。
语音克隆WeClone-audio 模块结合微信语音+0.5B模型,实现高质量 TTS(文本转语音),让数字分身“说话像你”。
聊天绑定:训练好的模型通过 API 接入 AstrBot 等聊天机器人框架,实现跨平台部署。

♻️ 训练与部署流程

➊ 数据准备:导出聊天记录(CSV),放入 ‎./data/csv 目录。
➋ 数据预处理:执行 ‎qa_generator.py,清洗并生成问答对。
➌ 模型微调:使用 LoRA 方法对 ChatGLM3 进行 SFT 微调,推荐显存 16GB 起步。
➍ 语音克隆:需额外安装 xcodec 相关依赖,克隆语音后绑定到聊天机器人。
➎ 聊天部署:通过 AstrBot 接入微信/Telegram 等平台,配置 API 即可上线。

⛄️ 注意事项

微调模型效果与原始聊天数据质量密切相关。
默认不支持工具调用,需关闭 AstrBot 的默认工具。
使用需遵守法律法规,严禁用于隐私侵犯或非法用途。
 
 
Back to Top