# BetterMimoTTS 此插件参考Mimotts / MimoTTS插件和小米Mimo api文档增加和兼容新功能而来 LangBot 插件,调用小米 MiMo TTS API 将文本转换为语音。支持多种 TTS 模型、LLM 文本加工、音频标签控制等功能。 ## 功能 - **三种 TTS 模型**: - 预置音色 (mimo-v2.5-tts):使用内置精品音色,支持方言和唱歌模式 - 音色设计 (mimo-v2.5-tts-voicedesign):通过预置音色或文字描述生成音色 - 音色克隆 (mimo-v2.5-tts-voiceclone):从音频样本复刻音色 - **自动语音合成**:AI 回复自动转为语音发送 - **命令语音合成**:通过 `!tts` 命令手动合成语音 - **LLM 文本加工**:可配置 LLM 模型对回复进行口语化处理,添加音频标签 - **音频标签控制**:支持在文本中插入音频标签,精细控制语气、情绪、语速等 - **方言支持**:东北话、四川话、河南话、粤语 - **唱歌检测**:自动识别歌词内容,使用唱歌模式合成(预置音色) - **触发模式**:可配置群聊/私聊触发条件 - **检测** 群里或私聊输入`歌词 XXXX`,自动触发唱歌,仅支持预置语音模式 ## 安装 1. 将本插件放入 LangBot 的插件目录 2. 在 LangBot 管理面板中启用插件 3. 前往 [MiMo 开放平台](https://platform.xiaomimimo.com) 注册并获取 API Key 4. 在插件配置中填入 API Key ## 配置项 ### 基础配置 | 配置项 | 类型 | 默认值 | 说明 | |--------|------|--------|------| | `api_key` | string | 空 | MiMo TTS API Key | | `tts_model` | select | mimo-v2.5-tts | TTS 模型选择 | ### 预置音色模型配置 (mimo-v2.5-tts) | 配置项 | 类型 | 默认值 | 说明 | |--------|------|--------|------| | `voice` | select | mimo_default | 预置音色(默认/冰糖/茉莉/苏打/白桦/Mia/Chloe/Milo/Dean) | | `dialect` | select | none | 方言(普通话/东北话/四川话/河南话/粤语) | | `sing_detect` | boolean | false | 唱歌检测(检测歌词并以唱歌方式合成) | ### 音色设计模型配置 (mimo-v2.5-tts-voicedesign) | 配置项 | 类型 | 默认值 | 说明 | |--------|------|--------|------| | `voice_design_preset` | select | mimo_default | 音色设计模式(预置音色/自定义描述) | | `voice_design_prompt` | text | 空 | 音色描述(如:年轻男性,声音低沉有磁性) | ### 音色克隆模型配置 (mimo-v2.5-tts-voiceclone) | 配置项 | 类型 | 默认值 | 说明 | |--------|------|--------|------| | `voice_clone_audio` | file | 空 | 音色样本音频(mp3/wav,最大10MB) | ### LLM 文本加工配置 | 配置项 | 类型 | 默认值 | 说明 | |--------|------|--------|------| | `llm_process_enabled` | boolean | false | 启用 LLM 文本加工 | | `llm_model` | llm-model-selector | 空 | 文本加工 LLM 模型 | | `llm_process_prompt` | text | 空 | 自定义加工提示词(留空使用默认) | ### 通用配置 | 配置项 | 类型 | 默认值 | 说明 | |--------|------|--------|------| | `auto_tts` | boolean | false | 自动语音合成 | | `trigger_mode` | select | all | 触发模式(全部/仅群聊/仅私聊) | | `intercept_text` | boolean | false | 拦截文字回复 | | `style` | string | 空 | 风格指令(如:用温柔轻快的语调说话) | ## 命令 | 命令 | 说明 | |------|------| | `!tts <文本>` | 使用当前配置合成语音 | | `!tts voices` | 查看可用音色、模型、方言和功能 | | `!tts help` | 显示帮助信息 | ### 示例 ``` !tts 你好世界 !tts (极其疲惫,有气无力)师傅……到地方了叫我一声……(长叹一口气)我先眯一会儿 !tts voices !tts help ``` ## 音频标签 支持在文本中插入音频标签,精细控制语音效果: ## 工作流程 1. 用户发送消息 -> AI 生成回复 2. 插件拦截回复文本 3. 若开启唱歌检测且检测到歌词 -> 直接以唱歌模式合成 4. 若配置了 LLM 加工模型 -> 将文本转为口语化表达并添加音频标签 5. 若未配置加工模型 -> 使用内置规则引擎清理 Markdown、emoji 等 6. 调用 MiMo TTS API 合成语音 7. 将语音以 Voice 消息发送 ## 依赖 - `langbot-plugin` - `openai>=1.0.0` ## 相关链接 - [MiMo 开放平台](https://platform.xiaomimimo.com) - [MiMo API 文档](https://platform.xiaomimimo.com/docs) - [LangBot](https://github.com/langbot-app/LangBot)
BetterMimoTTS by 1dabai
A better TTS plugin using Xiaomi MiMo TTS API. Supports preset voices, voice design, voice cloning, and LLM text processing.
Loading...