BetterMimoTTS

Name: BetterMimoTTS Plugin
Author: 1dabai

1dabaiBetterMimoTTS

Plugin101 downloadsCommand1Event Listener1entertainment

A better TTS plugin using Xiaomi MiMo TTS API. Supports preset voices, voice design, voice cloning, and LLM text processing.

BetterMimoTTS

此插件参考Mimotts / MimoTTS插件和小米Mimo api文档增加和兼容新功能而来 LangBot 插件，调用小米 MiMo TTS API 将文本转换为语音。支持多种 TTS 模型、LLM 文本加工、音频标签控制等功能。

功能

三种 TTS 模型：
- 预置音色 (mimo-v2.5-tts)：使用内置精品音色，支持方言和唱歌模式
- 音色设计 (mimo-v2.5-tts-voicedesign)：通过预置音色或文字描述生成音色
- 音色克隆 (mimo-v2.5-tts-voiceclone)：从音频样本复刻音色
自动语音合成：AI 回复自动转为语音发送
命令语音合成：通过 !tts 命令手动合成语音
LLM 文本加工：可配置 LLM 模型对回复进行口语化处理，添加音频标签
音频标签控制：支持在文本中插入音频标签，精细控制语气、情绪、语速等
方言支持：东北话、四川话、河南话、粤语
唱歌检测：自动识别歌词内容，使用唱歌模式合成（预置音色）
触发模式：可配置群聊/私聊触发条件
检测群里或私聊输入歌词 XXXX，自动触发唱歌，仅支持预置语音模式

安装

将本插件放入 LangBot 的插件目录
在 LangBot 管理面板中启用插件
前往 MiMo 开放平台注册并获取 API Key
在插件配置中填入 API Key

配置项

基础配置

配置项	类型	默认值	说明
`api_key`	string	空	MiMo TTS API Key
`tts_model`	select	mimo-v2.5-tts	TTS 模型选择

预置音色模型配置 (mimo-v2.5-tts)

配置项	类型	默认值	说明
`voice`	select	mimo_default	预置音色（默认/冰糖/茉莉/苏打/白桦/Mia/Chloe/Milo/Dean）
`dialect`	select	none	方言（普通话/东北话/四川话/河南话/粤语）
`sing_detect`	boolean	false	唱歌检测（检测歌词并以唱歌方式合成）

音色设计模型配置 (mimo-v2.5-tts-voicedesign)

配置项	类型	默认值	说明
`voice_design_preset`	select	mimo_default	音色设计模式（预置音色/自定义描述）
`voice_design_prompt`	text	空	音色描述（如：年轻男性，声音低沉有磁性）

音色克隆模型配置 (mimo-v2.5-tts-voiceclone)

配置项	类型	默认值	说明
`voice_clone_audio`	file	空	音色样本音频（mp3/wav，最大10MB）

LLM 文本加工配置

配置项	类型	默认值	说明
`llm_process_enabled`	boolean	false	启用 LLM 文本加工
`llm_model`	llm-model-selector	空	文本加工 LLM 模型
`llm_process_prompt`	text	空	自定义加工提示词（留空使用默认）

通用配置

配置项	类型	默认值	说明
`auto_tts`	boolean	false	自动语音合成
`trigger_mode`	select	all	触发模式（全部/仅群聊/仅私聊）
`intercept_text`	boolean	false	拦截文字回复
`style`	string	空	风格指令（如：用温柔轻快的语调说话）

命令

命令	说明
`!tts <文本>`	使用当前配置合成语音
`!tts voices`	查看可用音色、模型、方言和功能
`!tts help`	显示帮助信息

示例

!tts 你好世界
!tts （极其疲惫，有气无力）师傅……到地方了叫我一声……（长叹一口气）我先眯一会儿
!tts voices
!tts help

音频标签

支持在文本中插入音频标签，精细控制语音效果：

工作流程

用户发送消息 -> AI 生成回复
插件拦截回复文本
若开启唱歌检测且检测到歌词 -> 直接以唱歌模式合成
若配置了 LLM 加工模型 -> 将文本转为口语化表达并添加音频标签
若未配置加工模型 -> 使用内置规则引擎清理 Markdown、emoji 等
调用 MiMo TTS API 合成语音
将语音以 Voice 消息发送

依赖

langbot-plugin
openai>=1.0.0

BetterMimoTTS

BetterMimoTTS

功能

安装

配置项

基础配置

预置音色模型配置 (mimo-v2.5-tts)

音色设计模型配置 (mimo-v2.5-tts-voicedesign)

音色克隆模型配置 (mimo-v2.5-tts-voiceclone)

LLM 文本加工配置

通用配置

命令

示例

音频标签

工作流程

依赖

相关链接

Comments