整合包

名称 平台 下载 演示 描述
Qwen3-TTS Windows Qwen3-TTS-v260128 - Qwen3-TTS 是阿里巴巴云旗下 Qwen 团队研发的开源系列文本到语音模型,具备稳定、富有表现力的流式语音生成能力,支持自由式语音设计及生动的音色克隆功能。
CosyVoice3 Windows CosyVoice3-20251215.rar - 语音合成、克隆、配音工具。Fun-CosyVoice 3.0 是一款基于大型语言模型(LLM)的先进文本转语音(TTS)系统
Fun-ASR-Nano Windows Fun-ASR_Nano-2512.zip - 语音识别转写工具。支持中文、英文和日文三种语言。其中,中文涵盖 7 种方言及 26 种地区口音,英文和日文则覆盖多种地区口音。此外,还具备歌词识别与说唱语音识别等特色功能。
In This Document