TTS WebUI - Text-to-Speech Web Interface

Available Models

Explore the wide range of AI models supported by TTS WebUI

Text-to-Speech Models

Vall-E-X

Multilingual text-to-speech model supporting English, Chinese, and Japanese

By Plachtaa

Extension Original Project

StyleTTS2

StyleTTS2 is a text-to-speech model that generates high-quality speech with controllable style

By StyleTTS2 Team

Extension Original Project

Seamless M4T

SeamlessM4T is a multilingual and multimodal translation model supporting text and speech

By Facebook

Extension Original Project

MMS

MMS (Massively Multilingual Speech) is a text-to-speech model supporting over 1000 languages

By Facebook

Extension Original Project

Tortoise TTS

Tortoise TTS is a high-quality text-to-speech model with voice cloning capabilities

By neonbjb

Extension Original Project

F5-TTS

F5-TTS: A Fairytaler that Fakes Fluent and Faithful Speech with Flow Matching.

By Yushen Chen et al.

Extension Original Project

Chatterbox

Chatterbox, Resemble AI's first production-grade open source TTS model

By Resemble AI

Extension Original Project

Kokoro

Kokoro: A small, fast, and high-quality TTS model

By hexgrad

Extension Original Project

Bark

Bark: A text-to-speech model

By Suno

Extension Original Project

XTTS

XTTS-Simple is a Gradio UI for XTTSv2

By rsxdalv

Extension Original Project

Parler-TTS

Parler-TTS is a training and inference library for high-fidelity text-to-speech (TTS) models.

By rsxdalv

Extension Original Project

CosyVoice

CosyVoice: High-quality text-to-speech synthesis.

By rsxdalv

Extension Original Project

MARS5

MARS5: A novel speech model for insane prosody

By CAMB.AI

Extension Original Project

DIA

DIA: A text-to-dialogue model

By Nari Labs

Extension Original Project

GPT-SoVITS

GPT-SoVITS: A TTS solution powered by GPT and SoftVC VITS Singing Voice Conversion.

By rsxdalv

Extension Original Project

Audio & Music Generation Models

ACE-Step

ACE-Step: A Step Towards Music Generation Foundation Model

By ACE-Step

Extension Original Project

Stable Audio

Stable Audio is a text-to-audio model for generating high-quality music and sound effects

By Stability AI

Extension Original Project

Audiocraft

Audiocraft provides MusicGen and MAGNeT models for high-quality music and audio generation

By Facebook

Extension Original Project

AudioCraft Plus

AudioCraft Plus is an all-in-one WebUI for the original AudioCraft, adding many quality features on top.

By GrandaddyShmax

Extension Original Project

Audio Conversion Models

Vocos

Vocos is a neural audio codec for high-quality audio compression and reconstruction

By charactr

Extension Original Project

RVC

RVC: Retrieval-based Voice Conversion

By RVC Team

Extension Original Project

Demucs

Demucs is a music source separation model that can separate drums, bass, vocals, and other instruments

By Facebook

Extension Original Project

Conversational AI Models

Kimi Audio

Kimi Audio is a powerful text-to-speech and speech-to-text model by Moonshot AI

By Moonshot AI

Extension Original Project

MiMo-Audio

MiMo-Audio by Xiaomi

By Xiaomi MiMo

Extension Original Project