Gravação
Com as especificações técnicas definidas, esta etapa detalha o processo prático de captação: quanto tempo gravar, qual conteúdo vocal produzir e como executar a gravação seguindo as boas práticas estabelecidas.
Tempo de Gravação
A duração total recomendada varia conforme o tipo de modelo que você deseja treinar:
Para qualquer tipo de modelo, qualidade > quantidade. É preferível ter 1 hora de áudio impecável e boa distribuição fonética do que 3 horas com ruídos ou inconsistências.
O que Gravar
Conteúdo Vocal Recomendado
Para garantir um modelo robusto e expressivo, o dataset deve cobrir:
Como Gravar
Antes de Começar
-
Escolha o software adequado.
- Adobe Audition, Audacity, Reaper, qualquer outro software de gravação do seu gosto.
-
Configure o formato de áudio:
- Preferencial: WAV Mono, 48kHz x 24bit.
- Alternativa: WAV Mono, 44.1kHz x 16bit.
TipRecomenda-se gravar em 48kHz x 24bit para maior qualidade. Conversões para 44.1kHz x 16bit podem ser feitas posteriormente.
-
Prepare o ambiente:
- Ambiente silencioso, com o mínimo de ruído de fundo e reflexões.
- Evite vazamento de som dos fones de ouvido ou caixas de som.
-
Posicione o microfone:
- Distância consistente da boca (10–20 cm)
- Use pop filter para evitar plosivas
- Mantenha a mesma configuração durante todos os takes e dias de gravação
Durante a Gravação
Organização dos Arquivos
- Um arquivo por música.
- Nome do arquivo em romano (sem acentos ou caracteres especiais).
- Classifique por idioma.
- Se houver múltiplos timbres vocais, classifique por idioma e timbre.
- Cada classe em sua própria pasta.

