Gravação

Com as especificações técnicas definidas, esta etapa detalha o processo prático de captação: quanto tempo gravar, qual conteúdo vocal produzir e como executar a gravação seguindo as boas práticas estabelecidas.

Tempo de Gravação

A duração total recomendada varia conforme o tipo de modelo que você deseja treinar:

Tipo de Modelo	Duração Recomendada	Observações
Modelo Individual (único cantor)	1 a 3 horas	Por ser um único cantor, um número maior de dados é necessário para cobrir a variedade fonética, podendo precisar de mais horas dependendo da quantidade de idiomas cantados.
Modelo Multi-Vocal (vários cantores)	Até 1 hora por voz	Cada voz se benificia dos dados de todo o conjunto, podendo ter menos gravações por voz.

Tip

Para qualquer tipo de modelo, qualidade > quantidade. É preferível ter 1 hora de áudio impecável e boa distribuição fonética do que 3 horas com ruídos ou inconsistências.

O que Gravar

Conteúdo Vocal Recomendado

Para garantir um modelo robusto e expressivo, o dataset deve cobrir:

Aspecto	Recomendação
Alcance (vocal range)	Grave notas graves, médias e agudas do seu alcance natural.
Velocidades (tempo)	Músicas lentas (baladas), médias (pop) e rápidas (rock, dance).
Fonemas	Cubra todos os fonemas do idioma, com ênfase nos raros (ex.: mandarim: "iong", "uai"; japonês: "ky", "jy").
Expressividade vocal	Grave com emoção, dinâmica e variações de intensidade.
Estilos musicais	As que o seu vocal cobre e que se sinta confortável em cantar.
Sons sustentados	Inclua notas longas para evitar interrupções no banco de vozes.

Como Gravar

Antes de Começar

Escolha o software adequado.
- Adobe Audition, Audacity, Reaper, qualquer outro software de gravação do seu gosto.
Configure o formato de áudio:
- Preferencial: WAV Mono, 48kHz x 24bit.
- Alternativa: WAV Mono, 44.1kHz x 16bit.
Tip
Recomenda-se gravar em 48kHz x 24bit para maior qualidade. Conversões para 44.1kHz x 16bit podem ser feitas posteriormente.
Prepare o ambiente:
- Ambiente silencioso, com o mínimo de ruído de fundo e reflexões.
- Evite vazamento de som dos fones de ouvido ou caixas de som.
Posicione o microfone:
- Distância consistente da boca (10–20 cm)
- Use pop filter para evitar plosivas
- Mantenha a mesma configuração durante todos os takes e dias de gravação

Durante a Gravação

Procedimento	Descrição
Silêncio natural no início e fim do áudio	Mantenha pelo menos 1 segundo de silêncio no início e no final de cada gravação.
Níveis de áudio	Monitore para evitar clipagem – o volume não deve exceder 0dB.
Espectro de frequência	Verifique se o espectro até 16kHz está completo e claro.
Evite ruídos indesejados	Nada de tosses, risadas ou sons inesperados (respirações naturais são permitidas).
Consistência	Mantenha o mesmo padrão de gravação durante todos os takes e dias.
Pausas	A cada 20–30 minutos, descanse a voz para evitar fadiga.

Organização dos Arquivos

Um arquivo por música.
Nome do arquivo em romano (sem acentos ou caracteres especiais).
Classifique por idioma.
Se houver múltiplos timbres vocais, classifique por idioma e timbre.
Cada classe em sua própria pasta.

#Gravação

#Tempo de Gravação

#O que Gravar

#Conteúdo Vocal Recomendado

#Como Gravar

#Antes de Começar

#Durante a Gravação

#Organização dos Arquivos