Gravação

Com as especificações técnicas definidas, esta etapa detalha o processo prático de captação: quanto tempo gravar, qual conteúdo vocal produzir e como executar a gravação seguindo as boas práticas estabelecidas.

Tempo de Gravação

A duração total recomendada varia conforme o tipo de modelo que você deseja treinar:

Tipo de ModeloDuração RecomendadaObservações
Modelo Individual (único cantor)1 a 3 horasPor ser um único cantor, um número maior de dados é necessário para cobrir a variedade fonética, podendo precisar de mais horas dependendo da quantidade de idiomas cantados.
Modelo Multi-Vocal (vários cantores)Até 1 hora por vozCada voz se benificia dos dados de todo o conjunto, podendo ter menos gravações por voz.
Tip

Para qualquer tipo de modelo, qualidade > quantidade. É preferível ter 1 hora de áudio impecável e boa distribuição fonética do que 3 horas com ruídos ou inconsistências.


O que Gravar

Conteúdo Vocal Recomendado

Para garantir um modelo robusto e expressivo, o dataset deve cobrir:

AspectoRecomendação
Alcance (vocal range)Grave notas graves, médias e agudas do seu alcance natural.
Velocidades (tempo)Músicas lentas (baladas), médias (pop) e rápidas (rock, dance).
FonemasCubra todos os fonemas do idioma, com ênfase nos raros (ex.: mandarim: "iong", "uai"; japonês: "ky", "jy").
Expressividade vocalGrave com emoção, dinâmica e variações de intensidade.
Estilos musicaisAs que o seu vocal cobre e que se sinta confortável em cantar.
Sons sustentadosInclua notas longas para evitar interrupções no banco de vozes.

Como Gravar

Antes de Começar

  1. Escolha o software adequado.

    • Adobe Audition, Audacity, Reaper, qualquer outro software de gravação do seu gosto.
  2. Configure o formato de áudio:

    • Preferencial: WAV Mono, 48kHz x 24bit.
    • Alternativa: WAV Mono, 44.1kHz x 16bit.
    Tip

    Recomenda-se gravar em 48kHz x 24bit para maior qualidade. Conversões para 44.1kHz x 16bit podem ser feitas posteriormente.

  3. Prepare o ambiente:

    • Ambiente silencioso, com o mínimo de ruído de fundo e reflexões.
    • Evite vazamento de som dos fones de ouvido ou caixas de som.
  4. Posicione o microfone:

    • Distância consistente da boca (10–20 cm)
    • Use pop filter para evitar plosivas
    • Mantenha a mesma configuração durante todos os takes e dias de gravação

Durante a Gravação

ProcedimentoDescrição
Silêncio natural no início e fim do áudioMantenha pelo menos 1 segundo de silêncio no início e no final de cada gravação.
Níveis de áudioMonitore para evitar clipagem – o volume não deve exceder 0dB.
Espectro de frequênciaVerifique se o espectro até 16kHz está completo e claro.
Evite ruídos indesejadosNada de tosses, risadas ou sons inesperados (respirações naturais são permitidas).
ConsistênciaMantenha o mesmo padrão de gravação durante todos os takes e dias.
PausasA cada 20–30 minutos, descanse a voz para evitar fadiga.

Organização dos Arquivos

  • Um arquivo por música.
  • Nome do arquivo em romano (sem acentos ou caracteres especiais).
  • Classifique por idioma.
  • Se houver múltiplos timbres vocais, classifique por idioma e timbre.
  • Cada classe em sua própria pasta.