Introdução

Introdução ao Guia de Gravação

Warning

Antes de obter as gravações, certifique-se de que a fonte dos seus dados é legal e está em conformidade com as normas aplicáveis.

A qualidade de um modelo de voz para canto (SVS) está diretamente ligada à consistência, clareza e riqueza dos dados de áudio utilizados no treinamento. Diferente da síntese de fala convencional (TTS), o SVS exige um controle mais refinado sobre aspectos como sustentação de notas, dinâmica, vibrato, articulação silábica e variações de intensidade ao longo do tempo.

O objetivo deste guia é estabelecer um fluxo de trabalho confiável e reproduzível para a produção de um dataset de canto de alta qualidade. As etapas a seguir foram organizadas para garantir que o áudio bruto coletado — desde a captação até o material final processado — preserve ao máximo as características naturais da voz do(a) cantor(a), ao mesmo tempo que atende aos requisitos técnicos dos modelos neurais modernos.

O guia está dividido em três etapas fundamentais:

  1. Especificações – Definição dos parâmetros técnicos e ferramentas ideais para a gravação (formato de áudio, taxas de amostragem, softwares recomendados).

  2. Gravação – Estratégias para o conteúdo vocal, tempo de gravação, estrutura de arquivos e boas práticas durante a captação.

  3. Pós-produção – Normalização de loudness, remoção de ruídos e preparação final dos arquivos para o pipeline de treinamento.

Siga rigorosamente cada etapa para evitar artefatos indesejados no modelo final e garantir que a voz sintetizada seja expressiva, estável e natural ao cantar.