Especificações para Gravação de Vocais
Antes de iniciar qualquer gravação, é fundamental estabelecer os parâmetros técnicos e as boas práticas que garantirão a qualidade do dataset. Esta etapa cobre as recomendações de gravação, os requisitos de formato de áudio e os softwares indicados para a captação.
Recomendações de Gravação
Siga estas diretrizes para garantir um áudio limpo, consistente e adequado ao treinamento de modelos SVS:
Sobre Conteúdo Vocal
Sobre Ambiente e Equipamento
Respirações naturais entre frases devem ser mantidas — elas são importantes para a naturalidade da voz sintetizada. Apenas sons extraordinários (tosse, risada, clique) devem ser evitados.
Requisitos de Formato de Áudio
Os seguintes parâmetros técnicos são obrigatórios para garantir compatibilidade com os pipelines de treinamento (como SOFA, DiffSinger, etc.):
Recomenda-se gravar em 48kHz / 24bit para maior qualidade e maior margem para pós-produção. Conversões para 44.1kHz / 16bit podem ser feitas posteriormente, se necessário.
Organização dos Arquivos
- Grave cada música separadamente — um arquivo por música
- Nome do arquivo em romano (sem acentos, cedilhas, espaços ou caracteres especiais)
- ✅
song_01.wav - ❌
música.wav,茉莉花.wav,my song#01.wav
- ✅
Verificação de Qualidade
Antes de prosseguir, verifique:
- Espectro de frequência: garanta que o espectro até 16kHz esteja completo e claro. Se houver perda visível de altas frequências (corte acima de 12–16kHz), o modelo pode não ter uma qualidade desejada, tendo a necessidade de trocar o equipamento de gravação.
- Volume: nenhum pico deve ultrapassar 0dB. Mantenha os picos entre -12dB e -6dB para segurança.
Exemplos de espectros de boa qualidade e problemáticos estarão aqui
Softwares Recomendados
Escolha um dos seguintes DAWs (Digital Audio Workstations) para realizar a gravação:
Nesta documentação estaremos utilizando o Adobe Audition como software de gravação.
Tutoriais Recomendados
Abaixo você encontra tutoriais recomendados para cada software:
Adobe Audition
Audacity
Reaper

