Dados, Dados, Dados
Como construir coisas legais, legalmente!
Uma das primeiras perguntas que sempre nos fazem quando dizemos que estamos construindo uma ferramenta de música generativa com IA é: "Então, de onde vocês estão roubando seus dados?" Embora pareça senso comum nos dias de hoje, as pessoas ainda não entendem a importância de dados impecavelmente limpos. Com o aumento das grandes ações judiciais entre Suno, Udio e as principais gravadoras, esse tema se tornou realmente interessante para todos que se preocupam com a indústria musical e os direitos dos artistas. Nossa visão é muito clara: se você cria, é seu! Mas claramente não é assim que muitos outros no setor pensam.
Quando decidimos encerrar nossa pesquisa de mercado e começar a colocar a mão na massa, a primeira coisa que decidimos abordar foram os DADOS. Sabíamos que essa seria uma das maiores batalhas em nossa jornada, mas também reconhecemos a luta como uma oportunidade de nos diferenciar de outras ferramentas. Se pudéssemos realmente dedicar tempo para curar o conjunto de dados perfeito — um conjunto que só nós teríamos — poderíamos treinar modelos que ninguém mais no mundo poderia replicar. E foi exatamente isso que fizemos. Decidimos que nosso primeiro modelo deveria ser uma ferramenta de geração de kick drum, adequadamente intitulada "Just 4 Kicks", e nos colocamos imediatamente ao trabalho.
Our first few pieces of training data - live recordings trimmed in Bitwig.
As semanas seguintes consistiram em longas noites grudadas em drum machines e telas de computador. Comecei com todo o hardware que eu e meus amigos possuímos. Conectava uma máquina à minha interface, configurava um loop de kick muito simples em 4x4 e começava a gravar. Mexendo com diferentes modulações, efeitos e configurações, consegui gerar cerca de 1.000 kick drums. Indo diretamente do hardware para o DAW, aparei cada sample e depois apliquei outra série de efeitos e transformações para quadruplicar meu conjunto de dados. Já naquele momento, percebi que estava sentado sobre o nosso baú do tesouro.
Depois realizei as mesmas tarefas com os plugins de bateria que possuo e que permitem uso secundário de dados. Novamente, criei, aparei e transformei os samples para terminar com outros 2.000 kick drums. Mas meu amigo de confiança e mago do machine learning, Henning, me lembrou que precisávamos de muito mais do que 6.000 pontos de dados para começar. Então, a contragosto, fui à internet. Para o último empurrão na busca de kick drums, vasculhei todas as bibliotecas de sons de código aberto que existem em busca de sons de alta qualidade e livres de direitos autorais. Devo ter ouvido cerca de 15.000 kick drums nesse ponto, até que parei, peguei o que encontrei no meu DAW e comecei o processo de corte e transformação.
No total, toda essa experiência me custou alguns dias, mas não tenho zero arrependimentos. Agora que usamos esse conjunto de dados com mais de 9.000 kicks para treinar nossos primeiros fluxos de trabalho de ML de ponta a ponta, lembro-me da importância dos dados e por que tantas pessoas tomam atalhos. Dito isso, se você leva a sério o que está construindo e quer construir algo que não seja apenas verdadeiramente útil, mas também justo, ético e legal, tratar seus dados com amor e respeito deve sempre ser o passo número 1.
Desabafo terminado. Obrigado mais uma vez por ouvir essas palavras e me dar um canal que é mais barato que meu terapeuta :)
Como sempre — sinta-se à vontade para entrar em contato!
— Max (max@just4noise.com)