Datos, Datos, Datos
¡Cómo construir cosas geniales, legalmente!
Una de las primeras preguntas que siempre nos hacen cuando decimos que estamos construyendo una herramienta de música generativa con IA es: "¿Y de dónde están robando sus datos?" Aunque parece de sentido común en estos tiempos, la gente todavía no entiende la importancia de tener datos impecablemente limpios. Con el aumento de las grandes demandas entre Suno, Udio y las principales discográficas, este tema se ha convertido en uno realmente interesante para todos los que se preocupan por la industria musical y los derechos de los artistas. Nuestra visión es muy clara: ¡si lo creas, es tuyo! Pero claramente no todos en el sector piensan así.
Cuando decidimos terminar nuestra investigación de mercado y ensuciarnos las manos, lo primero que decidimos abordar fueron los DATOS. Sabíamos que esta sería una de las batallas más grandes de nuestro camino, pero también reconocimos la lucha como una oportunidad para diferenciarnos de otras herramientas. Si podíamos tomarnos el tiempo para curar el conjunto de datos perfecto — un conjunto que solo nosotros tuviéramos — podríamos entrenar modelos que nadie más en el mundo podría replicar. Y eso fue exactamente lo que hicimos. Decidimos que nuestro primer modelo debería ser una herramienta de generación de kick drums, titulada acertadamente "Just 4 Kicks", y nos pusimos a trabajar de inmediato.
Our first few pieces of training data - live recordings trimmed in Bitwig.
Las semanas siguientes consistieron en largas noches pegados a drum machines y pantallas de computadora. Empecé con todo el hardware que yo y mis amigos tenemos. Conectaba una máquina a mi interfaz, configuraba un loop de kick muy simple en 4x4 y comenzaba a grabar. Jugando con diferentes modulaciones, efectos y configuraciones, logré sacar alrededor de 1,000 kick drums. Yendo directamente del hardware al DAW, recorté cada sample y luego apliqué otra serie de efectos y transformaciones para cuadruplicar mi conjunto de datos. Ya en ese momento, me di cuenta de que estaba sentado sobre nuestro tesoro.
Luego realicé las mismas tareas con los plugins de batería que tengo y que permiten el uso secundario de datos. De nuevo, creé, recorté y transformé los samples para terminar con otros 2,000 kick drums. Pero mi amigo de confianza y mago del machine learning, Henning, me recordó que necesitábamos mucho más de 6,000 puntos de datos para arrancar. Así que, de mala gana, me lancé a internet. Para el último empujón de búsqueda de kick drums, hurguè en todas las bibliotecas de sonidos de código abierto que existen en busca de sonidos de alta calidad y libres de derechos. Calculo que escuché alrededor de 15,000 kick drums en este punto, hasta que lo dejé, tomé lo que encontré en mi DAW y comencé el proceso de recorte y transformación.
En total, toda esta experiencia me costó algunos días, pero no tengo cero arrepentimientos. Ahora que hemos usado este conjunto de datos de más de 9,000 kicks para entrenar nuestros primeros flujos de trabajo de ML de extremo a extremo, me recuerdo de la importancia de los datos y por qué tanta gente toma atajos. Dicho eso, si te tomas en serio lo que estás construyendo y quieres construir algo que no solo sea verdaderamente útil, sino también justo, ético y legal, tratar tus datos con amor y respeto siempre debería ser el paso número 1.
Diatriba terminada. Gracias de nuevo por escuchar estas palabras y darme un canal que es más barato que mi terapeuta :)
¡Como siempre — no dudes en ponerte en contacto!
— Max (max@just4noise.com)