Daten, Daten, Daten
Wie man coole Dinge legal baut!
Eine der ersten Fragen, die wir immer gestellt bekommen, wenn wir sagen, dass wir ein generatives KI-Musik-Tool bauen, lautet: „Also, wo stehlt ihr eure Daten?" Auch wenn es heutzutage eigentlich selbstverständlich erscheint, verstehen die Leute immer noch nicht, wie wichtig saubere Daten sind. Angesichts der zunehmenden großen Klagen zwischen den Likes von Suno, Udio & Co und all den großen Plattenlabels ist dieses Thema für alle, die sich mit der Musikbranche und Künstlerrechten befassen, ein wirklich spannendes Diskussionsfeld geworden. Unsere Sichtweise ist ganz klar: Wenn du es erschaffst, gehört es dir! Aber das denken offensichtlich nicht alle in der Branche.
Als wir beschlossen, unsere Marktforschung zu beenden und die Hände schmutzig zu machen, war das Erste, was wir angehen wollten: DATEN. Wir wussten, dass dies eine der größten Herausforderungen unserer Reise sein würde, erkannten aber auch, dass dieser Kampf eine Gelegenheit war, uns von anderen Tools zu differenzieren. Wenn wir uns tatsächlich die Zeit nehmen würden, den perfekten Datensatz zu kuratieren — einen Datensatz, den nur wir haben — könnten wir Modelle trainieren, die niemand anderes auf der Welt replizieren könnte. Und genau das haben wir getan. Wir entschieden, dass unser erstes Modell ein Kick-Drum-Generierungstool sein sollte, passend „Just 4 Kicks" genannt, und begannen sofort mit der Arbeit.
Our first few pieces of training data - live recordings trimmed in Bitwig.
Die folgenden Wochen bestanden aus langen Nächten vor Drum Machines und Computerbildschirmen. Ich begann mit der gesamten Hardware, die ich und meine Freunde besitzen. Ich schloss eine Maschine an mein Interface an, setzte einen sehr einfachen 4x4-Kick-Loop und begann mit der Aufnahme. Durch das Spielen mit verschiedenen Modulationen, Effekten und Einstellungen konnte ich rund 1.000 Kick Drums herausarbeiten. Direkt von der Hardware in die DAW übertragen, schnitt ich jedes Sample zu, wendete dann eine weitere Reihe von Effekten und Transformationen auf die Sounds an, um meinen Datensatz zu vervierfachen. Schon in diesem Moment erkannte ich, dass ich auf unserem Schatz saß.
Anschließend führte ich dieselben Aufgaben mit den Drum-Plugins durch, die ich besitze und die eine sekundäre Datennutzung erlauben. Auch hier erstellte, schnitt und transformierte ich die Samples, um auf weitere 2.000 Kick Drums zu kommen. Doch mein vertrauenswürdiger Freund und Machine-Learning-Zauberer Henning erinnerte mich daran, dass wir weit mehr als 6.000 Datenpunkte brauchten, um ins Rollen zu kommen. Also machte ich mich widerwillig ins Internet auf. Für den letzten Schub an Kick-Drum-Suche durchforstete ich alle Open-Source-Soundbibliotheken im Netz auf der Suche nach qualitativ hochwertigen, urheberrechtsfreien Sounds. An diesem Punkt muss ich rund 15.000 Kick Drums angehört haben, bevor ich aufgehört, was ich fand in meine DAW importiert und mit dem Schneiden und Transformieren begonnen habe.
Insgesamt hat mich diese gesamte Erfahrung einige Tage gekostet, aber ich habe null Bedauern. Jetzt, da wir diesen Datensatz mit über 9.000 Kicks genutzt haben, um unsere ersten End-to-End-ML-Workflows zu trainieren, werde ich immer wieder an die Bedeutung von Daten erinnert — und warum so viele Leute Abkürzungen nehmen. Wenn du es jedoch ernst meinst mit dem, was du aufbaust, und etwas schaffen möchtest, das nicht nur wirklich nützlich, sondern auch fair, ethisch und legal ist, sollte der respektvolle Umgang mit deinen Daten immer Schritt Nummer Eins sein.
Rant vorbei. Danke, dass du diesen Worten zugehört hast und mir einen Kanal gibst, der günstiger ist als mein Therapeut :)
Wie immer — meld dich gerne!
— Max (max@just4noise.com)