データ、データ、データ

合法的にクールなものを作る方法!

生成AIの音楽ツールを作っていると言うと、最初によく聞かれる質問があります。「で、どこからデータを盗んでいるの?」と。最近では常識のように思えますが、人々はまだクリーンなデータの重要性を理解していません。SunoやUdioと主要レコードレーベルとの間の大規模な訴訟の増加とともに、このトピックは音楽業界とアーティストの権利に関心を持つすべての人にとって本当に興味深い話題になっています。私たちの見方は非常に明確です:作ったのがあなたなら、それはあなたのもの!しかし、業界の多くの人々がそのように考えていないことは明らかです。

市場調査を終えて本格的な作業を始める時が来たと決断したとき、最初に取り組もうと決めたのはデータでした。これが私たちの旅における最大の難関の一つになることはわかっていましたが、この戦いを他のツールとの差別化の機会として認識していました。完璧なデータセット——私たちだけが持つデータセット——をキュレートする時間を本当に取ることができれば、世界の誰も複製できないモデルをトレーニングできるはずです。そしてそれがまさに私たちがしたことです。最初のモデルはキックドラム生成ツールにすべきと決め、「Just 4 Kicks」と名付け、すぐに作業を始めました。

Kick drums used as training data to develop our generative AI music model

Our first few pieces of training data - live recordings trimmed in Bitwig.

その後の数週間は、ドラムマシンとコンピュータ画面に張り付いた長い夜が続きました。私と友人たちが所有するすべてのハードウェアから始めました。マシンをインターフェースに接続し、シンプルな4x4のキックループを設定し、録音を始めました。異なるモジュレーション、エフェクト、設定をいじることで、約1,000のキックドラムを記録することができました。ハードウェアから直接DAWへと移し、各サンプルをトリミングし、次にサウンドに別の一連のエフェクトと変換を適用してデータセットを4倍にしました。その時点で既に、私たちの宝箱の上に座っていることに気づきました。

その後、セカンダリデータ使用を許可しているドラムプラグインで同じタスクを実行しました。再び、サンプルを作成、トリミング、変換して、さらに2,000のキックドラムを作りました。しかし、信頼できる友人でMLの魔法使いであるヘニングは、軌道に乗るためには6,000データポイント以上が必要だと教えてくれました。そこで渋々インターネットに向かいました。キックドラム漁りの最後の一押しとして、高品質で著作権フリーのサウンドを求めて存在するすべてのオープンソースサウンドライブラリを掘り起こしました。諦めるまでに約15,000のキックドラムを聴いたと思います。見つけたものをDAWに取り込み、トリミングと変換のプロセスを始めました。

全体として、この全体験は数日間を要しましたが、後悔は全くありません。この9,000以上のキックのデータセットを使って最初のエンドツーエンドMLワークフローをトレーニングした今、データの重要性と、なぜ多くの人々が近道をとるのかを改めて認識しています。とはいえ、自分が構築しているものを真剣に考え、本当に有用で、かつ公正、倫理的、合法的なものを作りたいなら、データを愛情と尊重を持って扱うことが常にステップ1であるべきです。

愚痴終わり。これらの言葉を聞いてくれて、セラピストより安いはけ口を与えてくれてありがとう :)

いつでもお気軽にご連絡ください!

— Max (max@just4noise.com)

Previous
Previous

AIと現代の創造

Next
Next

Just 4 Noise: 起源の物語 — ドラムマシンと生成AI