AI Music Production Workflow

Vom KI-Song zum fertigen Produkt

Hier eine Liste der zu erledigenden Arbeiten, bis ein Titel weltweit auf allen Streaming-Portalen zur Verfügung steht am Beispiel des eigenen Labels nuonu „NEW ON YOU“, der früher als unser Bandname diente und jetzt für unsere KI Produktionen verwendet wird. In den Beispielen hört ihr verschiedene Ideen mit deutschen, englischen Texten, Instrumental…

1. Songidee

Klassisch oder über ChatGPT und Co.

Erstelle einen treffenden Text (Lyrics), der sich nach den Bausteinen des Songs orientiert, also Verse, Chorus, Bridge etc…

Achte darauf, dass keine wiederkehrenden klassischen KI-Phrasen enthalten sind. Ein guter Text wird noch während der Produktion mehrfach angepasst, damit er in die Songstruktur passt.

2. Erstellung eines Songs

Klassisch im Studio (Recording) oder mit KI in Suno, Udio und Co.

Das ist der einfachste Teil (der Spaß macht, egal ob im Proberaum oder vor dem Rechner). Bei KI muss man darauf achten, dass genau das gesungen wird, was auch im Text steht. Das ist leider nicht immer der Fall. Meist muss man über „extend“ die Titel ab einer bestimmten Stelle erweitern. Das Ende des Songs ist für Suno 3.5 ein Problem. Hier lohnt der Wechsel zu Version 3, nur notfalls geht auch ein Fade-Out. ein (End) liefert nach einigen / vielen Versuchen oft auch wirklich ein schnelles Ende und erstellt ab einer gewünschten Position ein Ende. Suno erstellt aus meiner Sicht die besseren Kompositionen, UDIO ist dafür etwas cleaner. Beide werden sich schnell weiterentwickeln, daher lohnt es, sich über die Fortschritte zu informieren. Es kommen auch immer wieder neue Stimmen hinzu. Rauschen ist bei den neuen Stimmen weniger oder nicht störend. Auch Instrumente können schnell aufgeblasen werden und können dann nicht mehr für qualitativ hochwertige Tracks verwendet werden. Die Beispiele „Underneath the clear blue Sky“ und „Windräder im Wald“ sind sehr gut. Beide wurden aus alten Texten neu erstellt, da die erste Version nicht gut war. „Der letzte Tanz“ ist ein deutscher Duett versuch. Am Ende ist etwas Rauschen zu hören, aber es ist ein tolles Beispiel wie komplex Stimme bereits jetzt abgebildet werden kann. Power Metal etc… hat mit Rauschen weniger ein Problem, da es ohnehin laut und E-Gitarrenlastig ist. „Mit Mathe geht es immer voran“ kann daher wie viele „Power Metal“ Songs recht leicht erstellt werden.

3. Mastering

Die Songs sind leiser und weniger präsent als Radiotitel. Die Lautstärke wird in LUFS angegeben und sollte zwischen 12 und 14 liegen. Hier braucht man ein Audioprogramm wie Logic und um KI-Rauschen zu minimieren, EQ um die Tiefen anzupassen und mehr Präsenz zu erreichen, und schließlich auch das eigentliche Mastering, das die Titel lauter macht. Hierfür verwende ich auch Isotope RX11. Es gibt mehrere KI-Plug-ins, die KI-Titel qualitativ besser machen.

Seit Ende Juli 2024 ist es in Suno Möglich Instrumental und Vocal getrennt als WAV zu speichern. Beide Spuren hören sich nicht perfekt an, aber zusammen erhält man den gleichen Song. Stem nennt sich die Spur in Suno und kann jetzt getrennt in zwei Audiospuren verarbeitet werden. So können jetzt alle Effekte und PlugIns besser geregelt werden. Es ist insg. also die derzeit beste Methode um KI Songs nachträglich zu Mastern.

Da aber auch die PlugIns nicht alles korrigieren können. Ist schon bei der Erstellung penibel daruf zu achten, dass alles passt. Bei erweiterten Stücken können Texte abgeschnitten sein oder auch falsche Wörter generiert worden sein. Eine genaue Kontrolle ist daher unerläßlich. Oft läßt sich im Schnitt das eine oder andere aber noch korrigieren. Dabei können auch die zum „extend“ Final verwendeten Teile hilfreich sein. 

4. Export als WAV und MP3

Anfang und Ende etwas Luft lassen, ohne Dithering.

5. Fotos für Album-Cover erstellen

Klassisch oder über KI-Tools wie Midjourney, Dall-E3, Firefly etc. Für ein Video können auch mehrere Bilder generiert werden, die zum Thema passen.

6. Upscaling der Cover und Videobilder

KI-Bilder müssen hochskaliert werden. Das geht am besten mit Topaz Gigapixel, aber auch Lightroom etc. bietet solche Funktionen.

7. Bandnamen und Titel

Überlegt euch spätestens jetzt einen Bandnamen und den Titel eures Musikstücks. Der Bandname ist idealerweise als transparentes PNG-Logo vorhanden, so kann er für weitere Titel einfach eingefügt werden.

8. Album-Cover entwerfen

Album-Cover werden immer in 1:1, also quadratisch gebraucht. Diese Version nutze ich mittlerweile auch für Suno, YouTube, Instagram und Facebook. Falls es für euch wichtig ist, könnte man auch gleich noch 16:9 für YouTube oder andere Social Media Formate erstellen. Speicherung erfolgt immer mit Bandname – Titel.jpg und sollte ca. 2 MB haben. Das ist die Größe, wo Suno die .jpg Album Cover noch annimmt. Außerdem können diese auch für YouTube, Facebook, Instagram und Co. verwendet werden. Die Größe ist mit 3840px x 3840px ideal. Speichert euch auch das .psd ab, so könnt ihr später noch Änderungen vornehmen. Es ist zu bedenken, daß Suno sein Format auf Portrait geändert hat und die Texte daher nicht die volle Breite haben sollten. Das ist auch für Instagram besser, da die Videos dort in den Reels angezeigt werden und auch dieses Format hochformatig ist. 

9. MP3Tag Generator

In WAV und MP3s sollte man Titel, Interpret, Albumcover etc. hinterlegen. Diese werden auch auf verschiedenen Endgeräten angezeigt und sind daher wichtig. Um wegen der Suno Version und der gemasterten (Finalen) Version unterscheiden zu können. Empfehle ich einen Zusatz, z.B. (Master). Nur diese Version sollte auch mit den Tags und dem Bild versehen werden. Später kann man dann alle Master Versionen in einen Ordner packen und hat dann ein finales Album falls gewünscht. Hier wird dann (Master) als Test entfernt.

10. Musikvideo erstellen

YouTube und soziale Medien sind wichtig und erlauben es, deine Musik samt Text (evtl. mit Untertiteln) den Zuhörern zu präsentieren. Je mehr Songs man hat, desto wichtiger wird auch eine eigene Playlist für deine „Band“. So können Zuhörer auch andere Titel von dir entdecken.

Mittlerweile erstelle ich nur noch dann „richtige“ Videos, wenn ich dafür eine Videoidee habe. Der Aufwand bringt meist nicht mehr views und daher geht es darum, eher schnelle und Sozial Media Freundliche quadratische Videos im Coverformat zu erstellen.

11. Untertitel

Die Texte euerer Titel sind wichtig und werden praktisch überall gebraucht. YouTube erstellt eigene Untertitel, aber mit den richtigen Lyrics sieht das einfach besser aus und ist dann auch fehlerfrei. Hier fällt auch spätestens auf, wenn im Song bei der Generierung Fehler entstanden sind.

12. Suno (oder andere), YouTube, Facebook, Instagram und Co.

Jetzt wird es Zeit, eurer Musikstück, die Texte und das Artwork zu teilen. Hier könnt ihr auch auf YouTube verlinken falls möglich. Eure Songs verschwinden in den Feeds und Reels sehr schnell. Google und YouTube hält euer Werk aber für immer in den Bildern, Videos etc… so könnt ihr auch Jahre später über euren Bandnamen und all das was ihr in den Texten hinterlegt habt gefunden werden.

13. Distribution und Vermarktung

Der letzte und wichtigste Schritt ist das Streaming und der Verkauf auf allen gängigen Plattformen. Ich empfehle hier Feiyr, da es aus der Region ist und einen super Support hat. Ihr gebt hier eure Daten und Bankverbindung an und könnt dann ein Label anlegen und eure Titel hochladen und veröffentlichen.

 

Hinweis:

Rechnet für den gesamten Prozess pro Song mit ca. einem Tag.

3,00 Stunden Erstellung des Songs incl. Text
0,30 Stunden Artwork
2,00 Stunden Mastering
1,00 Stunden Sozial Media
0,30 Stunden Untertitelkorrektur
1,00 Stunden Feiyr

Am Anfang werdet ihr vom gesamten Workflow überfordert sein. Tatsächlich ist man als Musiker, Komponist oder Produzent im Vorteil. Hier sind die Prozesse bereits bekannt. Aber auch wer mit Musik bisher nichts am Hut hatte, kann sich in die Sache einarbeiten. In diesem Fall empfehle ich aber unbedingt, das ganze auf kleiner Ebene erstmal auszuprobieren. Ansonsten investiert ihr Geld und Zeit in eine Sache, die ihr nicht voll ausnützen könnt. Der Frust ist dann wie bei echten Musiker auch oft groß. Die Erwartungshaltung sollte also realistisch sein.

Videos mit YouTube Untertitel und Album Cover in 1:1

Die aktuell für mich bessere Version. Sie ist schnell erstellt und ist auf Sozial Media meist das bessere Format.

Videos in 16:9

Die klassische Form in 4k ist nicht zwingend erforderlich. Grad auf mobilen Endgeräten sind diese oft weniger present aus als die dort größere quadratische Form. Außerdem ist es ein zusätzlicher Aufwand diese Videos zu erstellen. Untertitel lohnen sich nicht, da YouTube diese ebenfalls einblenden kann und dann der eigene Text eher störend ist.

Erfolg:

Die Wahrscheinlichkeit, dass ihr einen Song „schreibt“, der erfolgreich ist, wird sehr gering sein. Die Kosten halten sich aber insbesondere bei KI auch in Grenzen. Suno alleine reicht sicher nicht, daher sollte man sich keine großen Hoffnungen machen, zumal die Werbung für einen Song heute meist nur über virale Hypes möglich ist. Wenn euer Song aber schon mal in den Suchanfragen auftaucht und gestreamt werden kann, dann ist das ein erster wichtiger Schritt. Evtl. hilft es auch, Themenbezogene Titel zu wählen, diese haben sicher eine höhere Trefferwahrscheinlichkeit.

Kosten:

Einmalig wird man ca. 1000 EUR in die Hand nehmen, um Software wie Logic, Isotope, MP3 Tag etc. zu kaufen und dann noch Abos für Suno, Adobe, Topaz, Midjourney und Co. abschließen müssen. Damit sind die Kosten und der zeitliche Aufwand deutlich geringer als beim lernen eines Musikinstruments.

Fazit:

Als Musiker oder auch KI-Musiker unterscheidet sich das Ganze nicht. Lediglich muss man bei KI kein Instrument lernen oder selbst singen.

Ideal ist das Ganze für Hintergrundmusik, da diese lizenzfrei erstellt und verwendet werden kann. Man legt sich in ein paar Monaten einen eigenen Pool an Musiktiteln an.

Komposition oder KI-Generierung hat erstmal nichts mit Live-Auftritten zu tun. Diese sind nach wie vor den Musikern vorbehalten. Aber auch diese werden die Möglichkeiten des einfacheren Textens gerne verwenden bzw. werden in ihren Veröffentlichungen ähnlich vorgehen wie ich.

Ich schließe aber nichts aus. Ich kenne auch noch die Zeit, wo DJs nicht als Musiker galten. Heute ist es normal, dass diese Hochzeiten und Events bespielen. Nichts ist also ausgeschlossen und gerade die ersten erfolgreichen KI Titel werden sicher auch von den Medien gehypt werden.