Een tijdje terug repte Bas er al over op LinkedIn, en ook in de podcast kwam het al even voorbij, AI-audio. Specifiek Suno AI, een tool waarmee je eenvoudig een muzieknummer kunt maken met en zonder teksten. En nu komt Stability AI ook met een nieuwe tool om muziek te maken. Google en OpenAI zijn er ook mee aan het werk, kortom, het leeft. Laten we er even induiken en wat overwegingen de revue laten passeren.
Suno AI
De tool Suno deed ons opkijken. Eerder hadden we al wel tools gezien waarmee je muziek kunt maken, maar het was allemaal niet van hoge kwaliteit. Enter: Suno AI. Suno stelt je in staat met een eenvoudige prompt muziek te maken. Text-to-music dus. Daarbij kun je zeggen dat er een tekst moet worden geschreven met een bepaald onderwerp. Je kunt ook zelf een tekst schrijven en aan Suno geven om te gebruiken. En natuurlijk kun je de muziek ook genereren met Suno in de stijl die je wilt. Van Scandinavische metal tot Afrikaanse muziek, echt alles.
Oke, een voorbeeldje:
‘A scandinavian metal song about two men with beards making a podcast about AI’
Is het niet jouw stijl? Passen we het aan naar een rap:
'A gangsterrap about two men with beards making a podcast about AI'
Na het geven van een prompt wordt door een LLM de tekst van je nummer gemaakt en gaat de AI aan de slag om de muziek te maken. Daarbij wordt ook meteen cover voor je nummer gegenereerd, dus als je het ergens online zet heb je meteen artwork om het te vergezellen.
Je kunt Suno AI gratis gebruiken, maar je hebt wel een account nodig. De muziek is in principe voor persoonlijk gebruik met een gratis account.
Met je gratis account kun je voorlopig tot 10 nummers per dag maken. Dat is best veel.
Stable Audio
Stable Audio is een vergelijkbare tools als Suno AI. En ja, V1 was er al. Inmiddels hebben we het dan ook over versie 2 van Stable Audio.
Het verschil met Suno is dat je geen teksten kunt laten schrijven of meegeven aan de muziek. Er komt dus een stuk muziek uit, tot maximaal 3 minuten. En dat is best lang. Je kunt ook kortere muziek laten maken, je hebt daarover de volledige controle.
Nog meer controle heb je met audio-to-audio. Daarmee kun je muziek aanpassen. Wil je liever een saxofoon dan een gitaar, upload de muziek en vervang het met een prompt. Je kunt daar ook je opgenomen zang inladen en zo een song maken met je eigen stem. Dit heb ik niet gedaan, dat lijkt me onnodig… Maar ik heb wel een testje gedaan.
'Americana song with some funky bass'
De muziek van Stable Audio lijkt mij meer geschikt als startpunt. Het is niet kant en klaar om online te gooien, maar het is een basis waar je je eigen zang over kan gooien en dergelijke. Tof! Maar niet af. Ik probeer het nog eens, een meer gekaderde prompt:
'A podcast intro with some 80's influences, synth, guitars and 80's drums'
Ook nu komt er muziek uit die niet af is, in zoverre dat je nog geen complete song hebt. Ik vind dat wel tof, want dit maakt wel dat je nog enige creativiteit nodig hebt om iets af te maken. Voor de snelle gebruiker is dit wellicht minder geschikt.
Google, OpenAI en andere alternatieven
Via Google Labs kun je het alternatief van Google ook eens proberen. Wat ik aan deze tool tof vind, je ziet welke delen van de prompt worden gebruikt om de muziek te genereren, ze de afbeelding hiernaast →
Op die manier kun je leren van de prompt en waar je wil tweaken door de sleutelwoorden aan te passen met suggesties van Google zelf.
Ook OpenAI werkt aan audio, al is dat nog ‘on the downlow’. Ze hebben nu de research gepubliceerd en wat voorbeelden gegeven. Maar, net als met Sora, kunnen we er nog niet mee spelen helaas. Ook is de kwaliteit nog niet geweldig, zeker de voorbeelden van Jukebox vallen kwalitatief tegen.
Natuurlijk zijn er meer opties beschikbaar, zoals Boomy of Beatoven. Maar ik heb een aantal van de tools naast elkaar gelegd en die komen nog niet in de buurt van Suno AI of Stable Audio.
Bezwaren tegen AI-audio
Afgelopen week kwam een reeks artiesten naar buiten om bezwaar te maken tegen muziek die door AI is gegenereerd.
In de brief schrijven ze dat ze bang zijn dat AI het werk gaat vervangen van artiesten die zelf muziek maken. Daarmee komt de broodwinning van artiesten in gevaar en ze vragen dan ook om deze AI-tools op een verantwoorde manier te ontwikkelen.
Het heeft veel weg van de protesten die we onder schrijvers en acteurs zagen toen deze vakbonden in de VS gingen staken. Ze zagen dezelfde gevaren als muziekmakers nu.
Kansen en bedreigingen
Suno zegt zelf geen stijlen over te nemen zoals OpenAI dat wel deed voor schrijfstijlen. Dus je kunt niet zeggen, ‘Maak een liedje in de stijl van Radiohead of Rihanna’. Het regelrecht jatten van muziek is ook al vaker onderwerp geweest van rechtszaken. Dus ik denk dat Suno en Stability zich wel twee keer achter de oren krabben voor ze dit mogelijk gaan maken. Desondanks is het goed dat er aandacht voor is, al denk ik dat echt goede muziek nog altijd door mensen worden gemaakt. Of is dat gewoon een leeftijdsdingetje…
Tegelijk ontstaan hiermee veel kansen voor mensen die online content maken. Het zijn tools die het makkelijk maken om muziek te maken voor je video of podcast zonder daar dure rechten voor te kopen of zo. Net als met afbeeldingen gaat stock een stuk minder aantrekkelijk worden. Ben jij online veel met content bezig, check dan vooral deze tools eens.