Het is altijd lastig om tijdens een historische ontwikkeling, vast te stellen of je deel uitmaakt van een historische ontwikkeling - dat is meestal iets wat je pas achter kunt bepalen. Maar je zou zeggen dat het kan toch bijna niet anders dan dat 2023 hét jaar wordt waarin AI zijn doorbraak beleefde. Zeker in de creatieve industrie groeit de hoeveelheid slimme tools zo'n beetje met de dag. En als dit jaar het scharnierpunt wordt, waarbij we vanaf nu praten over een pre- en post-AI tijdperk, hoe ziet dan de toekomst eruit van de podcast- en audiowereld?
Nieuwe toepassingen
Veel professionals hebben de verschillende AI-tools ontdekt als gereedschap dat het leven makkelijker maakt. Binnen Airborne namen wij afgelopen weken de proef op de som en onderzochten waar en hoe AI een toegevoegde waarde is binnen het proces van podcasts maken (zie kader).
Daarbij zal deze nieuwe technologie leiden tot nieuwe gebruikstoepassingen. Text-to-speech bestaat natuurlijk al langer, maar AI maakt het betaalbaarder en toegankelijker voor een breed publiek. De kwaliteit van kunstmatige stemmen verbetert bovendien snel en zijn ook nog eens steeds beter te regisseren. Bij bijvoorbeeld Murf.ai kun vrij eenvoudig aanpassingen doen om pauzes, intonatie en uitspraak goed te krijgen.
Het omzetten van geschreven tekst naar audio is vooral handig voor wie niet in de gelegenheid of in de stemming is om te lezen. ‘Audio as a service’, dat vrij functioneel is. Op deze manier een 'mind blowing' luisterervaring creëren waarbij je je luisteraars meeneemt in een meeslepend verhaal, is echt nog niet aan de orde.
Maar als je een stap verder denkt, dan biedt het gemak waarmee je tekst in audio omzet veel aanknopingspunten. Om gepersonaliseerde audio te maken, hoef je niet langer de studio in. Een podcast waarbij je een luisteraar met zijn eigen naam aanspreekt, is dan bijvoorbeeld mogelijk. Maar denk ook aan een op maat gemaakte newsfeed met het weerbericht in jouw regio en de laatste nieuwsberichten over jouw favoriete sportclub. Of een hoogwaardige productie, waarin bepaalde segmenten gepersonaliseerd zijn - iets wat natuurlijk al vaker is gedaan in print en audio. Met als effect dat het hele verhaal persoonlijk aanvoelt.
Menselijke connectie
Bij wijze van test lieten we AI bijna helemaal een podcast maken (zie kader). 'Laat je hiermee niet juist zien dat podcastmakers binnenkort niet meer nodig zijn?,' werd ons hier en daar gevraagd.
Nu zijn we als mensheid verdomd slecht in het inschatten van de mogelijke consequenties die technologische innovaties met zich meebrengen (er zijn mensen menen dat het sinds de agrarische revolutie alleen maar bergafwaarts is gegaan). Dus elke voorspelling over hoe AI de wereld en ons vakgebied gaat beïnvloeden, zou je met een flinke korrel zout moeten nemen. Maar vooralsnog levert AI vooral tools op die het werk vergemakkelijken en verbeteren. Het neemt het werk dus niet over. Gaat dat ooit gebeuren? Misschien. Maar er zijn erg veel factoren die de kwaliteit van een podcast bepalen: van het script, tot de stem van de host en van het sound design tot de muziek. Het zou een behoorlijk vernuftige tool moeten zijn die dat allemaal combineert en tot een kloppend geheel smeedt.
Het overgrote deel van de luisteraars en makers ziet AI vooralsnog ook echt als hulpmiddel, zo blijkt uit een
onderzoek van podcastbedrijf Acast. Luisteraars geven bovendien aan dat ze échte mensen onmisbaar vinden. Niet heel verrassend: een podcast wordt vooralsnog gezien als een intiem medium, waarbij de menselijke connectie essentieel is.
______________________________________________
Afgelopen weken zetten we binnen Airborne op verschillende manieren AI-tools in om te onderzoeken waar en op welke momenten het een meerwaarde biedt.
1. Concept-ontwikkeling
Op 27 januari jl. werd 's werelds eerste AI reclamebureau gelanceerd: The Uncreative Agency. Op basis van éénregelige briefing, genereert dit 'bureau' á la minute een deck waarmee je onder arm naar je opdrachtgever zou moeten kunnen stappen. De briefing: bedenk een podcast-format waarmee een financiële dienstverlener zich kan profileren onder werkzoekenden. De snelheid waarmee er een deck (met 6 slides) wordt opgeleverd, is indrukwekkend. Voor de ideeën geldt dat helaas niet: te weinig doordacht en te voor de hand liggend.
Inmiddels is duidelijk dat The Uncreative Agency een initiatief is van reclamebureau DDB. En natuurlijk realiseert het bureau zich goed dat hun AI-tool niet volmaakt is, maar we zouden als creatieve industrie AI moeten omarmen en ontwikkelen - aangezien het ons alleen maar kan helpen om betere ideeën te ontwikkelen.
Meer bij
MediaPost en
The Uncreative Agency
2. Onderwerpen vinden
Voor ANWB maken wij 'Verborgen verhalen': een succesvolle podcast waarin we op zoek gaan naar lokale mysteries en oude legendes. Het vinden van nieuwe onderwerpen is altijd een kwestie van veel research, dus een goed moment om te kijken of dat proces versneld kan worden met de hulp van ChatGPT. De vraag naar onopgeloste mysteries levert in eerste instantie vooral een aantal bekende vermissing- en moordzaken op. Maar met betere instructies - een 'prompt', zoals dat in jargon heet - verschijnen er betere cases. Althans zo lijkt het. Een verhaal over de verdwenen kluis van Willem III, vol met kostbaarheden, is één van de grootste mysteries uit de Nederlandse geschiedenis, zo meldt ChatGPT. Minstens zo interessant is het verhaal uit de jaren '20 van de vorige eeuw, over de verdwenen diamanten van de Hollandse IJsclub.
Maar het blijkt wat naïef om hier onze hoop te vestigen: nadere online research geeft in beide gevallen geen enkel aanknopingspunt. Niets van de verhalen is waar. En dat is gelijk de Achilleshiel van de veel gebruikte testversie van ChatGPT: informatie wordt op een stellige manier, zonder enig voorbehoud gebracht, terwijl feitelijke onderbouwing ontbreekt. Of, zoals het vooraanstaande
MIT Technology Review het omschrijft: 'AI-language models are notorious bullshitters'. De onderzoekers waarschuwen dat we met de tool zeer zorgvuldig moeten omspringen in tijden van fake news en complot-theorieën.
3. Voor 98% gegeneerd door AI
Niet alles wat ChatGPT uitspuwt is onzin. Wanneer we vragen naar de historie van podcasts en mogelijke toepassingen, rolt er wel degelijk een kloppend verhaal uit. Als test laten we dit vervolgens inspreken door een AI-stem van Murf.ai: in ongeveer een kwartiertje hebben we AI een podcast-aflevering laten generen, met een kloppend verhaal en een stem die goed te verdragen is. Wanneer je generieke en makkelijk te verifiëren informatie op een rij moet zetten, kan ChatGPT daarbij dus wel goed helpen. En vervolgens kun je dat dus aanbieden als ‘audio as a service’.
Luister hier naar 'Voor 98% gemaakt met AI'
4. Muziek
Een goede, verhalende podcast zonder muziek is... tja... niet zo veel eigenlijk. Het is bepalend voor de signatuur van een productie, en cruciaal om de juiste sfeer te creëren. Bij Beatoven.ai kun je AI razendsnel tracks laten componeren, op basis van een aantal variabelen. Wij lieten verschillende tracks maken, waaronder eentje met de instructies: pop, fast en happy. Er rolt gelijk een track uit, die je vervolgens eenvoudig kunt modelleren. Bijvoorbeeld door verschillende instrumenten aan en uit te zetten. De track zelf is het best te omschrijven als 'stock muziek in z'n puurste vorm'. En daarmee lang niet even goed bruikbaar. Wel interessant is dat je een verklaring krijgt waarin staat dat de muziek rechtenvrij is.
5. Online advertising
Vanuit Airborne ontwikkelen we ook campagnes ter promotie van podcasts. En daarvoor zijn online advertising-assets nodig: copy met een beperkt aantal tekens, waarvan bovendien meerdere varianten nodig zijn, om zo vervolgens te testen welke het beste converteren. Ook hiermee blijkt ChatGPT goed uit de voeten te kunnen. Op basis van een omschrijving en specificaties voor het aantal beschikbare tekens, rollen er verschillende varianten uit. Hier en daar net niet helemaal de juiste toon, maar dat is nog slechts een kwestie van redigeren. Dit scheelt al snel een uurtje of twee puzzelen met tekst.
6. Visuals
De cover-art is de visuele identiteit van een podcast en bepalend voor potentiële luisteraars om al dan niet te gaan luisteren. Op AI-gebied kun je op basis van de juiste prompt makkelijk beelden laten generen door Dall-E, van dezelfde makers als ChatGPT. Een andere tool die veel aandacht krijgt, is Midjourney. Dit draait binnen het online platform Discord. Binnen verschillende chat-kanalen kun je je instructies delen, waarna er vervolgens beelden worden gegeneerd.
Wij ontwikkelen op dit moment een true crime-podcast, waarbij het draait om een vrouw die in haar flat is vermoord met een met een mes. We omschrijven de omgeving en de situatie zo gedetailleerd mogelijk, naast de gewenste specificaties van het beeld (zoals: photo realistic, 8k). Het resultaat is behoorlijk indrukwekkend. Althans, als het gaat om objecten. Kloppende mensfiguren met de juiste gezichtsuitdrukking blijken een stuk lastiger te zijn.