Dit kan AI écht doen voor jouw video’s

Er valt een hoop te zeggen over artificial intelligence (AI) in video en dat wordt dan ook zeker gedaan op vele social media platformen. Maar wat betekent dit nu in de praktijk? In onderstaande video geeft Joery van Maak video MOOIJMAN! alvast drie concrete AI-toepassingen voor jouw videoproducties. Behoefte aan nog meer praktisch AI gebruik in video? Lees dan onder de video door voor drie extra AI-toepassingen.

Naadloos video netjes poetsen met een AI image filler.

Een relatief simpele: generative fill binnen Photoshop. Hartstikke leuk om je vakantiefoto’s verder mee uit te vergroten om te zien waar de AI van Adobe meekomt, maar soms ook heel praktisch. Voor een opdracht schoot Maak video MOOIJMAN! meerdere video’s tijdens een evenement. Helaas stond er vrijwel in elke ruimte een flip-over bord, vlak naast de sprekers. Hierop stond ook nog eens het wifi-wachtwoord van de locatie. Niet heel mooi, maar vooral niet heel handig. Nu bestaat een flip-over bord uit rasters en deze zijn vrij vervelend om goed aansluitend leeg te poetsen in Photoshop. Dus toen de vraag kwam of de wachtwoorden geblurd konden worden of verwijderd, werd voor het eerst kennis kunnen maken met generative fill. Binnen enkele seconden heeft deze functie een hoop tijd gescheeld door naadloos de rasters goed door te laten lopen, maar dan nu… blanco.

Voor
Na

Videoconcepten tot leven laten komen met AI generated images.

Het videoproductie proces vangt vaak aan bij het bedenken en uitwerken van een concept voor de video. Hierin maakt een conceptpresentatie al veel vooraf mogelijk door de video uiteen te zetten en in detail toe te lichten. In zo’n presentatie is visualisatie een sterk middel om het concept over te kunnen brengen aan de opdrachtgever. Met het googelen naar afbeeldingen komt men al een aardig eindje, maar een beetje goed concept bevat elementen die niet zo snel, of specifiek, op Google te vinden zijn. Denk bijvoorbeeld aan een ‘vrouw in een rode jas in een winkelstraat’. Een ‘vrouw in een winkelstraat’ komt nog wel tevoorschijn bij een zoekopdracht. Maar specifiek met een rode jas? Dat wordt al lastiger.

Gelukkig biedt AI-image generation wederom een uitkomst (lees: Adobe Firefly). Door een duidelijke text prompt te geven aan het AI-model komt er al vrij snel een afbeelding uit die in grote lijnen het concept kan visualiseren. Niet elke resultaat zal feilloos zijn, maar over het algemeen brengen dit soort beelden al veel meer over aan de opdrachtgever.

Hieronder staan drie AI-generated afbeeldingen die gebruikt zijn in een conceptpresentatie. Waarbij het concept moest overbrengen:

  1. Een vrouw in een rode jas met boodschap tassen in een winkelstraat overdag.
  2. Een doomsday bunker met een hoop wc-papier en een grote klok die aftelt.
  3. Een wetenschapper die onderzoek doet naar de aardbol.

Uitspraken corrigeren met AI voice cloning.

Deze laatste AI-toepassing ligt wat gevoeliger en was op het moment van gebruik zeker een wat grijs gebied: AI voice cloning. Het softwarebedrijf ElevenLabs specialiseert zich in AI-modellen rondom spraak. Door het invoeren van circa 1 minuut aan stemgeluid, is hun model in staat om een overtuigende stem na te bootsen.

Voor een videoproductie was er sprake van een fout in de uitspraak van een van de hoofdpersonen. Deze uitspraak was essentieel voor het onderwerp en de video, waardoor het fragment echt onderdeel moest zijn van de videoproductie. Het was helaas geen optie om dit los nog in te spreken of uit andere takes te halen. Daarom is ervoor gekozen om, met toestemming, de stem van deze persoon te clonen en de zin opnieuw uit te laten spreken. Doordat het referentiemateriaal uit de opnames kwamen, was de geluidskwaliteit relatief gelijk en kon zo dan ook netjes verwerkt worden in de montage.