Google's nieuwe AI genereert geluid op basis van videopixels, ook lipsynchronisatie mogelijk - podcast episode cover

Google's nieuwe AI genereert geluid op basis van videopixels, ook lipsynchronisatie mogelijk

Jun 18, 20247 min
--:--
--:--
Download Metacast podcast app
Listen to this episode in Metacast mobile app
Don't just listen to podcasts. Learn from them with transcripts, summaries, and chapters for every episode. Skim, search, and bookmark insights. Learn more

Episode description

Google's AI-lab Deepmind heeft een nieuwe AI-technologie gepresenteerd die audio kan genereren op basis van videobeeld. Het AI-model analyseert videopixels en kan daar zelf audio aan toevoegen. Dat lijkt ook te werken met lipsynchronisatie, is in voorbeelden te zien.

De V2A (video-to-audio) technologie werkt in combinatie met het nieuwe AI-model Veo, van Google, dat video's kan genereren. Dat was tot nu toe altijd een stille video, maar daar kan nu ook audio aan worden toegevoegd. Google toont onder meer een video waarbij gitaarpingels klinken bij een video van gitaarspel.

Het meest opvallende voorbeeld is met animatiefiguurtjes die tegen elkaar praten. Het AI-model kan daarbij spraak toevoegen. Volgens Google is de technologie nog niet heel goed, en moet er nog een hoop aan gebeuren. 

Verder in deze Tech Update:

  • Massaclaim tegen Oracle en Salesforce in behandeling genomen door Amsterdams Gerechtshof. Vijf miljard euro is de eis voor het onrechtmatig bundelen en verkopen van persoonsgegevens van Nederlandse internetgebruikers. De claim wordt gedaan door The Privacy Collective, maar krijgt financiele steun door de Britse partij Innsworth die 30% vangt bij een overwinning.
  • Eurocommissaris Margrethe Verstager bevestigd een onderzoek en mogelijke aanklacht tegen Apple, door de Europese Commissie, vanwege de Digital Markets Act. Verstager spreekt over diverse 'serieuze problemen' rond Apple als marktmacht, in een interview met CNBC.

 

See omnystudio.com/listener for privacy information.

For the best experience, listen in Metacast app for iOS or Android