ChatGPT's Nieuwe Upgrade: De Toekomst van Multimodale AI

13-10-2023

ChatGPT's Nieuwe Upgrade: De Toekomst van Multimodale AI

OpenAI heeft ChatGPT niet alleen maar gemaakt als een chatbot. Met de recente upgrade kan ChatGPT nu verhalen vertellen met een AI-stem, objecten in foto's identificeren en reageren op audio-opnames. Dit duidt op de toekomst van AI: multimodale modellen die zowel tekst, afbeeldingen, audio als video kunnen verwerken.

Linxi "Jim" Fan, een senior AI-onderzoekswetenschapper bij Nvidia, benadrukte het belang van deze multimodale aanpak. OpenAI's demo toonde aan hoe ChatGPT kan helpen bij praktische taken, zoals het verstellen van een fietszadel.

Wat vooral opmerkelijk is, is dat deze geavanceerde functies nu toegankelijk zijn voor het bredere publiek. Eerder waren ze voornamelijk beschikbaar voor ontwikkelaars via API-toegang. Maar met de nieuwste update zijn ze nu beschikbaar voor iedereen met een ChatGPT Plus-abonnement, dat kost $20 per maand. Bovendien kunnen Android- en iOS-gebruikers gebruik maken van spraakinvoer via de ChatGPT-app.

Multimodaliteit lijkt de toekomst van AI te zijn, met mogelijkheden die verder gaan dan alleen beeld en stem, zoals 3D-data en zelfs digitale geurdata. Toch staan bedrijven die multimodale AI willen ontwikkelen voor uitdagingen, vooral vanwege de enorme hoeveelheid data die nodig is voor training.

Bron: Origineel artikel door Matthew S. Smith.

Gegenereerd door Dall-E2: Robot sniffing with its nose
Gegenereerd door Dall-E2: Robot sniffing with its nose