AI-modellen: enorme mogelijkheden, maar ze schieten tekort in de videogame-industrie

Naarmate AI-tools zich blijven ontwikkelen, worden we voortdurend aangemoedigd om complexe taken aan hen te delegeren. Grote taalmodellen kunnenLLM's) Het schrijven van onze e-mails, het maken van presentaties, het ontwerpen van applicaties, het maken van video's, het zoeken op internet en het samenvatten van bevindingen, en nog veel meer. Er is echter één ding waar ik nog steeds heel veel moeite mee heb: videogames.

Dit jaar hebben twee van de grootste bedrijven op het gebied van AI (Microsoft en Anthropic) geprobeerd om met hun modellen games te maken of te spelen. De resultaten zijn waarschijnlijk veel beperkter dan veel mensen verwachten. Dit benadrukt de huidige uitdagingen op het gebied van generatieve AI, met name bij taken die strategische planning op de lange termijn en complexe besluitvorming vereisen.

Daarmee zijn ze een perfect voorbeeld van wat generatieve AI nu werkelijk doet: het kan veel meer dan voorheen, maar het kan niet alles. Dit geeft aan dat generatieve AI zich nog in de ontwikkelingsfase bevindt en dat er ondanks de toenemende mogelijkheden nog op bepaalde gebieden beperkingen bestaan.

Microsoft produceert Quake II met kunstmatige intelligentie

De productie van videogames kent vergelijkbare uitdagingen als de videoproductie, waarbij bewegingen vreemd en vervormd zijn en kunstmatige intelligentie na verloop van tijd het contact met de 'realiteit' verliest. De laatste poging van Microsoft, die Iedereen kan het proberen.Het is een door AI gegenereerde versie van Quake II.

Ik heb het spel al meerdere keren gespeeld en het is een hele vreemde ervaring. Er verschijnen ineens vreemde vijanden uit het niets en de omgeving verandert naarmate je beweegt. Het gebeurde vaak dat als ik een nieuwe kamer binnenkwam, de deuropening verdween als ik me omdraaide. En als ik dan weer vooruit keek, waren de muren verschoven.

Het spel duurt slechts enkele minuten en stopt dan om een nieuw spel te starten. Als u pech hebt, kan het zijn dat het spel al eerder niet meer goed op uw invoer reageert.

Hoe dan ook, het is een geweldige ervaring en ik denk dat het nuttig zou zijn als meer mensen het zouden zien. Zo kunt u zelf ervaren waar generatieve AI goed in is, en wat de huidige beperkingen zijn. Hoewel het indrukwekkend is dat we überhaupt een interactieve videogame-ervaring hebben kunnen creëren, is het moeilijk voor te stellen dat iemand deze technologische demo kan spelen en kan geloven dat de volgende Assassin's Creed door AI is gemaakt.

Toch bestaan dit soort ideeën en aannames vooral omdat mensen momenteel steeds meer over AI horen. Zelfs als AI je helemaal niets kan schelen, wordt het je toch overal opgedrongen. Het probleem is dat de informatie die de gemiddelde persoon krijgt, bijna volledig bestaat uit marketingcommentaren van grote technologiebedrijven en commentaren van leidinggevenden die door nieuwspublicaties zijn overgenomen.

Dat betekent dat ze overdreven en tegenstrijdige beweringen horen, zoals deze:

Het heeft de potentie om een aantal van de grootste problemen ter wereld op te lossen, zoals klimaatverandering, armoede en ziekte. (غيتس)

De kans is groot dat wij bij Meta, samen met andere bedrijven die zich hier vooral mee bezighouden, in 2025 de beschikking hebben over een AI die als mid-level engineer binnen uw bedrijf kan fungeren en efficiënt code kan schrijven. (Mark Zuckerberg)

Het effectief gebruiken van AI is tegenwoordig een basisvereiste voor iedereen bij Shopify. Het is tegenwoordig een hulpmiddel voor alle beroepen en zal in de loop van de tijd alleen maar belangrijker worden. Eerlijk gezegd denk ik niet dat je er niet aan ontkomt om AI in je bedrijf toe te passen. (Toby Lutke, CEO van Shopify)

We zijn er nu van overtuigd dat we weten hoe we kunstmatige algemene intelligentie (AGI) kunnen bouwen zoals we dat traditioneel begrijpen. Wij geloven dat we in 2025 de eerste AI-agenten op de werkvloer zullen zien verschijnen en dat deze een fundamentele verandering teweeg zullen brengen in de manier waarop bedrijven produceren. (Sam Altman, CEO van OpenAI)

Kunstmatige intelligentie is gevaarlijker dan bijvoorbeeld slecht ontworpen vliegtuigen, slecht onderhoud tijdens de productie of slordige autoproductie, in de zin dat het de potentie heeft – hoe klein ook, maar niet triviaal – om de beschaving te vernietigen. (Elon Musk)

Klinkt dit allemaal een beetje overdreven, nietwaar? Het is de bedoeling dat het ons tegelijkertijd redt en vernietigt, dat het zowel een hulpmiddel is voor professionals als een hulpmiddel dat hen zal vervangen. Het lijkt erop dat we dit jaar al AGI op sci-fi-niveau krijgen. Wanneer mensen dit allemaal horen, verwachten ze geweldige dingen van deze gadgets en gaan ze geloven dat alle kantoormedewerkers hun dag doorbrengen met praten tegen hun computer, net als personages uit Star Trek.

Maar zo ziet de werkelijkheid er niet uit. De realiteit lijkt op Quake II: wankel en wazig, met onbegrijpelijke vijandelijke vormen. LLM-modellen op ChatGPT-niveau waren in 2022 al een spannende doorbraak en erg leuk om mee te spelen. Maar voor de meeste toepassingen die grote technologiebedrijven ons nu opdringen, is AI simpelweg niet capabel genoeg. De nauwkeurigheid is erg laag, het vermogen om instructies op te volgen is erg laag, de context is erg klein en ze zijn alleen getraind met onzin van internet in plaats van met kennis uit de echte wereld.

Maar het maken van een videogame is een buitengewoon complex doel: het kost tenslotte hele teams van mensen jaren om zoiets te maken. Wat dacht je ervan om in plaats daarvan videogames te spelen?

Claude "speelt" Pokémon Red

Het blijkt dat mensen ook op dit gebied experimenteren. Het nieuwste model van Anthropic, dat is Claude 3.7 Sonnet Hij speelt Pokémon Rood op Twitch Het bestaat nu ongeveer twee maanden en levert tot nu toe de beste prestaties die een groot taalmodel (LLM) ooit heeft geleverd bij het spelen van Pokémon. Er is echter één kleine kanttekening: hij ligt nog steeds mijlenver achter op het gemiddelde niveau van een 10-jarig kind.

Eén probleem is de snelheid: Claude voert duizenden acties uit gedurende meerdere dagen, bijvoorbeeld om door het Viridian Forest te reizen. Dit weerspiegelt de uitdagingen van AI bij het uitvoeren van complexe taken.

Waarom duurt het zo lang? Het is niet zo dat hij niet op een strategische manier Pokémon-gevechten kan winnen – dat is juist het onderdeel waar hij goed in is. Aan de andere kant is het navigeren door de omgeving en het vermijden van bomen en gebouwen niet zo goed. Claude heeft nooit geleerd om Pokémon te spelen en het is voor hem niet makkelijk om pixelart te begrijpen en te begrijpen wat het voorstelt. Deze moeilijkheden benadrukken de kloof tussen het vermogen om data te verwerken en het vermogen om met complexe omgevingen te interacteren.

Het doorkruisen van doolhofachtige gebieden zoals Mount Moon is voor hem bijzonder lastig. Hij heeft er moeite mee om een kaart van het gebied te maken en niet teruggevonden te worden. Op een gegeven moment zat hij zo vast in een hoek dat hij concludeerde dat het spel kapot was en hij verzocht officieel om het spel te resetten. Dit illustreert hoe AI, ondanks de geavanceerde mogelijkheden, nog steeds niet over het intuïtieve inzicht beschikt dat mensen wel hebben.

Deze eerste pogingen verliepen ook niet zonder humor.

Op een keer zat Claude in een hoekje en was ervan overtuigd dat er iets niet klopte. Hij schreef daarom een formeel verzoek om het spel te resetten. pic.twitter.com/5RIiCJdxCM— Antropisch (@AnthropicAI) 25 februari 2025

Hij is ook niet goed in het onthouden van zijn doelen, dingen die hij al geprobeerd heeft of plaatsen die hij al bezocht heeft.

Daar is een heel eenvoudige reden voor: grote taalmodellen (LLM's) hebben een beperkt "contextvenster" dat als geheugen fungeert. Ze kunnen slechts een beperkte hoeveelheid informatie bevatten, en zodra Claude die limiet bereikt, comprimeert hij wat hij heeft om ruimte te maken voor meer. Zo kan een stukje informatie zoals "Viridian City bezocht, elk gebouw betreden en met elke NPC gesproken" gecomprimeerd worden tot "Viridian City bezocht", wat Claude ertoe aanzet terug te gaan en te kijken of er nog iets te doen is in de stad.

Kortom: Claude weet niet waar hij naartoe gaat, loopt tegen muren aan, raakt in de war door willekeurige voorwerpen en NPC's, vergeet waar hij is geweest en wat hij probeert te doen, en elke beslissing die hij neemt vergt vele alinea's vol nadenken. Dit is geen kritiek – dit zijn opwindende experimenten die grote taalmodellen (LLM's) tot de grenzen van het mogelijke op de proef stellen.

Maar met alle hype rondom AI is het belangrijk dat mensen demo's als deze zien en hun eigen mening over AI vormen. Sommige mensen proberen ons te vertellen dat we binnenkort de piek van onze intelligentie bereiken, dat kunstmatige intelligentie (AI) binnen een paar jaar zelfs de slimste mensen zal overtreffen. Ik denk echter niet dat ze eerlijk zijn, ze zijn gewoon verkopers. We zijn nog lang niet op het hoogtepunt, het hele gebeuren begint pas.