Een uitgebreide vergelijking tussen ChatGPT en Gemini: welke AI-assistent is beter?

OpenAI en Google concurreren momenteel om de beste Deep Research-client te leveren. De Gemini Deep Research-client is gebaseerd op het nieuwe Gemini 2.0 Flash Thinking-model, terwijl de ChatGPT Deep Research-client een verbeterde versie van het o3-model gebruikt. Het is interessant om te weten dat Google zijn client gratis aanbiedt, terwijl OpenAI $ 20 rekent. We hebben echter zowel Google Deep Research als OpenAI-clients getest, dus laten we eens kijken hoe ze zich tot elkaar verhouden.

Taak 1: Onderzoek naar de opkomst van kunstmatige intelligentie in China

Om de ChatGPT en Gemini deep learning agents te testen, vroeg ik hen om diepgaand onderzoek te doen naar de opkomst van AI in China. Ik vroeg beide agents om de leidende AI-bedrijven in China, overheidsbeleid en de concurrentie met Amerikaanse laboratoria te analyseren. China en de VS concurreren om het leiderschap in AI, waardoor dit onderzoek zeer relevant is voor de toekomst van technologie.

De ChatGPT Deep Research-agent had 10 minuten nodig om de taak uit te voeren en citeerde 30 verschillende bronnen, wat resulteerde in een rapport van 9000 woorden. De Deep Research-klant van Gemini zocht daarentegen 8 minuten en produceerde een veel kleiner rapport van 3000 woorden. Er zijn echter meer dan 170 websites geanalyseerd, wat verbazingwekkend is.

Wat de onderzoeksresultaten betreft, heb ik beide rapporten zorgvuldig bestudeerd en vastgesteld dat de cliënt ChatGPT Deep Research is volledig mislukt Met betrekking tot de recente ontwikkelingen in China op het gebied van kunstmatige intelligentie. Er werd zelfs niet over gesproken Diep zoeken R1, Baidu's nieuwe Ernie 4.5-model en Plus. Dit toont het belang aan van het updaten van informatiebronnen in AI-onderzoek.

Het bleek dat de ChatGPT Deep Research-client sterk afhankelijk was van een artikel van Stanford University en een Wikipedia-pagina die respectievelijk voor het laatst zijn gepubliceerd en bijgewerkt in 2017 en 2021. Hierdoor was de meeste informatie verouderd. Er werd zelfs niet gesproken over de nieuwste generatie videomodellen en botbedrijven. Het is van cruciaal belang dat informatie actueel blijft in dit snel veranderende vakgebied.

Hoewel de Gemini Deep Research-klant kort was, verklaarde hij: "Het is de moeite waard om op te merken dat DeepSeek, een startup die in 2023 werd opgericht, snel bekend is geworden met zijn R1-model.“Bovendien,” schreef Gemini ook, “DeepSeek onderscheidt zich ook door zijn baanbrekende werk bij de ontwikkeling van nieuwe architectuurontwikkelingen, zoals Multi-Head Latent Attention (MLA)."

Hij besprak ook AI-videogeneratietools zoals Kling AI en MiniMax, en AI-aangedreven roboticabedrijven zoals Unitree. Mijn inschatting is dat De functie van Gemini is de zoekindex van Google., die regelmatig wordt bijgewerkt met nieuwe webpagina's over elk onderwerp. OpenAI vertrouwt waarschijnlijk op Bing om webpagina's voor zoekopdrachten te selecteren en selecteert daardoor verouderde informatie. Dit onderstreept het belang van een krachtige en nauwkeurige zoekmachine op het gebied van kunstmatige intelligentie.

Taak 2: Onderzoek de toekomst van AI-chips in vergelijking met Nvidia GPU's

In de volgende taak vroeg ik een Deep Research-agent van ChatGPT en Gemini om de toekomst van gespecialiseerde AI-chips te onderzoeken in vergelijking met de Nvidia GPU's die momenteel voor training worden gebruikt en de Plus. ChatGPT gebruikte 22 bronnen en produceerde een groot document met ingesloten tabellen en referenties. Gemini analyseerde, net als eerder, meer dan 100 webpagina's, maar genereerde een kort document.

Beide agenten merkten de opkomst op van TPU's, ASIC's, FPGA's, LPU's en WSE's en berichtten over de dominantie van Nvidia CUDA. Er werd ook gesproken over nieuwe siliciumbedrijven zoals Groq, Cerebras, SambaNova, Graphcore en anderen. De Deep Research AI-agent van ChatGPT had het ook over de Ascend AI-chip van Huawei, maar Gemini noemde dit niet.

ChatGPT Deep Research noemde ook de Trainium- en Inferentia-chips van Amazon, de MAIA-chip van Microsoft, de Gaudi-accelerator van Intel en de TPU van Google. Maar net als bij de vorige fout blijft ChatGPT in het verleden hangen. Er is bijvoorbeeld geen informatie dat Google de TPU v6e (Trillium)-chip al heeft uitgebracht. ChatGPT denkt ook dat de Blackwell B200 van Nvidia een toekomstige GPU is, maar deze zou in 2024 moeten verschijnen.

Ondanks deze tekortkomingen zou ik de voorkeur geven aan de Deep Research-agent van ChatGPT, omdat het rapport meer diepgang en inzichten biedt dan Gemini. Het is echter belangrijk om op te merken dat er een fundamenteel probleem is met de Deep Research-agent van ChatGPT.

De agent maakt gebruik van een aangepaste versie van het o3-model van OpenAI, waarvan de training in oktober 2023 eindigt. Hierdoor beschikt het interne model niet over de meest recente kennis. Hoewel het internet wordt gebruikt om actuele informatie te verkrijgen, missen we vaak de nieuwste ontwikkelingen.

Taak 3: Onderzoek naar obesitasmanagement in 2025

Voor de derde taak heb ik de Deep Research-agent op ChatGPT en Gemini gevraagd om onderzoek te doen naar obesitasmanagement in 2025. Ik heb beide agenten specifiek gevraagd om de nieuwste ontwikkelingen in 2025 te betrekken, met inbegrip van alle soorten behandelingen. ChatGPT's Deep Research citeert hoogwaardige bronnen en medische tijdschriften om de huidige behandelingen voor obesitasbeheersing uit te leggen.

Hij noemde nieuwe ontwikkelingen zoals GLP-1-peptiden, de bijwerkingen ervan, de goedkeuringsstatus van nieuwe medicijnen door de FDA en zelfs gentherapie. ChatGPT werpt licht op het huidige beleid inzake obesitasbestrijding in de Verenigde Staten, het Verenigd Koninkrijk en Canada.

Aan de andere kant deed Gemini's Deep Research-agent het ook geweldig. Hierin werden alle medische interventies opgesomd en opgenomen Aankomende medicijnonderzoeken In tabelvorm. Wat ik interessant vond, is dat Gemini nieuwe medicijnen noemde, zoals trihormoonreceptoragonisten (Retatrutide), die in de medische wereld voor ophef zorgen als het gaat om enorm gewichtsverlies.

Daarnaast duikt Gemini van Google in bedrijven als Novo Nordisk en Eli Lilly, die proeven doen met nieuwe medicijnen voor gewichtsverlies, en biedt het bedrijf een compleet beeld van de ontwikkelingen. Over het algemeen zou ik zeggen dat het rapport van Gemini goed gestructureerd was en de meest recente informatie over de behandeling van obesitas bevatte.

Moet je ChatGPT Deep Research of Gemini Deep Research gebruiken?

Mijn ervaring leert dat ik de voorkeur geef aan de Gemini Deep Research AI-agent, omdat deze voortdurend actuele informatie over verschillende onderwerpen bevat. Hoewel de ChatGPT Deep Research-agent een breed scala aan ideeën bestrijkt, kan hij door de beperkte kennis van de laatste ontwikkelingen geen compleet beeld schetsen. Bovendien is de Gemini Deep Research AI-agent gratis voor alle gebruikers, terwijl OpenAI $ 20 rekent voor toegang tot de intelligente agent. Deep Search, ChatGPT en Gemini zijn twee van de belangrijkste AI-zoekhulpmiddelen die momenteel beschikbaar zijn.

Gemini is zoveel beter omdat het nu gebaseerd is op het Gemini 2.0 Flash Thinking-model. In vergelijking met het vorige Gemini 1.5 Pro-model denkt en plant het nieuwe denkmodel de informatie die het nodig heeft om de zoekopdracht uit te voeren. Dankzij deze ontwikkeling kan Gemini diepgaandere en nauwkeurigere zoekresultaten bieden.

Eén van de grote voordelen van de ChatGPT Deep Research-agent is echter de mogelijkheid om bestanden te uploaden, terwijl Gemini het uploaden van bestanden niet toestaat wanneer u een agent gebruikt. Dit kan vooral handig zijn voor STEM-onderzoek, waarbij u PDF's van betaalde wetenschappelijke tijdschriften kunt uploaden. Deze functie vergemakkelijkt het wetenschappelijk onderzoeksproces aanzienlijk.

Omdat veel van deze tijdschriften achter een betaalmuur zitten en niet via internetzoekmachines te raadplegen zijn, kunt u handmatig bestanden uploaden om zo een uitgebreidere kennisbank te creëren. Hierdoor kan de agent waardevolle inzichten integreren. Met Gemini kunt u het gegenereerde rapport exporteren naar Google Docs, wat handig is om te delen. Deze functie maakt het eenvoudiger om samen te werken en onderzoek te delen.

Over het algemeen raad ik aan om de Gemini Deep Research AI-agent te gebruiken voordat u zich abonneert op het ChatGPT Plus-abonnement. Google heeft de proxy sterk verbeterd en is nu veel sneller. Gemini is een uitstekende keuze voor onderzoekers die op zoek zijn naar een krachtig en kosteneffectief onderzoeksinstrument.

ChatGPT Gemini