Notebookcheck Logo

xAI lanserar Grok 3 AI med topprestanda och betaversioner av resonemangsmodeller

xAI lanserar Grok 3-familjen med banbrytande AI. (Bildkälla: xAI)
xAI lanserar Grok 3-familjen med banbrytande AI. (Bildkälla: xAI)
De senaste stora språkmodellerna från xAI har toppat benchmarklistorna tack vare sin förmåga att söka efter information på Internet, resonera sig fram till komplexa problem och bearbeta indata med ett kontextfönster på en miljon tokens. Grok 3-modellerna har slagit OpenAI GPT-4o och DeepSeek-V3 på de flesta benchmarks.

Elon Musks xAI har lanserat Grok 3-familjen av avancerade AI-modeller för stora språk som generellt överträffar andra AI:er på standardiserade AI-benchmarks.

Grok 3-modellerna tränades på företagets Colossus superdatorkluster som använder 100.000 Nvidia Hopper Tensor Core GPU: er. Ett par standard- och mini-modeller för icke-resonemang (Grok 3 beta och Grok 3 mini beta) tillsammans med ett par resonemangsmodeller (Grok 3 beta (Think) och Grok 3 mini beta (Think)) har släppts.

De icke-resonerande modellerna överträffar i allmänhet de tidigare AI som toppat listorna, till exempel OpenAI GPT-4o och DeepSeek-V3. En anledning är att de har ett kontextfönster på en miljon token, vilket gör det möjligt för AI att använda mycket stora mängder text. Detta förbättrar modellernas förmåga att syntetisera rätt svar från en mängd olika källor. Med detta sagt svarar Grok 3 beta-modellerna fortfarande på faktasökande frågor med mindre än 50% noggrannhet (SimpleQA benchmark), så människor kommer fortfarande att ha jobb i morgon.

De resonerande modellerna tänker igenom komplexa frågor steg för steg, vilket gör att användaren kan se AI:ns tankeprocess. Detta gör att AI:n kan lösa problem som en expert skulle göra genom att lösa mindre delar av problemet och kombinera resultaten för att få ett korrekt svar. Genom att välja DeepSearch-agenten, eller sökalternativet, får Grok 3 i uppdrag att söka brett och djupt på internet och använda kodtolkar innan den genererar rapporter som sammanfattar resultaten. Grok 3 (Think)-modellerna rankas i allmänhet som bäst på att lösa matematiska problem, svara på flervalsfrågor på universitetsnivå och utföra kodningsuppgifter jämfört med andra AI.

xAI räknar med att fortsätta justera Grok 3 för förbättrad prestanda under de kommande månaderna på ett 200 000-GPU superdatorkluster. Grok 3 är nu tillgängligt för alla användare på X och Grok.com. Gratisanvändare kan stöta på användningsbegränsningar, medan betalande användare får tillgång till avancerade funktioner.

Chatbot Arena ELO-poängen för Grok 3 AI rankar den som den bäst presterande i världen. (Bildkälla: xAI)
Chatbot Arena ELO-poängen för Grok 3 AI rankar den som den bäst presterande i världen. (Bildkälla: xAI)
Grok 3 beta och Grok 3 mini beta överträffar i allmänhet OpenAIs GPT-4o och DeepSeek-V3 på standardiserade AI-riktmärken. (Bildkälla: xAI)
Grok 3 beta och Grok 3 mini beta överträffar i allmänhet OpenAIs GPT-4o och DeepSeek-V3 på standardiserade AI-riktmärken. (Bildkälla: xAI)
Grok 3 beta (Think) och Grok 3 mini beta (Think) överträffar i allmänhet alla andra testade resonerande AI-modeller. (Bildkälla: xAI)
Grok 3 beta (Think) och Grok 3 mini beta (Think) överträffar i allmänhet alla andra testade resonerande AI-modeller. (Bildkälla: xAI)
Please share our article, every link counts!
Mail Logo
> Bärbara datorer, laptops - tester och nyheter > Nyheter > Nyhetsarkiv > Nyhetsarkiv 2025 02 > xAI lanserar Grok 3 AI med topprestanda och betaversioner av resonemangsmodeller
David Chien, 2025-02-21 (Update: 2025-02-21)