xAI lanserar Grok 3 AI med topprestanda och betaversioner av resonemangsmodeller

xAI lanserar Grok 3-familjen med banbrytande AI. (Bildkälla: xAI)

De senaste stora språkmodellerna från xAI har toppat benchmarklistorna tack vare sin förmåga att söka efter information på Internet, resonera sig fram till komplexa problem och bearbeta indata med ett kontextfönster på en miljon tokens. Grok 3-modellerna har slagit OpenAI GPT-4o och DeepSeek-V3 på de flesta benchmarks.

David Chien (översatt av Ninh Duy), Publicerad 02/21/2025 🇺🇸 🇩🇪 ...

AI Software Launch

Elon Musks xAI har lanserat Grok 3-familjen av avancerade AI-modeller för stora språk som generellt överträffar andra AI:er på standardiserade AI-benchmarks.

Grok 3-modellerna tränades på företagets Colossus superdatorkluster som använder 100.000 Nvidia Hopper Tensor Core GPU: er. Ett par standard- och mini-modeller för icke-resonemang (Grok 3 beta och Grok 3 mini beta) tillsammans med ett par resonemangsmodeller (Grok 3 beta (Think) och Grok 3 mini beta (Think)) har släppts.

De icke-resonerande modellerna överträffar i allmänhet de tidigare AI som toppat listorna, till exempel OpenAI GPT-4o och DeepSeek-V3. En anledning är att de har ett kontextfönster på en miljon token, vilket gör det möjligt för AI att använda mycket stora mängder text. Detta förbättrar modellernas förmåga att syntetisera rätt svar från en mängd olika källor. Med detta sagt svarar Grok 3 beta-modellerna fortfarande på faktasökande frågor med mindre än 50% noggrannhet (SimpleQA benchmark), så människor kommer fortfarande att ha jobb i morgon.

De resonerande modellerna tänker igenom komplexa frågor steg för steg, vilket gör att användaren kan se AI:ns tankeprocess. Detta gör att AI:n kan lösa problem som en expert skulle göra genom att lösa mindre delar av problemet och kombinera resultaten för att få ett korrekt svar. Genom att välja DeepSearch-agenten, eller sökalternativet, får Grok 3 i uppdrag att söka brett och djupt på internet och använda kodtolkar innan den genererar rapporter som sammanfattar resultaten. Grok 3 (Think)-modellerna rankas i allmänhet som bäst på att lösa matematiska problem, svara på flervalsfrågor på universitetsnivå och utföra kodningsuppgifter jämfört med andra AI.

xAI räknar med att fortsätta justera Grok 3 för förbättrad prestanda under de kommande månaderna på ett 200 000-GPU superdatorkluster. Grok 3 är nu tillgängligt för alla användare på X och Grok.com. Gratisanvändare kan stöta på användningsbegränsningar, medan betalande användare får tillgång till avancerade funktioner.

Chatbot Arena ELO-poängen för Grok 3 AI rankar den som den bäst presterande i världen. (Bildkälla: xAI)

Grok 3 beta och Grok 3 mini beta överträffar i allmänhet OpenAIs GPT-4o och DeepSeek-V3 på standardiserade AI-riktmärken. (Bildkälla: xAI)

Grok 3 beta (Think) och Grok 3 mini beta (Think) överträffar i allmänhet alla andra testade resonerande AI-modeller. (Bildkälla: xAI)

Källa(n)

xAI blogg, xAI Colossus AI Supercomputer

Relaterade artiklar

Forskare vid Fudan University utvecklar AI-drivet blodprov för att förutse sjukdomsrisk flera år i förväg. (Bildkälla: Louis Reed, Unsplash)

AI-drivet blodprov förutspår sjukdomar 15 år innan symtom uppträder 02/25/2025

HIX.AI lägger till DeepSeek-R1 AI till sitt erbjudande av inloggningsfria chatbotar. (Bildkälla: HIX.AI)

HIX.AI presenterar gratis inloggning till DeepSeek-R1 AI-chatbot 02/21/2025

Humane Ai Pin kommer snart att förvandlas till en brevpress (Bildkälla: Humane)

Humane Ai Pin förlorar (nästan) alla funktioner efter HP:s förvärv 02/20/2025

Genom att använda sin egen kamera för motivspårning blir AI Tracker plattformsoberoende (Bildkälla: Insta360)

Insta360:s nya Flow 2 Pro AI Tracker gör att flaggskeppets gimbal fungerar med Android telefoner och appar från tredje part 02/19/2025

AI Confidential-demo går live på Steam för Windows- och Linux-spelare (Bildkälla: Steam)

Välkommen till morgondagen: AI Confidential-demo på Steam 02/18/2025

AI möter spel: spelare hjälper till att upptäcka okänt marint liv (Bildkälla: MBARI)

Från spelkonsoler till havets djup: Spelare tränar AI för undervattensuppdrag 02/17/2025

Sam Altman beskriver OpenAI:s färdplan för AI LLM. (Bildkälla: OpenAI)

Sam Altman twittrar OpenAI:s AI LLM-roadmap inklusive GPT-5 02/13/2025

Potentiell OnePlus 13T dyker upp i ...

LG:s Gaming Portal rullas ut till f...

Editor of the original article: David Chien - Tech Writer - 530 articles published on Notebookcheck since 2023

Translator: Ninh Ngoc Duy - Editorial Assistant - 522633 articles published on Notebookcheck since 2008

contact me via: Facebook

Please share our article, every link counts!

> Bärbara datorer, laptops - tester och nyheter > Nyheter > Nyhetsarkiv > Nyhetsarkiv 2025 02 > xAI lanserar Grok 3 AI med topprestanda och betaversioner av resonemangsmodeller

David Chien, 2025-02-21 (Update: 2025-02-21)