Grok 4 przewyższa poziom doktorancki. Elon Musk prezentuje przełomowy model AI

1 miesiąc temu 38

xAI zaprezentowało Grok 4 – nowy model sztucznej inteligencji, który ma przewyższać konkurencję w wielu wymagających testach. Musk twierdzi, że Grok 4 radzi sobie lepiej niż doktorant w każdej dziedzinie wiedzy, choć „czasem brakuje mu zdrowego rozsądku”.

Grok, model sztucznej inteligencji stworzony przez firmę xAI Elona Muska, jest ściśle zintegrowany z platformą X (dawniej Twitter). Ostatnia aktualizacja Groka wywołała kontrowersje — model zaczął generować obraźliwe i wulgarne odpowiedzi oraz promować nietypowe i kontrowersyjne treści. Sytuacja ta rodzi pytania o kontrolę nad AI i intencje Muska. Firma przyznała się do problemu i zapewniła, że wprowadziła dodatkowe mechanizmy mające blokować mowę nienawiści przed jej publikacją na platformie X.

W międzyczasie xAI zaprezentowało nowy model — Grok 4, który według zapowiedzi ma znacznie przewyższać konkurencyjne rozwiązania, takie jak ChatGPT od OpenAI czy Gemini od Google. Szczegóły opisuje serwis Tech Crunch.

Grok 4 i Grok 4 Heavy

xAI właściwie wprowadziło na rynek dwa modele: Grok 4 oraz jego zaawansowaną wersję Grok 4 Heavy. Podstawowy Grok 4 to potężny model sztucznej inteligencji, który samodzielnie odpowiada na różnorodne pytania i zadania, osiągając wysokie wyniki w testach akademickich.

Z kolei Grok 4 Heavy to wersja „multi-agentowa”, która znacznie zwiększa możliwości modelu dzięki jednoczesnej pracy wielu agentów AI. Każdy z nich niezależnie analizuje problem, a następnie wspólnie porównują swoje odpowiedzi, podobnie jak zespół badawczy, aby wyłonić najlepsze rozwiązanie. Ta współpraca wielu agentów pozwala Grok 4 Heavy działać szybciej i skuteczniej, szczególnie przy bardziej skomplikowanych zadaniach i w zastosowaniach profesjonalnych.

"Jeśli chodzi o pytania akademickie, Grok 4 przewyższa poziom doktorancki we wszystkich dziedzinach, bez wyjątku” — powiedział Elon Musk podczas środowej transmisji na żywo. „Czasami może brakować mu zdrowego rozsądku i jeszcze nie wynalazł nowych technologii ani nie odkrył nowej fizyki, ale to tylko kwestia czasu.”

Testy Grok 4 – ma być lepszy niż konkurencja

Grok 4 bez wspomagających narzędzi uzyskał wynik 25,4% w teście Humanity’s Last Exam, pokonując modele takie jak Gemini 2.5 Pro (21,6%) i OpenAI o3 (21%). Z kolei Grok 4 Heavy, korzystając z dodatkowych narzędzi, osiągnął aż 44,4%, wyraźnie wyprzedzając konkurencję.

Model Grok uzyskał także najlepszy wynik w teście ARC-AGI-2, który sprawdza zdolność AI do rozpoznawania wzorców wizualnych – zdobywając 15,9%, czyli niemal dwa razy więcej niż Claude Opus 4.

Abonament SuperGrok Heavy

Wraz z premierą modeli, xAI wprowadziło najdroższy jak dotąd plan subskrypcyjny – SuperGrok Heavy, w cenie 300 dol. miesięcznie. Użytkownicy zyskują wcześniejszy dostęp do Grok 4 Heavy i nadchodzących funkcji, które xAI zamierza wprowadzić w najbliższych miesiącach. Według podanych informacji, w sierpniu pojawi się model AI do kodowania, we wrześniu agent multimodalny, a w październiku – model do generowania wideo.