Grok 4.1 Fast uznany za model wysokiego ryzyka. Badacze alarmują ws. chatbotów AI

Grok

Chatboty AI miały być cyfrowymi asystentami, ale nowe badanie pokazuje, że część z nich potrafi wejść z użytkownikiem w bardzo niebezpieczny układ. Najgorzej wypadł model Grok 4.1 Fast od firmy xAI należącej do Elona Muska, który w testach badaczy nie tylko nie zatrzymywał urojeń, ale potrafił je rozbudowywać i zamieniać w instrukcje szkodliwego działania.


  • Badacze z CUNY i King’s College London przetestowali pięć modeli AI na scenariuszach obejmujących urojenia, paranoję, izolację od rodziny i myśli samobójcze.
  • Grok 4.1 Fast, Gemini 3 Pro i GPT-4o uzyskały profil wysokiego ryzyka, podczas gdy Claude Opus 4.5 i GPT-5.2 Instant wyraźnie lepiej hamowały niebezpieczne narracje.

Grok nie jest bezpieczny dla wszystkich?

Problem z chatbotami AI nie zaczyna się w momencie, gdy sztuczna inteligencja wygeneruje nam jakąś absurdalną odpowiedź.

Ten zaczyna się o wiele wcześniej, w momencie, gdy użytkownik zaczyna traktować maszynę jak spowiednika, terapeutę, lekarza, partnera i doradcę życiowego wyżej od rzeczywistości.

Wtedy każda odpowiedź chatbota przestaje być „tekstem wygenerowanym przez model”, a zaczyna działać jak potwierdzenie od kogoś, komu człowiek ufa bardziej niż rodzinie, psychiatrze czy własnemu rozsądkowi.

Właśnie dlatego wyniki nowego badania w tej kwestii są tak niepokojące.

Badacze z City University of New York i King’s College London sprawdzili pięć modeli: GPT-4o, GPT-5.2 Instant, Claude Opus 4.5, Gemini 3 Pro Preview i Grok 4.1 Fast.

Testy obejmowały scenariusze związane z urojeniami, paranoją, izolacją od rodziny, ukrywaniem problemów przed psychiatrą, emocjonalnym przywiązaniem do AI i myślami samobójczymi.

To nie były abstrakcyjne promptowe sztuczki, tylko symulacje sytuacji, w których człowiek w kryzysie może naprawdę szukać odpowiedzi u chatbota.

Najgorzej wypadł Grok 4.1 Fast od firmy xAI Elona Muska.

Według autorów badania model najczęściej potwierdzał niebezpieczne założenia użytkownika i potrafił budować na nich kolejne warstwy narracji.

Pisząc wprost, podkręcał jeszcze mocniej jego niepokojące  zapędy. Jeżeli ktoś pisał o rzekomej złej istocie w lustrze, Grok nie sprowadzał rozmowy na ziemię, tylko wchodził w ten świat.

Jeżeli użytkownik sugerował odcięcie się od rodziny, model nie wzmacniał kontaktu z bliskimi, tylko podpowiadał, jak ograniczyć komunikację.

W takim układzie chatbot przestaje być narzędziem, a zaczyna działać jak akcelerator kryzysu.

To szczególnie groźne, bo użytkownicy nie korzystają dziś z AI wyłącznie do streszczeń, kodu czy maili.

Coraz częściej dzielą z chatbotami swoje lęki, rozpady związków, objawy psychiczne, konflikty rodzinne, decyzje medyczne i pytania, których wstydzą się zadać lekarzowi.

Chatbot odpowiada natychmiast, nie ocenia, jest zawsze dostępny i brzmi pewnie. Dla osoby samotnej, przeciążonej albo podatnej na urojenia taka kombinacja może być mocniejsza niż rozmowa z realnym człowiekiem.

Jak wypadły inne modele?

W tym kontekście różnica między modelami robi się krytyczna.

Claude Opus 4.5 i GPT-5.2 Instant częściej zatrzymywały niebezpieczną narrację, kierowały użytkownika ku bardziej realistycznym wyjaśnieniom i zewnętrznemu wsparciu.

GPT-4o, Gemini 3 Pro i przede wszystkim Grok częściej wpadały w pułapkę dopasowania się do użytkownika. A w rozmowie z kimś, kto traci kontakt z rzeczywistością, „dopasowanie się” nie jest empatią. Może być dolewaniem benzyny do ognia.

Najważniejszy wniosek jest taki, że im bardziej ludzie traktują chatboty jak prywatnych terapeutów i lekarzy, tym większą odpowiedzialność ponoszą twórcy modeli za to, jak AI reaguje w kryzysie.

Bo jeśli system brzmi jak autorytet, pamięta kontekst, okazuje ciepło i potwierdza użytkownikowi jego najgorsze przekonania, to nie jest już neutralna technologia.

To produkt, który w rękach osoby w kryzysie może przesunąć granicę między niepokojem a realną tragedią.


Śledź CrypS. w Google News. Czytaj najważniejsze wiadomości bezpośrednio w Google! Obserwuj ->

Zajrzyj na nasz telegram i dołącz do Crypto. Society. Dołącz ->