Anthropic wypuszcza Sonnet 5. Jest dużo tańszy, a konkuruje z Opus

Anthropic

Anthropic wprowadził na rynek Claude Sonnet 5. Model jest dostępny w cenie 2 USD za milion tokenów wejściowych i 10 USD za milion tokenów wyjściowych. To ceny obowiązujące do 31 sierpnia. Potem koszt wzrośnie do odpowiednio: 3 USD i 15 USD. Sonnet 5 ma spróbować dorównać modelowi Opus 4.8.


  • Anthropic wprowadza na rynek nowy model AI, Sonnet 5, który ma być najbardziej efektywną wersją tej linii i zbliżać się wydajnością do modelu Opus 4.8, ale w niższej cenie.
  • Dostęp do modelu kosztuje 2 USD za 1 mln tokenów wejściowych i 10 USD za wyjściowe (promocyjnie do 31 sierpnia), potem wzrośnie do 3 USD i 15 USD; model jest też dostępny w planach Free, Pro, Team i Enterprise.
  • Sonnet 5 osiąga wysokie wyniki w benchmarkach (m.in. SWE-bench i GDPval-AA), a firma równolegle rozwija systemy ochrony przed jailbreakami, czyli próbami obejścia zabezpieczeń modeli AI.

Anthropic oferuje Sonnet 5

Anthropic wypuścił we wtorek Claude Sonnet 5, określając go jako „najbardziej efektywny model Sonnet jaki dotąd wyszedł”.

Jest to domyślny model AI dla użytkowników pakietów Free i Pro, dostępny w planach Max, Team i Enterprise, w Claude Code oraz za pośrednictwem API.

W przeciwieństwie do poprzednich modeli Sonnet, ten ma dorównywać poprzedniemu modelowi Opus, a nie ustępować mu o jeden poziom.

Jak twierdzi firma, Sonnet 5 jest „zbliżony do Opus 4.8, ale dostępny w niższej cenie”.

Warto spojrzeć na wyniki: w teście SWE-bench Pro Sonnet 5 osiągnął 63,2%, w porównaniu z 58,1%, jakie osiągał Sonnet 4.6.

W GDPval-AA v2, benchmarku sztucznej analizy, który ocenia rzeczywiste zadania wykonywane w 44 zawodach, Sonnet uzyskał wynik 1618, co stanowi remis z 1616 w Opus 4.8.

Różnice między Sonnet 5 a Opus 4.8 w Humanity’s Last Exam są zasadniczo pomijalne: 57,4% w porównaniu z 57,9%.

Koszt? Model jest dostępny w cenie 2 USD za milion tokenów wejściowych i 10 USD za milion tokenów wyjściowych, ale tylko do 31 sierpnia. Potem koszt wzrośnie do odpowiednio: 3 USD i 15 USD.

Co z Fable 5?

Warto dodać, że na rynku pojawi się też wycofany Claude Fable 5.

To owoc „serii produktywnych rozmów z rządem USA”. Model pojawi się jednak z „nowym zestawem klasyfikatorów, które mają na celu identyfikację i blokowanie większej liczby zadań związanych z cyberbezpieczeństwem”.

Rozpoczęliśmy również opracowywanie wspólnego frameworku – we współpracy z Amazonem, Microsoftem, Google i innymi partnerami Glasswing – do oceny powagi ataków typu jailbreak oraz sposobu, w jaki deweloperzy AI powinni na nie reagować. Zapraszamy innych partnerów z branży i dostawców modeli do dołączenia do nas w tym wysiłku

– podała firma.

Pod koniec postu dodano, że współpraca z rządem USA w zakresie testowania modeli i mechanizmów zabezpieczeń jest coraz większa.

Będzie to obejmować dostęp przedpremierowy do modeli i zabezpieczeń w celu oceny, dzielenie się informacjami na temat jailbreaków i nadużyć oraz dedykowane zasoby na wspólne badania

– podsumowano.

Jailbreak to próba oszukania systemu AI, żeby zrobił coś, czego normalnie nie powinien (np. ominął zasady, filtry bezpieczeństwa lub instrukcje systemowe).


Śledź CrypS. w Google News. Czytaj najważniejsze wiadomości bezpośrednio w Google! Obserwuj ->

Zajrzyj na nasz telegram i dołącz do Crypto. Society. Dołącz ->