Anthropic wprowadził na rynek Claude Sonnet 5. Model jest dostępny w cenie 2 USD za milion tokenów wejściowych i 10 USD za milion tokenów wyjściowych. To ceny obowiązujące do 31 sierpnia. Potem koszt wzrośnie do odpowiednio: 3 USD i 15 USD. Sonnet 5 ma spróbować dorównać modelowi Opus 4.8.
- Anthropic wprowadza na rynek nowy model AI, Sonnet 5, który ma być najbardziej efektywną wersją tej linii i zbliżać się wydajnością do modelu Opus 4.8, ale w niższej cenie.
- Dostęp do modelu kosztuje 2 USD za 1 mln tokenów wejściowych i 10 USD za wyjściowe (promocyjnie do 31 sierpnia), potem wzrośnie do 3 USD i 15 USD; model jest też dostępny w planach Free, Pro, Team i Enterprise.
- Sonnet 5 osiąga wysokie wyniki w benchmarkach (m.in. SWE-bench i GDPval-AA), a firma równolegle rozwija systemy ochrony przed jailbreakami, czyli próbami obejścia zabezpieczeń modeli AI.
Anthropic oferuje Sonnet 5
Anthropic wypuścił we wtorek Claude Sonnet 5, określając go jako „najbardziej efektywny model Sonnet jaki dotąd wyszedł”.
Jest to domyślny model AI dla użytkowników pakietów Free i Pro, dostępny w planach Max, Team i Enterprise, w Claude Code oraz za pośrednictwem API.
W przeciwieństwie do poprzednich modeli Sonnet, ten ma dorównywać poprzedniemu modelowi Opus, a nie ustępować mu o jeden poziom.
Jak twierdzi firma, Sonnet 5 jest „zbliżony do Opus 4.8, ale dostępny w niższej cenie”.
Warto spojrzeć na wyniki: w teście SWE-bench Pro Sonnet 5 osiągnął 63,2%, w porównaniu z 58,1%, jakie osiągał Sonnet 4.6.
W GDPval-AA v2, benchmarku sztucznej analizy, który ocenia rzeczywiste zadania wykonywane w 44 zawodach, Sonnet uzyskał wynik 1618, co stanowi remis z 1616 w Opus 4.8.
Różnice między Sonnet 5 a Opus 4.8 w Humanity’s Last Exam są zasadniczo pomijalne: 57,4% w porównaniu z 57,9%.
Koszt? Model jest dostępny w cenie 2 USD za milion tokenów wejściowych i 10 USD za milion tokenów wyjściowych, ale tylko do 31 sierpnia. Potem koszt wzrośnie do odpowiednio: 3 USD i 15 USD.
Co z Fable 5?
Warto dodać, że na rynku pojawi się też wycofany Claude Fable 5.
To owoc „serii produktywnych rozmów z rządem USA”. Model pojawi się jednak z „nowym zestawem klasyfikatorów, które mają na celu identyfikację i blokowanie większej liczby zadań związanych z cyberbezpieczeństwem”.
Rozpoczęliśmy również opracowywanie wspólnego frameworku – we współpracy z Amazonem, Microsoftem, Google i innymi partnerami Glasswing – do oceny powagi ataków typu jailbreak oraz sposobu, w jaki deweloperzy AI powinni na nie reagować. Zapraszamy innych partnerów z branży i dostawców modeli do dołączenia do nas w tym wysiłku
– podała firma.
Pod koniec postu dodano, że współpraca z rządem USA w zakresie testowania modeli i mechanizmów zabezpieczeń jest coraz większa.
Będzie to obejmować dostęp przedpremierowy do modeli i zabezpieczeń w celu oceny, dzielenie się informacjami na temat jailbreaków i nadużyć oraz dedykowane zasoby na wspólne badania
– podsumowano.
Jailbreak to próba oszukania systemu AI, żeby zrobił coś, czego normalnie nie powinien (np. ominął zasady, filtry bezpieczeństwa lub instrukcje systemowe).
Śledź CrypS. w Google News. Czytaj najważniejsze wiadomości bezpośrednio w Google! Obserwuj ->
Zajrzyj na nasz telegram i dołącz do Crypto. Society. Dołącz ->