Google stworzyło nowy typ AI. DiffusionGemma już dostępne za darmo

AI

Google DeepMind 10 czerwca zaprezentowało nowy model generowania tekstu o nazwie DiffusionGemma. To rozwiązanie różni się od wcześniejszych modeli tym, że nie tworzy tekstu słowo po słowie, lecz generuje całe fragmenty jednocześnie. Dzięki temu proces powstawania nowego contentu jest znacznie szybszy i bardziej efektywny.


  • Google twierdzi, że ich model może osiągać prędkość nawet do 1000 tokenów (czyli jednostek tekstu) na sekundę.
  • Nowy model działa po prostu inaczej: wykorzystuje podejście oparte na tzw. dyfuzji.

Google i nowy model AI

Według firmy model może osiągać prędkość nawet do 1000 tokenów (jednostek tekstu) na sekundę.

Jest to możliwe przy użyciu kart graficznych Nvidia.

Testy przeprowadzone przez DeepMind pokazują, że DiffusionGemma działa nawet cztery razy szybciej niż wcześniejsze modele z rodziny Gemma przy podobnych zasobach sprzętowych.

Dodatkowo inne benchmarki wskazują, że przy realizacji bardziej wymagających zadań, takich jak przetwarzanie bardzo długich tekstów, jego wydajność może być nawet dziesięciokrotnie wyższa.

Kluczowa różnica polega na sposobie działania. Tradycyjne modele językowe tworzą tekst krok po kroku, co może powodować opóźnienia przy dłuższych odpowiedziach.

DiffusionGemma wykorzystuje podejście oparte na tzw. dyfuzji, dzięki czemu generuje większe fragmenty tekstu naraz.

W praktyce oznacza to szybsze odpowiedzi i krótsze czekanie na końcowy wynik. Model potrafi też sam poprawiać bardziej skomplikowane formatowanie, np. w dokumentach technicznych czy kodzie.

Nowe rozwiązanie jest szczególnie interesujące dla programistów.

Może być używane przy tworzeniu asystentów do pisania kodu, narzędzi do dokumentacji czy systemów przetwarzających uporządkowane dane.

Zostało zaprojektowane tak, aby działało zarówno na popularnych kartach graficznych Nvidia RTX, jak i w bardziej zaawansowanych systemach serwerowych DGX.

Nowy krok w ewolucji AI

DiffusionGemma to kolejny krok w rozwoju rodziny modeli AI Gemma, która jest rozbudowywana już od ponad roku.

Wcześniejsze wersje były dostosowywane do różnych zastosowań, ale to pierwszy przypadek wykorzystania technologii dyfuzyjnej do generowania tekstu w tej serii.

Choć podobne podejścia były już testowane w laboratoriach badawczych, rzadko trafiały do praktycznego użycia.

Teraz DeepMind wprowadza je do szerzej dostępnego ekosystemu narzędzi, co może przyspieszyć ich realne zastosowanie w firmach i projektach.

Premiera modelu zbiegła się w czasie z wydaniem konkurencyjnego rozwiązania Claude Fable 5 przez firmę Anthropic, które z kolei skupia się na jakości rozumowania i kodowania.

DeepMind wybrało inną strategię – zamiast maksymalnych wyników w testach, stawia na szybkość działania i wydajność.


Śledź CrypS. w Google News. Czytaj najważniejsze wiadomości bezpośrednio w Google! Obserwuj ->

Zajrzyj na nasz telegram i dołącz do Crypto. Society. Dołącz ->