Doroczna konferencja Google I/O została zdominowana przez sztuczną inteligencję. Gigant zaprezentował na niej nowy model Gemini 3.5, który ma zmniejszyć dystans wobec konkurentów z OpenAI i Anthropic.
- Gwoździem programu była premiera Gemini 3.5 Flash – modelu, który według Google’a przebija własną wersję Pro w benchmarkach kodowania.
- Cięższy wariant 3.5 Pro pojawi się dopiero w przyszłym miesiącu.
- Google ogłosił też Gemini Omni, generator wideo łączący tekst, obraz i dźwięk oraz osobistego agenta AI Gemini Spark.
Google wypuszcza trzy nowe modele AI
Pierwszą nowością jest model Gemini 3.5 Flash, który – według deklaracji firmy – przebija własną poprzednią wersję 3.1 Pro w benchmarkach kodowania oraz zadań agentowych.
To wariant lekki, zoptymalizowany pod kątem szybkości generowania treści i ceny, przy czym cięższy Gemini 3.5 Pro przechodzi obecnie testy zamknięte i ma trafić do szerokiej dystrybucji w czerwcu.
Nowy Flash jest już dostępny w aplikacji Gemini, wyszukiwarce Google, deweloperskim środowisku Google’a Antigravity 2.0 oraz przez publiczne API.
Drugim głośnym produktem jest Gemini Omni, opisywany przez twórców jako „model świata” łączący rozumowanie z generowaniem treści.
Omni przyjmuje na wejściu tekst, obrazy, dźwięk i wideo, a na wyjściu produkuje materiały filmowe osadzone w wiedzy o rzeczywistym świecie, które następnie można dodatkowo edytować poleceniami w języku naturalnym.
Kanał Theoretically Media w skrócie określił Omni „modelem Nano Banana dla materiałów wideo” – może on dodawać do istniejącego nagrania nowe obiekty i postaci czy modyfikować przebieg wydarzeń.
Trzeba jednak zauważyć, że generowane przez Omni materiały, które można znaleźć w internecie, raczej nie wyglądają na coś, co byłoby w stanie zagrozić dominującym aktualnie modelom, jak Seedance 2.0.
Klipom brakuje nieco naturalności (co najbardziej daje o sobie znać w warstwie audio) i koniec końców ich estetyka kojarzy się ze znienawidzonym w internecie „AI Slop”.
Nowy model trafi do subskrybentów planów AI Plus, Pro i Ultra w aplikacji Gemini, w narzędziu Google Flow oraz w YouTube Shorts.
Trzecia wielka premiera dotyczyła Gemini Spark – osobistego agenta AI, który potrafi rozumować, wykorzystując dane z połączonych z nim aplikacji i podejmować działania w imieniu użytkownika – od porządkowania kalendarza, przez wyszukiwanie informacji w skrzynce pocztowej, po zarządzanie listami zadań.
W przyszłym tygodniu agent wystartuje w wersji beta – początkowo będzie dostępny dla wybranych testerów oraz amerykańskich abonentów planu Google AI Ultra.
Konferencja przyniosła też istotne zmiany w polityce subskrypcyjnej.
Plan Google AI Ultra startuje teraz od 100 dolarów miesięcznie, oferując pięciokrotnie wyższe limity niż AI Pro.
Poprzedni pakiet 250-dolarowy obniżono jednocześnie do 200 dolarów, przy zachowaniu tych samych funkcji co przed obniżką.
Zmieni się także model liczenia zużycia modeli – dotychczasowy dzienny limit promptów ustępuje miejsca modelowi, w którym znaczenie mają złożoność zapytania, używane funkcje oraz długość rozmowy.
Limity odświeżają się co pięć godzin, aż do osiągnięcia tygodniowego pułapu.
Na końcu konferencji Google poświęcił miejsce na promocję okularów Android XR, które trafią na rynek jesienią.
Wbudowany w nie model Gemini ma rozpoznawać obiekty i ludzi w polu widzenia użytkownika, edytując obraz w czasie rzeczywistym.
Śledź CrypS. w Google News. Czytaj najważniejsze wiadomości bezpośrednio w Google! Obserwuj ->
Zajrzyj na nasz telegram i dołącz do Crypto. Society. Dołącz ->
