Bedoes, Tede i Behemoth wykorzystani do trenowania AI? Nowe narzędzie ujawnia szczegóły

24 czerwca 2026 08:03

Serwis The Atlantic stworzył narzędzie o nazwie “AI Watchdog”, które pozwala użytkownikom wyszukiwać utwory, jakie znalazły się w ogólnodostępnych bazach treningowych dla modeli AI. W gigantycznych zbiorach znajdziemy też polskich twórców.

Według narzędzia AI Watchdog stworzonego przez The Atlantic, w publicznych bazach danych do treningu modeli genAI znalazły się utwory polskich twórców, takich jak O.S.T.R, Quebonafide, Behemoth czy Dawid Podsiadło.
AI zastępująca człowieka może być jedynie przyspieszeniem trwającego od wielu lat internetowego trendu.

Polscy twórcy w bazie treningowej dla modeli genAI

AI Watchdog to baza danych stworzona przez The Atlantic, pozwalająca sprawdzić, czy konkretne książki, filmy, scenariusze czy utwory muzyczne pojawiały się w znanych zbiorach danych, używanych do trenowania modeli generatywnej AI (przy czym trening to nie „kopiowanie” utworu, lecz wychwytywanie występujących w nim zależności statystycznych).

Z technicznego punktu widzenia to raczej projekt z szufladki OSINT (Open-Source-Intelligence): dziennikarze wyszukują publicznie dostępne bazy danych treningowych, a następnie katalogują znalezione w nich treści, na koniec obudowując wszystko interfejsem GUI tak, by użytkownik mógł samodzielnie przeczesywać bazę.

Datasety firm oferujących dostęp do płatnych modeli są jednak w dużej mierze chronione i mimo tego, że narzędzie The Atlantic pozwala potwierdzić, że dany utwór znajdował się w publicznej bazie, nie dowodzi to tego, że dana firma faktycznie z tego utworu skorzystała. I odwrotnie – brak utworu wcale nie oznacza, że nigdy nie został on wykorzystany do szkolenia maszyn.

Jak się okazuje, w bazach znajdują się setki utworów polskich twórców.

To m.in. 416 utworów łódzkiego rapera Ostrego, 414 utworów od Tede, 312 od Quebonafide i 278 od Bedoesa. W gronie “wyróżnionych” znaleźli się też Dawid Podsiadło (206), Sanah (127) czy gdański zespół death metalowy Behemoth (224).

Badane przez The Atlantic datasety zawierają także ściągnięte z platformy YouTube filmy twórców takich jak MaturaToBzdura, Krzysztof Gonciarz czy Abstrachuje TV.

AI jest nie początkiem, lecz kontynuacją pewnego trendu

Obok popularnych ksywek, w bazach znajdziemy też bardziej niszowych wykonawców, a cała sprawa stała się pretekstem, by internet po raz kolejny ostrzegał przed wyparciem twórców przez sztuczną inteligencję, co – mimo protestów i narzekań – wydaje się nieuniknione.

Jednak w rzeczywistości AI może, w pierwszej kolejności, zagrażać nie twórcom jako takim, ale konkretnemu gatunkowi twórców głównego nurtu.

Generatywna AI nie tyle stworzyła bowiem ryzyko komodytyzacji treści ex nihilo, ile jest właściwie drastycznym przyspieszeniem istniejącego od lat, stworzonego przez algorytmy Google’a, trendu masowej publikacji „contentu”.

Systemy wyszukiwarki Google’a, YouTube’a czy Spotify przez lata kładły fundamenty systemu, który promuje uśrednienie i ujednolicenie treści pod masowego odbiorcę.

Apogeum tego zjawiska stanowiły chińskie farmy treści czy choćby Mr. Beast, który swego czasu wykorzystał analizę statystyczną danych na platformie YouTube, by zalewać sieć składanymi na linii montażowej filmami, zbudowanymi tak, aby “hakować” ludzki układ nagrody, utrzymując uwagę widza jak najdłużej.

Podobnie stało się m.in. z muzyką popularną, gdzie podkłady, dla zwiększenia mocy przerobowej, bardzo często błyskawicznie skleja się z gotowych sampli pobieranych z serwisów takich jak Splice, a nad utworami pracują całe sztaby ludzi, próbując dopasować je do rynkowej średniej.

Cały ekosystem działał w pętli sprzężenia zwrotnego.

Odbiorca otrzymywał przewidywalny produkt przygotowany „pod algorytm”.

Jego gigantyczna podaż sprawiła, że przyzwyczaił się do niego i oczekiwał podobnych produktów w przyszłości, co z kolei wymusiło na innych twórcach zastosowanie tego samego schematu (dziś, youtubowe „triki” Mr. Beasta są branżowym standardem na całym świecie).

Produkcja treści była algorytmiczna w swojej naturze już wcześniej, ale póki internetowa Ekonomia Uwagi pozwalała na prowadzenie lukratywnych biznesów – protestów w mainstreamie nie było.

Wybuchły dopiero teraz, gdy z generowaniem powtarzalnych treści AI zaczyna radzić sobie zwyczajnie lepiej niż człowiek.

Śledź CrypS. w Google News. Czytaj najważniejsze wiadomości bezpośrednio w Google! Obserwuj ->

Zajrzyj na nasz telegram i dołącz do Crypto. Society. Dołącz ->