Niebezpieczne treści od AI? Polacy wiedzą, jak je zatrzymać

AI robot

Trwa wojna hybrydowa, a głównym orężem w niej są cyberprzestępczość i dezinformacja. Dziś coraz trudniej odróżnić deepfake od prawdy, a sztuczna inteligencja tworzy od groma szkodliwych treści. Jak się przed tym bronić? Polacy znaleźli na to rozwiązanie. 


  • Badacze z firmy NASK opracowali model o nazwie HerBERT-PL-Guard, który ma chronić nas przed szkodliwymi treściami, jakie AI generuje w języku polskim.
  • Jest to szczególnie ważne w dobie potęgowanej dezinformacji, która jest wykorzystywana w różnych konfliktach.

Polacy stworzyli system zwalczający dezinformację ze strony AI

Dezinformacja, prezentowana na wiele różnych sposobów, od generowanych przez sztuczną inteligencję fałszywych newsów po deepfake’i, które ciężko odróżnić od prawdziwych zdjęć lub nagrań wideo, to oręż rosyjskich służb, które posiadają swoich agentów w wielu miejscach, aby podsycać niepokoje społeczne, tworzyć wewnętrzne podziały i wywoływać chaos.

Wszystko to wpisuje w schemat wojny hybrydowej, która już teraz trwa w Europie i nie ominęła naszego kraju. 

Ale to nie jedyne zagrożenie wynikające ze złego wykorzystania technologii AI. Nierzadko bywa i tak, że chatboty podsuwają nam naprawdę złe pomysły, których realizacja może się dla nas tragicznie skończyć.

Polski projekt NASK opracował więc specjalny model językowy – HerBERT-PL-Guard – który ma za zadanie wyłapywać niebezpieczne treści, które są tworzone w języku polskim. 

Jednym z największych wyzwań współczesnego AI jest luka językowa. Chodzi o to, że większość systemów bezpieczeństwa AI jest projektowana głównie dla języka angielskiego. To oznacza, że użytkownicy mówiący w innych językach mogą być mniej chronieni. Co za tym idzie, ten sam model AI może być bezpieczny w języku angielskim, ale generować niebezpieczne treści w innych językach

– ostrzega Wojciech Kusa, kierownik Zakładu Inżynierii Lingwistycznej i Analizy Tekstu działającego w strukturach Ośrodka Badań nad Bezpieczeństwem Sztucznej Inteligencji NASK. 

Jak ma działać wspomniany model? NASK wyjaśnia na swoim blogu, że HerBERT-PL-Guard poza doskonałym zrozumieniem polskiej mowy jest również doskonale przygotowany do wyłapywania wszystkich sztuczek, które mają na celu oszukanie systemów bezpieczeństwa.

Badacze jako przykłady podali tutaj zamianę liter w danych wyrazach lub „subtelne przekształcenia składni”, dzięki czemu szkodliwe treści mają przejść przez zabezpieczenia.


Śledź CrypS. w Google News. Czytaj najważniejsze wiadomości bezpośrednio w Google! Obserwuj ->

Zajrzyj na nasz telegram i dołącz do Crypto. Society. Dołącz ->