Zbadali polskiego Facebooka i idą na wojnę z toksycznymi komentarzami

Ruszyła kampania społeczna #bezhejtu, której celem jest wyeliminowanie mowy nienawiści z polskiego internetu zdominowanego przez toksyczne komentarze. W ramach inicjatywy przygotowano raport analizujący poziom hejtu na jednej z wiodących w Polsce platform społecznościowych. Wyniki tego badania zaskakują, ale dzięki wykorzystaniu sztucznej inteligencji możliwe będzie aktywne zwalczanie przejawów cyfrowej agresji.

Gotowy jest długo oczekiwany przez społeczeństwo raport na temat skali mowy nienawiści w polskim internecie. Analiza inicjuje kampanię społeczną pod hasłem #bezhejtu, skierowaną do wszystkich osób i podmiotów funkcjonujących w kanałach cyfrowej rzeczywistości, ze szczególnym naciskiem na social media. Zdaniem autorów raportu, jego wyniki będą przydatne dla skutecznej identyfikacji, bieżącego monitorowania oraz eliminacji nienawistnych zachowań z wirtualnej przestrzeni.

Stop hate speech

Pomysłodawcami kampanii #bezhejtu są twórcy aplikacji TrollWall AI, opierającej się na sztucznej inteligencji, która z powodzeniem pozwoliła na znaczące ograniczenie mowy nienawiści w czeskim i słowackim internecie. W Polsce aplikacja jest dostępna od początku roku.

– Definiujemy hejt w oparciu o międzynarodową definicję mowy nienawiści, czyli angielskiego wyrażenia hate speech. To napastliwe wypowiedzi wobec osoby lub grupy osób na podstawie ich tożsamości, cech charakterystycznych czy przynależności rasowej, wyznania lub orientacji seksualnej. Do tego wulgaryzmy i toksyczny język, czyli to, co w rozwiniętym społeczeństwie nie jest uważane za przyzwoite. Hejt to jednak nie krytyka ani przeciwna opinia, o ile nie jest wroga i wyrażona w przyzwoitych słowach oraz kulturalnej formie – tłumaczy Tomáš Halász, pionier w dziedzinie moderowania dyskusji w środkowoeuropejskich mediach społecznościowych i twórca aplikacji TrollWall AI.

Zgodnie z danymi opublikowanymi w raporcie Digital 2024: Poland opracowanym przez Meltwater, aż 28 mln Polaków korzysta z mediów społecznościowych, z kolei w raporcie CBS co drugi badany (50%) twierdzi, że w polskim społeczeństwie istnieje przyzwolenie na obrażanie innych. W ramach inicjatywy #bezhejtu przy pomocy narzędzia TrollWall AI sprawdzono, ile nienawiści można znaleźć, przeglądając polskiego Facebooka. Na przestrzeni miesiąca przeanalizowano ponad 5,5 mln komentarzy dostępnych na ponad 500 tys. publicznych profilach facebookowych działających w naszym kraju.

Ciemna strona internetu

Do przeprowadzenia analizy wykorzystano komentarze opublikowane na 503 profilach facebookowych, poruszających tematy związane z niemal wszystkimi dziedzinami życia – uwzględniono takie kategorie jak media, polityka, sport, styl życia, showbiznes, ale także kanały organizacji samorządowych, rządowych, pozarządowych, lokalnych czy kościelnych. Raport uwzględnia komentarze widoczne na danej stronie dla zwykłego użytkownika, bez tak zwanych dark postów.

Z podsumowania wynika, że podczas zbierania danych od 26 kwietnia do 25 maja 2024 roku, aż 852 478 z 5 450 213, czyli 15,64% wszystkich komentarzy na polskim Facebooku było wulgarnych lub nosiło znamiona mowy nienawiści. Analitycy jasno wskazali, że najwięcej hejterskich komentarzy publikowanych jest na profilach polityków i partii politycznych, przy czym najczęściej toksyczne wpisy pojawiają się w porze nocnej.

Raport odpowiada także na pytanie, dlaczego hejt w polskim cyberprzestrzeni jest problemem. Po pierwsze w internecie hejt widać bardziej – mimo że w realnym życiu opinie większości społeczeństwa nie są tak skrajne i radykalne, to nienawistne komentarze najczęściej pochodzą od osób zdenerwowanych i zaangażowanych emocjonalnie w daną sprawę. W efekcie użytkownicy mający regularną styczność z tego rodzaju wpisami mogą być bardziej nerwowi, niespokojni i zestresowani. Po drugie, Polacy doświadczają w krajowym internecie niespotykanej polaryzacji, która nasila nienawistne zachowania i negatywnie wpływa na środowisko online. Po trzecie w cyfrowej przestrzeni czujemy się anonimowi, co sprzyja podejmowaniu bardziej ryzykownych działań wychodzących poza przyjęte normy. Wreszcie, po czwarte, stale przesuwają się normy społeczne związane z przechodzeniem interakcji ze świata rzeczywistego do wirtualnego i ilością czasu, jaki jest w sferze online poświęcany na konkretne zachowania.

Eskalacja mowy nienawiści

Wyniki nie są niestety dla naszego kraju optymistyczne również na tle Europy, ponieważ raport odnotowuje wyższy wskaźnik hejtu w porównaniu do wcześniej analizowanych tego typu obszarów internetowych w Czechach czy na Słowacji, gdzie dane mówiły o około 13% toksycznych komentarzy spośród wszystkich wpisów publikowanych w mainstreamowych kanałach.

Polscy internauci mają trudność z prowadzeniem merytorycznych i kulturalnych dyskusji, a w najbardziej newralgicznych konwersacjach średni odsetek ataków słownych sięga blisko 30%. Napastliwe treści zwykle nie odnoszą się do meritum danej sprawy, a do granic możliwości rozbudowują wątki poboczne. Różnice zdań między osobami o różnych poglądach czy upodobaniach bywają tak głębokie, że często prowadzą do dalszej eskalacji mowy nienawiści.

– W obliczu rosnącej fali nienawiści w mediach społecznościowych, inicjatywa #bezhejtu staje się pilniejsza niż kiedykolwiek. Projekt ma na celu uświadamianie użytkownikom internetu, jak szkodliwe mogą być obraźliwe komentarze i wpisy. Pokazujemy skalę problemu i zachęcamy do refleksji nad zachowaniami w Internecie. Kampania apeluje do wszystkich, aby zrezygnowali z bezpodstawnej nienawiści na rzecz bardziej konstruktywnej i życzliwej komunikacji, promując tym samym zdrowsze i bardziej przyjazne środowisko online – podkreśla Tomáš Halász.

Jedyna skuteczna broń

Oparta o sztuczną inteligencję aplikacja TrollWall AI rozumie i klasyfikuje teksty lub ikony emoji używane w komentarzach, biorąc jednocześnie pod uwagę kontekst analizowanej treści i definiuje wpis jako hejt, jeśli posiada on co najmniej jedną z cech charakterystycznych – jest dyskryminujący, atakujący, wulgarny, obraźliwy, zawiera groźby lub podżega do nienawiści. Hejtem nie będzie więc szeroko rozumiana krytyka dotycząca tego, że komuś nie smakowało jakieś danie, nie spodobał się film lub jest mu przykro z powodu porażki ulubionej drużyny.

Sztuczna inteligencja automatycznie ukrywa wulgarne, agresywne i nienawistne komentarze oraz groźby, które dla innych użytkowników stają się niewidoczne. Narzędzie w efekcie podnosi poziom dyskusji, do której dołączają uprzejmi internauci. Na kanałach włączonych w projekt monitoringowy w Czechach i Słowacji, poziom hejtu spadł z 13% do zaledwie 2%, co świadczy o efektywności zastosowanych rozwiązań cyfrowych.

W realną walkę z hejtem może się zaangażować każda organizacja, instytucja, przedsiębiorstwo, firma czy spółka identyfikująca się z dążeniem do ograniczania mowy nienawiści w sieci. Pełen raport analizujący poziom hejtu na polskim Facebooku dostępny jest pod linkiem: https://bezhejtu.pl/media/Documents/analyza_BEZHEJTU_pl2024q2.pdf