Algorytm wykryje fake newsy


logoDGP

Wprowadzają w błąd, sieją zamęt, wywołują emocje – jest coraz więcej fałszywych informacji w przestrzeni internetu. Polscy naukowcy chcą to zjawisko zatrzymać. Autorem projektu przeciwdziałania dezinformacji poprzez ocenę wiarygodności źródeł internetowych jest dr Piotr Przybyła z Instytutu Podstaw Informatyki PAN

Młody, ambitny naukowiec dostaje propozycje współpracy z zagraniczną uczelnią, w pana przypadku cenioną jednostką naukową. Czy na tamtym etapie zawodowym to była szansa, której nie można było zmarnować?

Niestety to rzadko się zdarza, by taki młody naukowiec zaraz po doktoracie rzeczywiście dostał taką propozycję. W praktyce to wygląda tak, że trzeba samemu aktywnie poszukiwać. Obroniłem doktorat w Instytucie Podstaw Informatyki PAN i uznałem, że kontynuowanie pracy za granicą będzie naturalnym kolejnym krokiem. Taka jest dobra praktyka w międzynarodowym środowisku naukowym: ludzie po ukończeniu doktoratu podejmują staże podoktorskie w cenionych ośrodkach. Dzięki temu mają możliwość zdobycia nowych doświadczeń, zobaczenia, jak wyglądają badania w innej tematyce, poznania nowych metod badawczych. Tak zdobywa się też kontakty z innymi młodymi badaczami, a to potem procentuje. Jest to jednak coś, co wymaga wiele wysiłku, bo znalezienie odpowiedniego miejsca wcale nie jest łatwe.

Algorytm wykryje fake newsy


logoDGP

Wprowadzają w błąd, sieją zamęt, wywołują emocje – jest coraz więcej fałszywych informacji w przestrzeni internetu. Polscy naukowcy chcą to zjawisko zatrzymać. Autorem projektu przeciwdziałania dezinformacji poprzez ocenę wiarygodności źródeł internetowych jest dr Piotr Przybyła z Instytutu Podstaw Informatyki PAN

Młody, ambitny naukowiec dostaje propozycje współpracy z zagraniczną uczelnią, w pana przypadku cenioną jednostką naukową. Czy na tamtym etapie zawodowym to była szansa, której nie można było zmarnować?

Niestety to rzadko się zdarza, by taki młody naukowiec zaraz po doktoracie rzeczywiście dostał taką propozycję. W praktyce to wygląda tak, że trzeba samemu aktywnie poszukiwać. Obroniłem doktorat w Instytucie Podstaw Informatyki PAN i uznałem, że kontynuowanie pracy za granicą będzie naturalnym kolejnym krokiem. Taka jest dobra praktyka w międzynarodowym środowisku naukowym: ludzie po ukończeniu doktoratu podejmują staże podoktorskie w cenionych ośrodkach. Dzięki temu mają możliwość zdobycia nowych doświadczeń, zobaczenia, jak wyglądają badania w innej tematyce, poznania nowych metod badawczych. Tak zdobywa się też kontakty z innymi młodymi badaczami, a to potem procentuje. Jest to jednak coś, co wymaga wiele wysiłku, bo znalezienie odpowiedniego miejsca wcale nie jest łatwe.

Dlaczego?

Doktorat broniłem w IPI PAN, który jest w zasadzie wiodące w mojej dziedzinie i niejako z konieczności mocniejszych jednostek musiałem szukać za granicą. Zdecydowałem się na Uniwersytet w Manchesterze. Regułą jest, że na takie staże zgłasza się wiele osób, konkurencja jest bardzo duża, poziom kandydatów wysoki. Ja miałem wiele szczęścia, bo dostałem propozycję od pierwszej uczelni, na którą się zgłosiłem.

Przenieśmy się o kilka lat w pańskim zawodowym życiorysie. Wrócił pan do Polski razem ze swoim projektem. Skąd taka decyzja, aby to na rodzimej uczelni prowadzić badania?

Już wyjeżdżając, planowałem, że ten staż będzie okresem zdobywania jakichś doświadczeń, po którym wrócę do Polski. Na Uniwersytecie w Manchesterze spędziłem trzy i pół roku. Doszedłem do wniosku, że pora coś zmienić. Alternatywa była taka: albo szukam kolejnego zagranicznego stażu, albo szukam sposobu na powrót do Polski. Wybrałem powrót. Natomiast nie było to łatwe do zorganizowania ze względu na to, że trudno jest się ubiegać o grant, nie będąc zatrudnionym w miejscu, w którym się będzie ten projekt realizowało.

Był pan jakby w naukowym zawieszeniu. Co zmieniło sytuację?

Bardzo pomocne były programy powrotowe: zarówno Homing Fundacji na Rzecz Nauki Polskiej, jak i grant Polskie Powroty Narodowej Agencji Wymiany Akademickiej. Jego ramy finansowo-organizacyjne działają przy wsparciu tej jednostki, do której się wraca, dlatego można stosunkowo łatwo je zrealizować. Wyglądało to w ten sposób, że zaproponowałem konkretny program badawczy, który mógłbym wdrożyć po powrocie. Oczywiście dostałem ogromne wsparcie od mojego instytutu. Poszczęściło mi się w procesie, dostałem grant i jestem, działam!

Ta naukowa przeprowadzka z kraju do kraju przebiegła bezproblemowo?

Sama przeprowadzka jest faktycznie dość łatwa. Jest kilka elementów, które są trudne ze względu na zmianę kraju. Dzięki temu, jak skonstruowane są takie programy, nie ma tego szoku finansowego, który normalnie by dochodził, ponieważ fundusze są na porównywalnym poziomie z tym za granicą. Dodatkowo była opłacana relokacja.

Wrócił pan do Instytutu Podstaw Informatyki PAN. Z jakim projektem rozpoczął pan ten nowy rozdział współpracy?

Moje badania mieszczą się w przetwarzaniu języka naturalnego, który jest zbiorem problemów sztucznej inteligencji, dotyczących języków, jak np. polski i angielski Dotyczy to budowy algorytmów i modeli, które są w stanie taki język rozumieć, przetwarzać, przeszukiwać i generować. To są ogólne ramy, w których poruszam się od początku doktoryzacji. Zmieniałem trochę dziedziny w trakcie doktoratu, zajmowałem się językiem polskim (ogólnym) i angielskim, gdy pracowałem w Manchesterze. Tam interesowały mnie w zastosowaniach biomedycznych. Obecnie wciąż zajmuję się językiem angielskim, ale dotyczącym mediów. Projekt, który zaproponowałem i właśnie realizuję, dotyczy przeciwdziałania dezinformacji poprzez ocenę wiarygodności źródeł internetowych.

Czyli zajmuje się pan fake newsami. To zagadnienie w ostatnich latach zrobiło zawrotną karierę. Jak komputer może rozpoznać, że tekst jest niewiarygodny?

To jest pytanie za milion dolarów. Współcześnie w sztucznej inteligencji króluje paradygmat uczenia maszynowego, co oznacza, że komputery wszystkiego lub prawie wszystkiego uczą się od ludzi. W związku z tym zasada główna polega na tym, że przygotowujemy pewien zbiór tekstów, dla których mamy oceny eksperckie, np. medioznawców. To one oceniają, czy dany tekst jest wiarygodny. Dysponując takim korpusem – to są oczywiście duże zbiory, ja pracowałem na 100 tys. dokumentów – możemy używać jednego z algorytmów nauczania maszynowego, aby wychwycić pewne cechy łączące elementy wiarygodne i niewiarygodne.

Wystarczy algorytm?

Jest kilka podejść i kilka możliwych sposobów reprezentacji tej wiarygodności. Test algorytmów skupia się na weryfikowaniu treści: czy to, co jest powiedziane w danym tekście, jest prawdziwe? To jest tak zwane „fact check”, tutaj próbujemy symulować działanie ludzi, którzy profesjonalnie się tym zajmują. Natomiast w swoim projekcie skupiłem się bardziej na ocenie stylistycznej. Wynika to z faktu, że kiedy patrzymy na taki tekst typu fake news, to nie musimy koniecznie szczegółowo sprawdzać faktów! Już na pierwszy rzut oka styl, w jakim jest on napisany, nam to sugeruje. Możemy patrzeć na takie rzeczy jak np. liczba wyrażeń emocjonalnych, użytych wielkich liter, struktura zdań, liczba słów długich i krótkich. Wszystkie tego rodzaju, powierzchniowe, drobne cechy wpływają na ogólne wrażenie. To jedna z metod, ale myślę, że jeszcze wiele, wiele badań przed nami. Współczesne metody osiągają wydajność rzędu 80–90 proc., podczas gdy wyszkolony człowiek potrafi ocenić wiarygodność tekstu z dużo wyższą wydajnością.

Jednak główny cel jest taki, aby to właśnie techniki informacyjne okiełznały tego „smoka”, jakim jest dezinformacja krążąca po sieci?

To będzie działanie ręka w rękę przez ludzi i przez komputery. Wiąże się to z tym, że nawet mając idealny algorytm, który potrafi ocenić, czy dana treść jest wiarygodna, i tak nigdy byśmy się nie zgodzili na to, aby istniał automatyczny system tego typu zabraniający nam publikowania treści. To byłoby naruszenie wolności słowa. Dlatego oprócz pracy nad algorytmami bardzo istotna jest praca nad tym, jak budować odpowiednią współpracę z użytkownikiem, w jaki sposób zachęcać ludzi, żeby sprawdzali informacje, które publikują lub udostępniają. Nigdy nie będzie automatycznego rozwiązania.

W Indiach do szkół wprowadzono lekcje, na których dzieci uczą się odróżniać te treści, wyłapywać je. Może tędy powinniśmy pójść: zamiast uczyć najmłodszych obsługi komputera, którym w wieku szkolnym już świetnie operują, nauczyć je poruszania się po wirtualnym świecie?

Zdecydowanie tak jest. Są już badania, które pokazują, że nie potrzeba do tego nawet wieloletniej edukacji. Jeżeli w ramach pewnego krótkiego eksperymentu uczulimy ludzi na pewne charakterystyczne cechy niewiarygodnych treści, pokażemy, jak je rozpoznawać, to oni już tego samego dnia są w stanie z większą wydajnością odróżniać takie newsy. Nie ma ucieczki od edukacji, od szerokiego rozpropagowania wiarygodnych informacji, od uczenia się rozpoznawania drobnych sygnałów, od weryfikowania wiarygodności źródeł. Jednak w tym wszystkim technologia może być pomocna.

Czy to jest dobry moment dla polskich naukowców, aby wrócić do Polski i tu ze swoją międzynarodową grupą badawczą realizowali projekty, które rozpoczęli za granicą lub które tam chcieli zrobić?

Według mnie tak. O ile widać wiele różnic między społeczeństwami, o tyle sposób pracy polskich i zagranicznych jednostek naukowych jest zbliżony. Myślę, że spokojnie można sobie wyobrazić, że projekty, które realizowałem w Manchesterze, mogłyby dziać się w Polsce. Chyba najistotniejszą z różnic w pracy akademickiej jest skala istnienia projektu, tego, jak wiele zagranicznych jednostek jest zaangażowanych w jedno przedsięwzięcie. Z mojego doświadczenia wynika, że projekty realizowane w Anglii to były często badania łączące kilka lub nawet kilkanaście jednostek naukowych z całej Europy. W Polsce rzadko się spotyka tego typu współpracę. Tak naprawdę nie ma powodu, dla którego miałoby tak nie być. Moment jest niezły, nasze jednostki naukowe, jeśli chodzi o formy rozliczania czy funkcjonowania, nie różnią się wcale tak bardzo od tego, co mamy w Europie Zachodniej.

Dziennik Gazeta Prawna; Partner: Narodowa Agencja Wymiany Akademickiej

Źródło: Dziennik Gazeta Prawna; 06.11.2020


© 2021 INSTYTUT PODSTAW INFORMATYKI PAN | Polityka prywatności | Deklaracja dostępności