Nieustanna walka o prawa autorów, czyli dlaczego algorytm Google Pirate jest tak ważny

1. Czym jest Google Pirat i za co odpowiada

1.1 Czym jest algorytm „Pirat”?

Algorytm Google Pirate (pol. Pirat) jest swego rodzaju filtrem, który nie dopuszcza do tego, by strony, które otrzymały relatywnie dużą liczbę skarg o rzekome naruszenie praw autorskich, znajdowały się wysoko w wynikach wyszukiwania. W sierpniu 2012 roku Google wprowadził dosyć dużą aktualizację swojego algorytmu, która szybko zyskała nazwę „Pirate”. Spowodowała ona, że witryny, na które Google otrzymał odpowiednio dużo zgłoszeń dot. rzekomego naruszenia praw autorskich, miały obniżoną widoczność w wynikach wyszukiwania oraz praktycznie zerową szansę na pozycjonowanie na wysokich miejscach.

Firma tą aktualizacją postanowiła zredukować duży problem „piractwa” w sieci – czyli po prostu nielegalnego ściągania muzyki, książek, filmów, oprogramowania i innych przejawów działalności twórczej. Z powodu działania algorytmu najbardziej ucierpiały witryny z torrentami i im podobne – ich widoczność w wynikach wyszukiwania mogła spaść nawet o ponad 90%.

Jak to wyglądało wcześniej?

Za pomocą formularza udostępnionego przez Google możemy zgłosić dany adres URL, który według nas łamie prawa autorskie.

Wprowadzenie algorytmu Pirat to zmieniło – widoczność całej witryny, na którą Google otrzymał odpowiednią liczbę zasadnych zgłoszeń, jest już obniżana w rankingach wyszukiwania.
Praktycznie rzecz biorąc, duża część witryn łamiących prawo autorskie znajduje się na tak niskich pozycjach wyników wyszukiwania, że stają się niewidoczne dla przeciętnego internauty, a jakiekolwiek działania SEO, mające za zadanie polepszenie widoczności, są nieskuteczne.

Co więcej, firma z Mountain View ułatwia internautom dostęp do legalnych treści poprzez podawanie np. gdzie możemy obejrzeć film, który nas interesuje:

google watch spiderman

Czemu z indeksu Google nie są usuwane całe witryny np. z torrentami? Firma tłumaczy to tym, że jest to w gruncie rzeczy nieefektywne i może to prowadzić do cenzury również legalnej treści. Nawet na stronach typowo pirackich, często znajdują się tysiące legalnie zamieszczonych tam materiałów, z których korzysta wiele osób. To byłoby już naruszeniem wolności słowa – na co Amerykanie wyjątkowo zwracają uwagę. A dodajmy do tego fakt, że, jak wynika z badań, usunięcie jednej „pirackiej” witryny zwykle powoduje „efekt Hydry” – czyli na miejsce jednej usuniętej, pojawiają się dwie kolejne.

1.2 Zasada działania algorytmu

Dokładna zasada działania algorytmu nie jest znana, ale mamy pewne poszlaki. Z tej wypowiedzi możemy wyczytać, że nie wszystkie witryny są „karane” przez algorytm regularnie – chyba że często dopuszczają się naruszeń. Z innych informacji, którymi podzieliła się firma, możemy także wywnioskować, że algorytm antypiracki zwraca uwagę nie tylko na częstotliwość oraz liczbę zgłoszeń, ale też na liczbę zaindeksowanych stron danej witryny.

Ważna informacja – Google filtruje tym algorytmem cały swój indeks stron.
Ale nawet jeśli „Pirat” złapie daną witrynę na łamaniu praw autorskich i obniży jej widoczność, to jeszcze nie wszystko stracone. Możliwy jest powrót do wcześniejszych pozycji, jeśli łamiący prawo content będzie usunięty, a na koncie strony nie będą ciążyły kolejne przewinienia oraz będzie odpowiednio zoptymalizowana pod kątem SEO.

Warto pamiętać, że samo zgłoszenie oczywiście dowodem na naruszenie praw autorskich jeszcze nie jest. Internetowy gigant po czasie rozpatruje każde takie zgłoszenie – i, jeśli uzna je za zasadne, dopiero zaczyna działać. Co istotne, nie można zgłaszać całej witryny (tj. domen najwyższego poziomu, zakończonych np. .com lub .pl), a jedynie konkretne strony, na których dopatrzyliśmy się złamania praw autorskich. Obecnie tygodniowo ok. 500 rzekomo pirackich witryn (zwykle tych zdobywających największą popularność) ma obniżaną widoczność na skutek działania algorytmu.

Firma chwali się, że podejmuje akcje już po ok. 6 godzinach od złożenia skargi
– czas ten zależy jednak od kilku czynników, takich jak np. język zgłoszenia czy ilość podanych informacji.

Jeśli nie zgadzamy się z oceną, Google dostarcza odpowiednie narzędzia do zgłoszenia roszczenia wzajemnego
– czyli swoistej odpowiedzi na skargę, która ma udowodnić, że dana treść nie narusza praw autorskich i że zgłoszenie drugiej strony było bezzasadne. W razie pozytywnego rozpatrzenia roszczenia wzajemnego usunięte strony powracają do wyników wyszukiwania Google.

Jeśli nasze strony zostały usunięte, warto pomyśleć o roszczeniu wzajemnym, bowiem według badań nawet blisko 30% wszystkich zgłoszeń o naruszenia, jakie dziennie dostaje Google, może być… nieprawidłowych.

Proces usuwania treści łamiących prawa autorskie można przedstawić w następujący sposób:

Jak wygląda proces usuwania w Google treści łamiących prawo autorskie

Jeśli chcesz zgłosić Google żądanie usunięcia treści, możesz to zrobić za pomocą prostego narzędzia, dostępnego pod tym linkiem:

https://support.google.com/legal/troubleshooter/1114905?rd=1

2. Algorytm Google Pirat w liczbach

Od 2012 roku liczba zgłoszeń, które otrzymuje Google, rokrocznie się powiększa. W ciągu całego 2012 roku firma dostała ok. 440 tys. skarg. Cztery lata później, w ciągu tylko jednego dnia (sic!), rozpatrywała już ok. 4,5 razy więcej – 2 miliony. Na poniższej grafice zawarte zostały najważniejsze liczby związane z działaniem algorytmu Pirate:

Algorytm Google Pirate w liczbach

Tutaj warto zaznaczyć, że część z nas kompletnie nie zdaje sobie sprawy z tego, jak dużą liczbą jest miliard. Dosyć popularnym przykładem jest eksperyment myślowy, polegający na prostym liczeniu. Jeśli ktoś zacząłby właśnie w tej chwili liczyć liczby naturalne od 0 do 1 miliona, to zajęłoby mu to ok. 12 dni. Gdyby chciał przedłużyć liczenie do 1 miliarda, to zajęłoby mu to ok. 32… lata.

W kontekście tematu – ponad 4 miliardy zgłoszonych i rozpatrzonych adresów URL to dosyć spora liczba i widać, że firma z Mountain View nie lekceważy zjawiska piractwa.

3. Historia algorytmu Pirate

3.1 Wprowadzenie

Należy przyznać, że algorytm Pirat nie ma długiej historii – został wprowadzony w sierpniu 2012 roku. Przed jego wejściem firma była mocno krytykowana ze względu na pewną bierność w tym temacie.

Pracownicy Google odpierali „ataki” różnych organizacji argumentem, że filtracja treści objętych prawami autorskimi jest bardzo trudna. Na pierwszy rzut oka nie widać bowiem, do kogo prawa do treści należą i kto może się nimi posługiwać. Sierpień 2012 roku przyniósł wspomnianą i wyczekiwaną zmianę od firmy z Mountain View. Według Google, dopiero w tym roku można było wprowadzić taką zmianę – wcześniej po prostu nie było danych, które mogłyby pozwolić na stworzenie skutecznego algorytmu antypirackiego.

Wprowadzona aktualizacja początkowo nazywana była Emanuel (na cześć Ari Emanuela, współwłaściciela jednej z dużych agencji medialnych, który mocno krytykował Google w tym względzie). Szybko jednak nazwa algorytmu została podmieniona na dużo bardziej intuicyjną – Pirate.

Krótko po wprowadzeniu algorytmu, odkryto, że „kary” nie dotyczyły platformy YouTube (która już od 2006 należała do Google). Na firmę z Mountain View spadła fala zarzutów dotyczących tego, że faworyzuje swoje podmioty. Google odparł krytykę argumentując, że podobnie „odporne” na działanie algorytmu Pirate są inne bardzo popularne strony – takie jak choćby Facebook czy Twitter. Firma przyznała, że nie spodziewa się dużych zmian w przypadku witryn opartych głównie na treściach tworzonych przez użytkowników. Może to sugerować, że algorytm zwraca uwagę na wiele różnych czynników, nie tylko na liczbę zgłoszeń, które Google otrzymał na daną witrynę.

3.2 Kolejne aktualizacje

2 lata po wprowadzeniu algorytmu Pirat, Google zdecydował się wdrożyć jego aktualizację (przynajmniej taką, którą ogłosił, bowiem nie każda aktualizacja tego typu jest przez Google oficjalnie ogłaszana). W październiku 2014 roku wypuszczono drugiego „Pirata”, i co ciekawe, znów pewien wpływ na to miał podmiot medialny – w tym przypadku był to kolosalny konglomerat News Corporation.

Gigant internetowy, po krótkiej dyskusji z włodarzami korporacji, oficjalnie ogłosił aktualizację swojego filtru antypirackiego. Skutkiem tego ruchu był ogromny spadek relatywnie niewielkiej liczby witryn (ok. kilkadziesiąt tysięcy) – mowa tu głównie o wspomnianych witrynach z torrentami oraz innych szemranych portali, ukierunkowanych na niezbyt legalnym szerzeniu treści.

Od tego czasu, wg oficjalnych informacji, algorytm Google Pirate nie był aktualizowany.

Pokazywanie wskaźnikiem słupków

4. Jakie strony są usuwane z wyników wyszukiwania Google

Większość usuniętych z wyników wyszukiwania adresów URL pochodzi z platform zajmujących się nielegalnym, darmowym udostępnianiem utworów. Są to zatem wspomniane już strony z torrentami, a także witryny umożliwiające przechowywanie i ściąganie danych – czyli prawdziwy cel algorytmu. Należy jednak pamiętać, że Google nie usuwa tych stron z Internetu, a tylko ze swoich wyników wyszukiwania.

Wyszukiwarka internetowa jest tylko narzędziem, które ułatwia nam eksplorację sieci – pirackie witryny nadal istnieją i można na nie trafić, ale dostęp do nich jest po prostu utrudniony z powodu bardzo niskiej widoczności.

Nawet perfekcyjnie zoptymalizowane pod kątem SEO witryny, które filtr „złapał”, nie mają dużych szans na dobrą widoczność w wynikach wyszukiwania. Jeśli myślisz, że Twoja strona padła ofiarą filtra (choć to zwykle mało prawdopodobne, chyba że jesteś właścicielem witryny z torrentami), możesz to łatwo sprawdzić. Na konto Google Search Console firma wysyła zawiadomienie o otrzymaniu zgłoszenia na konkretną stronę i informuje o możliwości odwołania, poprzez opisane wcześniej roszczenie wzajemne.

Jedną z takich witryn jest znany polski portal z chomikiem w adresie, który znajduje się w pierwszej piątce witryn, na które Google otrzymuje najwięcej zgłoszeń związanych z naruszeniami praw autorskich. Nieco ponad 26 milionów adresów URL (stan na lipiec 2019) tego portalu zostało do tej pory zaskarżone przez różne organizacje. Jedna z nich, RIAA (Recording Industry Association of America), weszła niedawno na drogę sądową, wnosząc do amerykańskiego sądu prośbę o udostępnienie informacji, które pomogą zamknąć tę znaną platformę.

Do organizacji, które zgłaszają firmie z Mountain View najwięcej naruszeń, należą m.in. rivendell i BPI (British Recorded Music Industry), które reprezentują interesy artystów i pracowników kreatywnych, a także przedsiębiorstwa takie jak Remove Your Media i Degban, których usuwanie treści rzekomo pirackich z sieci jest główną osią działalności.

Jak już zostało wspomniane, działania antypirackie są skierowane głównie na niewielką liczbę witryn, które ułatwiają swoim użytkownikom łamanie prawa autorskiego. Algorytm Google Pirat w większości przypadków spełnia swoje zadanie i do największych portali z torrentami dostaniemy się wyłącznie wpisując ich dokładną nazwę – inaczej nie pokażą się one w wynikach wyszukiwania. Części z tych witryn udało się opracować skuteczne metody pomagające „ominąć” działanie algorytmu, co skutkuje tym, że czasem jednak możemy na nie trafić w wynikach wyszukiwania.

Warto dodać, że nie tylko duże witryny są narażone na działanie filtra algorytmu, ale i małe oraz nieznane szerszemu gronu odbiorców. Każdy właściciel strony internetowej, prowadzący działania SEO i chcący być dobrze widoczny, powinien brać poprawkę na działanie tego antypirackiego algorytmu Google. Różne instytucje czy organizacje mają swoje sposoby na wyszukiwanie nawet niewielkich czy pojedynczych oznak naruszeń praw autorskich.

Co ciekawe, Google rozpatruje również skargi na adresy URL, które… nawet nie zostały jeszcze zaindeksowane.
Firma w swoim Raporcie Przejrzystości podaje ciekawy przykład – w 2017 roku 3 najaktywniejsze w pisaniu skarg organizacje zaskarżyły łącznie ok. 312 milionów adresów. Z tej liczby 98%, czyli blisko 307 milionów adresów, nie mogło nawet pojawić się w wynikach wyszukiwania, bo Google nie zdążył ich dodać do swojego indeksu!
Dwoje ludzi trzyma tablice

5. Podsumowanie

Algorytm Google - Pirate
Infografika: Algorytm Google – Pirate

Krótka rekapitulacja wiedzy o algorytmie Pirate:

  • Algorytm Google Pirate został wdrożony w 2012 roku i jego celem było obniżenie rankingu witryn, które dopuszczały się częstego łamania praw autorskich.
  • Do tej pory, według oficjalnych informacji, algorytm ten był tylko raz aktualizowany – w 2014 roku.
  • Spadki dotyczą relatywnie małej liczby stron, głównie ukierunkowanych na nielegalnym dzieleniu się rozmaitymi treściami. Duże portale takie jak YouTube, Facebook czy Twitter są odporne na filtr algorytmu.
  • Mniej widoczne dla internautów są witryny, które regularnie dostają stosunkowo dużo skarg.
  • Ponad 4 miliardy skarg na różne adresy URL dotarły do tej pory do Google.
  • Google podejmuje działania nawet w kilka godzin po dostaniu zgłoszenia.
  • Istotna część wszystkich zgłoszeń dotyczy stron, które jeszcze nawet nie zostały zaindeksowane.

Algorytm Google Pirate dawno nie dostał oficjalnej aktualizacji. Właścicielom stron torrentowych i podobnych, którzy nic sobie nie robią z praw autorów, radzimy jednak mieć się na baczności – Edward Teach, czyli legendarny Czarnobrody, również nie spodziewał się ataku porucznika Roberta Maynarda. Ponoć na głowie pirata, kołyszącej się na bukszprycie statku porucznika, widniał bardzo zdziwiony wyraz twarzy.

Źródła: Google 1, 2, 3, 4, 5; Lumen; Search Engine Land 1, 2, 3 , 4, 5, 6; MOZ; Silicon Valley Business Journal; Search Engine Roundtable; Business Insider; Search Metrics

Konrad Moryń