Polskie strony internetowe to rak który trzeba blokować

trzeci
trzeci

Polskie strony mainstreamowe to rak jakich mało. Wszystkie radiozet, rmf, onet, interie itp to treści generowane przez boty, tak skrojone aby tylko być wysoko w wyszukiwarkach. Przykład? Szuka sobie kiedy będzie "dark sezon 3" (przy okazji dobry serial, warto spróbować). 

Patrze sobie, no spoko, radiozet w pierwszym wyniku, sprawdzam. 

Cała strona wygląda tak: 

595831316141454841424d78_1592740281ehorA1vzNBpUp8nkE7SkWm.jpg


Teraz zabierzmy z niej wszystkie reklamy (jasnoczerwony to cross promocje - linki do innych artykułów na portalu) :

595831316141454841424d78_1592740501wV1MGR0T0i8bzrOhhGcPlY.jpg


A teraz jak to wygląda ze względu na tekst:

Tytuł artykułu to: "Dark, sezon 3 - kiedy premiera serialu i gdzie oglądać nowe odcinki? [DATA, ZWIASTUN]" 

Więc pewnie dowiemy się z treści: 

595831316141454841424d78_1592741019oNBFKnYEdTQHaPbxA4pPYl.jpg

Zamieszczony tekst jest jednym wielkim bełkotem i powtarzaniem słów kluczowych typu:

  • kiedy: 10x
  • sezon: 16x
  • data: 3x


Po skategoryzowaniu tekstu wygląda to następująco: 

595831316141454841424d78_1592741166evr7bDJVwIsld5hc6npIOQ.jpg

Gdzie:

  • różowy pasek: bełkot i powtórzenia
  • niebieski pasek: w zelżywości od potrzeby może być przydatną informacją
  • zielony pasek: faktycznie przydatna informacja której szukałem
  • czerwony pasek: reklama

I tak to wygląda na całej stronie: 

595831316141454841424d78_159274146784VX8kYwkpGf52G8WeT4bt.jpg



// Screenshoty wrzucone do artykułu na zasadzie prawa cytatu