Duplicate content oraz thin content – czyli jak skopiowane i ubogie treści wpływają na Twoją stronę w Google

Duplicate content

Zapewne wszyscy znają teksty typu „kopiuj-wklej”. Właśnie mianem duplicate content określamy treści, które zostały skopiowane z innych stron. Warto zauważyć, że powielane treści mogą pojawiać się nie tylko na różnych domenach, czyli wtedy, gdy skopiujemy dany artykuł od konkurencji, ale także na jednej domenie. Dzieje się tak wówczas, gdy do jednej domeny możemy trafić przez kilka różnych adresów. Jeśli nie ustawimy przekierowania 301, wówczas tych kilka adresów będzie dla wyszukiwarki różnymi witrynami ze skopiowaną treścią. Duplicate content bardzo często zdarza się w sklepach internetowych, które oferując ten sam produkt i pobierają tą samą bazę od producentów, wykorzystując identyczne opisy. Jednak dla dobra naszej witryny, warto postarać się o unikalną treść.

Jak wyszukiwarki reagują na duplicate content?

Każdy, kto miał do czynienia z pozycjonowaniem, słyszał o tzw. Black Hat SEO. Są to nieetyczne techniki, za pomocą których można uzyskać wyższą pozycję w wyszukiwarce w dużo szybszym czasie. Takie działania nie są jednak mile widziane i są raczej mało opłacalne. Po pierwsze, efekt ich działania jest tymczasowy. Po drugie, roboty Google skutecznie walczą z takimi technikami.

Warto również zauważyć, że za kopiowanie treści, które objęte są prawami autorskimi, możemy zostać podani na policję. Oczywiście zwykle w pierwszej kolejności, autor tekstu prosi nas o jego usunięcie. W najgorszym wypadku może się to skończyć sprawą w sądzie.

Ale wracając do tematu robotów… Jeśli wyszukiwarka Google wykryje na naszej witrynie duplicate content, w najlepszym razie, nałoży na naszą stronę filtr, w najgorszym – po prostu ją zablokuje. Konkretne kary zależą w dużej mierze od ilości skopiowanych tekstów, jakie wykryje robot. Pamiętajmy jednak, że po pierwsze ściągnięcie blokady ze strony jest niełatwym zadaniem. A po drugie – nawet jeśli uda nam się zdjąć filtr czy blokadę z witryny, osiągnięcie pozycji w Google, którą zajmowaliśmy dotychczas będzie jeszcze trudniejsze i zajmie nam sporo czasu.

Używając nieświadomie skopiowanych treści możemy również zaszkodzić stronie, na której tekst został oryginalnie zamieszczony. Wyszukiwarka Google wyświetla w wynikach wyszukiwania treści, które najbardziej pasują do zapytania użytkowników. Czasem niestety może się zdarzyć, że strona, która oryginalnie zamieściła tekst, zostanie pominięta w wynikach wyszukiwania.

Co zrobić, by uniknąć powielania tekstu w obrębie jednej domeny?

Tak, jak już zostało powiedziane, duplicate content może pojawić się także w obrębie jednej domeny. Jak sobie z tym poradzić? Możemy uniknąć tego problemy trzema metodami. Możemy wskazać właściwą stronę do indeksacji za pomocą rel=canonical, zablokować zduplikowaną treść za pomocą robots.txt lub meta robots (noindex) lub wykorzystać oferowane przez wyszukiwarki narzędzia. Warto jednak w tek kwestii skorzystać z pomocy profesjonalnej firmy, zajmującej się pozycjonowaniem. Nie posiadając fachowej wiedzy na temat SEO i próbując robić coś na własną rękę, możemy tylko bardziej zaszkodzić witrynie np. wyindeksować ją z wyszukiwarki Google.

Jak sprawdzić duplikat treści

Istnieje narzędzie www.copyscape.com , za pomocą którego sprawdzimy czy tekst na naszej stronie jest unikatowy. Wystarczy wpisać link do konkretnej podstrony, a robot wyszuka w internecie plagiatów tej treści. Drugie narzędzie do przetestowania to www.siteliner.com.
Proszę zwrócić uwagę, że nawet informacja o Cookies może być traktowana jako duplikat treści. Zadbaj o niepowtarzalną treść nawet dla polityki prywatności czy regulaminu.

copyscape_duplicat_content

Powtórzenie treści wewnątrz serwisu

1. Opisy produktów

Szczególnie w sklepach internetowych należy zwrócić uwagę na powtórzenie treści między własnymi podstronami. Przykładem jest początek opisu produktu w sklepie internetowym na liście produktów. Treść ta jest niczym innym jak kopią opisu produktu. W takim przypadku warto napisać dedykowany skrócony opis, który wyświetla się na liście w danej kategorii.

2. Strona z WWW czy bez WWW

Jeśli nasza strona ładuje się zarówno z przedrostkiem www i bez www, należy zadbać, aby jeden adres kierował do drugiego jako przekierowanie 301. Podobnie z adresem z certyfikatem SSL i bez np. https://mojastrona.pl i http://mojastrona.pl.

W tym celu należy wykorzystać plik .htaccess na FTP w głównym folderze domeny, aby zdefiniować który adres ma kierować pod jaki URL. Przykładowy kod z przekierowaniem stałym na www.:

RewriteEngine On
RewriteCond %{HTTP_HOST} ^enterso.pl(.*) [NC] RewriteRule ^(.*)$ http://www.enterso.pl/$1 [R=301,L]

3. Wiele URLi do tej samej podstrony

Częstym błędem jest stosowanie wielu adresów URL dla tej samej treści, tej samej podstrony. Przykładowo:

www.mojadomena.pl/kontakt

www.mojadomena.pl/index.php?kontakt

www.mojadomena.pl/kontakt,1

Algorytm Panda

Za wyszukiwanie treści o charakterze plagiatów i niskiej jakości odpowiada algorytm Google Panda. System wyszukiwarki poszukujący duplicat content, jest udoskonalany już od 2011 roku. W tym czasie żniwa jego były bogate. Bardzo duża ilość niskiej jakości katalogów stron internetowych i stron zapleczowych uległa degradacji otrzymując filtr.

panda-algorytm-duplicate-content

Treści niskiej jakości – thin content

Współcześnie z treściami niskiej jakości mamy do czynienia właściwie w obrębie całego internetu. Ile razy spotkaliście się z komentarzami na forum czy wpisami na Facebooku, które zawierały błędy ortograficzne? Bo my wiele razy. Warto jednak wiedzieć, że treść niskiej jakości trochę inaczej odbierana jest przez czytelników, a inaczej przez wyszukiwarki Google.

Dla czytelników thin content to przede wszystkim artykuły zawierające błędy merytoryczne, gramatyczne, ortograficzne czy składniowe. Są one zwykle mało czytelne i niezbyt atrakcyjne, a ich czytanie sprawia (o ile ktoś w ogóle zdecyduje się taki tekst przeczytać), że zniechęcamy się do danej strony, blogera czy marki. Wyszukiwarki Google znacznie szerzej pojmują treści niskiej jakości. Są to przede wszystkim teksty „nafaszerowane” słowami kluczowymi, pozycjonowane na złe frazy lub takie, w których próbujemy ukryć słowa np. nie wyróżniając ich graficznie w żaden sposób. Thin content to także bloki ciągłego tekstu, które nie są podzielone na akapity, w których nie ma nagłówków, wyróżnień i właściwego układu. Zresztą, nawet czytelnik jest gorzej nastawiony do tekstu, w którym zlepek słów kluczowych przeważa nad normalną treścią, a bez nagłówków staje się on dodatkowo mało czytelny. Ale do thin content zaliczamy także strony ze zbyt małą ilością treści, co szczególnie spotykane jest w sklepach internetowych, gdzie często zamiast konkretnego opisu, pojawiają się tylko dane techniczne produktu. Co więcej, takie same dane pojawiają się w wielu sklepach, oferujących ten sam produkt.

Co zrobić, by nasze teksty były unikalne i miały wysoką jakość? Przede wszystkim warto podążać za zmieniającymi się algorytmami wyszukiwarek. Pamiętajmy również, by tworzyć teksty, które przede wszystkim zainteresują potencjalnych czytelników. To właśnie na odbiorcach powinno nam najbardziej zależeć. Po to budujemy pozycję w wyszukiwarce, by więcej osób mogło do nas trafić. Jednak nikt nie zostanie z nami dłużej, jeśli nie zadbamy o odpowiednią treść. Jeśli sami nie mamy czasu lub zbyt dużych umiejętności pisarskich, warto zlecić przygotowanie treści coppywriterom SEO ( zapraszamy do kontaktu ). Dzięki nim otrzymamy teksty wysokiej jakości, które będą zgodne z wymogami SEO. Prowadząc sklepy internetowe, powinniśmy skupić się na unikalnych opisach produktów – nie wystarczy nazwa producenta, rodzaj materiału czy rozmiar. Zapamiętajcie! Dobrze napisane teksty mogą Wam tylko pomóc. Zainwestowane pieniądze w unikalne treści procentują przez kolejne kilka lat, pomagając m.in. w SEO. W czasach, gdy ludzie dzielą się wszystkim w mediach społecznościowych, również dobry tekst może rozprzestrzenić się dużo szybciej, a Wasza strona zyska dodatkowych odbiorców.

Autor: Wojciech Kłodziński

Sprawdź już teraz ile kosztuje pozycjonowanie

Autor: Wiktor Pacer

Programista