Czym jest Duplicate Content? Jaki ma wpływ na pozycjonowanie?

Czym jest Duplicate Content? Jaki ma wpływ na pozycjonowanie?
Czas czytania 5 minuty
powielony tekst

W pozycjonowaniu wszystko ma znaczenie. Począwszy od kodu (min. właściwe zoptymalizowane znaczniki) po samą treść. Dlatego tak istotne jest by była ona niepowtarzalna. Oczywiście część znaczników kodu strony będzie się powtarzać wielokrotnie na innych stronach – jednak w przypadku treści sprawa wygląda inaczej.

Czym jest Duplicate Content na stronie internetowej?

Duplicate Content to określenie z języka Angielskiego i tłumaczone może być na język Polski jako duplikaty treści. O sytuacji tego typu mówimy kiedy mamy do czynienia z identycznymi tekstami (lub ich fragmentami) w obrębie jednej witryny (np. kilka podstron serwisu ma identyczny tekst) lub pomiędzy różnymi stronami internetowymi (np. w przypadku identycznego opisu produktu w sklepie internetowym). Do sytuacji takich dochodzi z różnych przyczyn czasami niezależnych od nas samych (opisy produktu dostarcza często producent).

Z duplikacją treści możemy mieć do czynienia kiedy np.:

  • kiedy strona nie posiada odpowiednich przekierować np.
    • z www na bez www lub na odwrót (strona działa w obu wersjach)
    • z http na https lub na odwrót (strona dostępna jest obu wersjach)
  • kiedy umieszczamy na stronie taki sam tekst w wielu miejscach,
  • w wyniku ingerencji osób trzecich, które skopiowały tekst od nas,
  • kiedy bezmyślnie kopiujemy tekst z innych stron, (np. ze strony konkurenta)
  • w sytuacji kiedy mamy na stronie opis produktu od producenta

Jaki wpływ ma Duplicate Content na stronę?

Duplikaty treści mogą mieć bardzo negatywny wpływ na pozycję strony internetowej w wynikach pozycjonowania. Szczególnie, że wyszukiwarką zależy na wysokiej jakości treści, a zdublowana treść nie koniecznie taką wartość przedstawia.

W sytuacji więc kiedy wyszukiwarka internetowa na trafi na stronę, gdzie zachodzi taka sytuacja, może podjąć decyzję o nałożeniu filtra. Oczywiście nie koniecznie na całą witrynę internetową a np. na konkretną podstronę (artykuł, wpis). Działanie to ma na celu uzyskanie jak najbardziej wartościowych wyników wyszukiwania.

W takich sytuacjach pojawia się jednak pytanie, która strona zawiera oryginalne treści. Rozstrzygnięcie tego sporu może być problematyczne nawet dla zwykłego człowieka a gdzie dopiero dla sztucznego bytu. W takiej sytuacji robot wyszukiwarki posłuży się algorytmem. To on oceni, kto jest autorem tekstu. Czy zrobi to poprawnie trudno powiedzieć? Na pewno jednak weżnie pod uwagę:

  • popularność strony (ilość odwiedzin i czas przebywania na niej)
  • wiarygodność strony
  • ilość prowadzących linków,
  • kiedy pojawiła się dana treść (a właściwie, kiedy robot dodał ją do indeksu),

Z pewnością już domyślacie się co się stanie w sytuacji, kiedy duży portal „skopiuje treść” z małej strony internetowej. Algorytm prawie na pewno uzna, że to ten duży jest autorem. Pół biedy, jeśli na stronie znajdują się odnośniki do tego małego portalu.

Na szczęście lub nie szczęście w tym przypadku słabsza strona uzyska tylko gorszy wynik w wynikach wyszukiwania.

Rodzaje spotykanych duplikatów treści

Co rozumiemy przez duplikaty zewnętrze?

Duplikat zewnętrzny na stronie internetowej, ma miejsce w sytuacji kiedy dwie lub więcej stron internetowych posiada taką samą treść. W takiej sytuacji nie trudno się domyślić, że treść mogła być skopiowana z jednej strony i umieszczona na kolejnych. Z duplikacją zewnętrzną na stronie internetowej mamy do czynienia kiedy:

  • skopiujemy tekst z innej witryny np. naszej konkurencji, ktoś skopiuje tekst z naszej strony
  • w sytuacji kiedy fragment treści z naszej strony znajdzie się np. w katalogu, ogłoszeniu
  • kiedy nasza strona dostępna jest pod różnymi domenami (dla przeglądarki adres z WWW nie jest taki sam jak bez WWW),
  • kiedy np. skopiujemy tekst z ulotki informacyjnej, książki podobnie jak nasza konkurencja
  • duplikaty często też mamy prowadząc sklep internetowy i mając opisy produktów od producenta

Oczywiście można kopiować drobne fragmenty tzw. “cytaty”. Jednak trzeba to robić z głową! A na stronie umieszczać także inną tym razem już wartościową treść.

Wbrew pozorom do tego typu sytuacji dochodzi bardzo często. Wielu osobą nie chce się samemu tworzyć nowych treści lub nie czują się na siłach by samodzielnie taką stworzyć. W efekcie kopiują tekst od konkurencji. Co w praktyce powoduje, że pojawiają się witryny o identycznej treści. A jedna z tych stron po pewnym czasie zacznie tracić na pozycji.

Duplikaty zewnętrzne często występują w sklepach internetowych gdzie właściciele zobligowani są do zamieszczenia tekstów producenta. W takiej sytuacji czasami warto jest dodać coś od siebie, czyli spoza opisu producenta.

Czym są duplikaty treści wewnętrzne?

Duplikat wewnętrzny jest to powielony tekst znajdujący się na naszej stronie. Pojawia się on w sytuacji kiedy:

  • posiadamy kilka podstron zawierających taką samą treść np. kopiujemy wielokrotnie opisy produktów
  • powielamy dużą ilość treści w stałych elementach strony (np. w panelu bocznym)
  • kiedy na blogu nasze tagi i kategorie zawierają te same wpisy

W celu uniknięcia takiej sytuacji jeżeli musimy koniecznie pobierać treść z innej strony (np. sklepy internetowe opisy towarów) warto:

  • z parafrazować teksty,
  • ustawić je w trochę innej kolejności
  • lub wprowadzić własny tekst, który odróżni naszą stronę od konkurencji.

Warto również na stronie wziąć pod uwagę dodanie przekierowań. Tak by identyczne strony się nie dublowały.

Jeśli dobrze wykonamy proces po kilku dniach lub tygodniach nasza strona powinna móc osiągnąć wyższe pozycje.

Jaka jest opinia o duplikatach treści Google?

Więcej informacji o tym czym jest duplikat i jak postrzega go Google znajdziecie na stronie Google Search Console.

Google dokłada wszelkich starań, by indeksować i pokazywać jedynie strony zawierające wyróżniające się treści. Stosowanie takiego filtrowania oznacza, że jeśli na przykład w witrynie występują artykuły w wersji standardowej i do druku, a żadnej z nich nie zablokujesz metatagiem noindex, w wynikach wyszukiwania wymienimy tylko jedną z wersji.

Powielanie treści nie jest podstawą do podejmowania działań przeciwko witrynie, chyba że ma ono na celu oszustwo i manipulowanie wynikami wyszukiwarki. Jeśli problem powielania treści występuje w Twojej witrynie i nie zastosujesz się do powyższych rad, sami wybierzemy tę wersję treści, która będzie pokazywana w wynikach wyszukiwania.

W jaki sposób znaleźć identyczną treść?

Duplikaty można szukać na różne sposoby. Ręcznie lub z pomocą odpowiedniej aplikacji.

Ręczne szukanie skopiowanych treści.

Duplikaty można sprawdzić wpisując fragmenty strony do wyszukiwarki (google.pl). Po prostu kopiujemy fragment tekstu strony następnie wklejamy go w oknie wyszukiwarki. W wynikach wyszukiwania powinny pojawić się następnie strony zawierające identyczne bądź bardzo zbliżone treści. Jeśli strona nie ma duplikatów witryny, które nam się pokażą będą miały tylko pojedyncze słowa takie jak na sprawdzanej stronie. Jeśli jednak będą identyczne to znaczy, że znaleźliśmy duplikat, takich witryn może być kilka. Dla precyzji wyszukiwania warto skopiowany tekst umieścić w cudzysłowiach.

Z pomocą aplikacji / specjalnej wyszukiwarki

W Internecie jest kilka stron, które wyposażone są w specjalne wyszukiwarki umożliwiające nam znajdywanie innych witryn posiadających ten sam tekst co nasza strona. Takie porównywarki treści nie zawsze są dokładne a znalezione przez nie „identyczne treści” tak naprawdę nie stanowią problemu lub w ręcz przeciwnie. Dlatego warto samodzielnie zweryfikować otrzymane wyniki.

Takie specjalne wyszukiwarki duplikatów znajdziecie np.

Wszystkie powyższe aplikacje są bardzo proste w obsłudze i nie powinny nikomu sprawić problemu.

Jak usunąć duplikat na naszych stronach (powielenia tekstu w obrębie witryny)?

Istnieją 3 metody usuwania duplikatów  z naszych stron.

Pierwszym z nich jest przekierowanie 301 stosowane w sytuacji kiedy posiadamy dwie lub więcej stron zawierających tą samą treść. Jest to przekierowanie permanentne powodujące iż użytkownicy zostają przekierowani automatycznie z jednego adresu na drugi. Nie będę dużo o nim pisać gdyż opisałam je już w innym wpisie.

Drugą jest tag rel=canonical umieszczany w nagłówku strony. Nie jest on widoczny dla zwykłych użytkowników ale interpretowany przez roboty wyszukiwarki (specjalne programy z czytające kod strony). Tag ten zawiera informacje, która strona jest oryginałem:

<link rel="canonical" href="http://www.aurainweb.pl/strona/" />

Umieszcza się go na stronach będącymi duplikatami i wskazuje jedną z nich jako odginał. Ważne by wszystkie takie same strony pokazywały jedną konkretną a nie każda inną.

Trzecią metodą jest zastosowanie noindex, follow tagu meta robots. Podobnie jak canonical umieszcza się go w nagłówku pomiędzy znacznikami <head></head>

<meta name=”robots” content=”noindex, follow” />

Tag ten ma za zadanie blokować indeksacje w przeglądarce.