Continutul duplicat este un subiect extrem de important atunci cand discutam despre intregul proces de optimizare seo. De cele mai multe ori, sintagma “continut duplicat” este strans legata de penalizarile Google care atrag dupa ele consecinte grave asupra site-ului pe care il detineti, in special asupra pozitiilor din SERP.

3 probleme pe care le puteti intampina din punct de vedere SEO atunci cand exista continut duplicat:

1. Risipirea bugetului de crawling

Atunci cand un site se bucura de o autoritate crescuta, risipirea bugetului de crawling devine o problema majora. In momentul in care site-ul are continut duplicat intern, paginile importante si autoritare din site nu vor mai fi la fel de vizitate.

2. Impartirea autoritatii

Atunci cand avem de-a face cu continut duplicat intern, divizarea link-urilor devine una dintre cele mai mari probleme la nivel SEO. De-a lungul timpului, ambele adrese URL pot fi mentionate de diverse surse cu link-uri dofollow, iar daca una dintre adrese nu prezinta o redirectionare 301 indicand pagina care dorim sa apara in Google, legaturile valoroase vor fi  distribuite catre ambele adresele URL.

3. Paginile targeteaza aceleasi cuvinte cheie

In momentul in care Google identifica fragmente de continut duplicat, in mod automat va alege doar una dintre paginile in care este prezent continutul respectiv, care rezoneaza cu interogarile efectuate in Google. Astfel, nu exista o garantie ca adresa aleasa de Google o sa fie cea pe care dumneavoastra doriti sa o clasati in paginile de cautare.

Toate aceste probleme pot sa fie prevenite daca stiti cum sa ascundeti continutul duplicat de Google si daca stiti cum sa detectati continutul duplicat de pe site. Pentru a va ajuta in aceaste probleme frecvent intalnite, vom aborda in urmatoarele randuri 5 tipuri de continut duplicat penalizat cel mai adesea de catre Google.

Tipuri de continut duplicat penalizat de Google

1. Scraped content

Scraped content = continut duplicat care apare in momentul in care o bucata din continutul altui alt site este copiata fara modificari. De asemenea, aici sunt clasificate si portiunile de continut refacute prin inlocuirea cuvintelor originale cu sinonime sau prin metode si instrumente automatizate.

2. Lipsa redirectului intre HTTP si HTTPS

Aceasta problema apare in momentul in care certificatul SSL este implementat intr-un mod eronat. Exista doua situatii des intalnite pentru implementarea incorecta a comutarii.

3. WWW si non WWW

Acesta situatie apare atunci cand atat versiunea WWW si cat versiunea fara WWW se pot accesa fara sa redirecteze. Ca si in cazul situatiei intalnite cu HTTP si HTTPS, aceasta problema se poate rezolva prin folosirea redirectului 301.

4. Continut similar

Nu doar continutul identic din doua pagini diferite este penalizat de catre algoritmii Google, ci si continutul foarte asemanator de la o pagina la alta.

5. Link-uri generate dinamic care se indexeaza

Spre exemplu, in momentul in care aveti continut in pagina unui produs, dar aveti trei culori diferite pentru acesta, automat se vor realiza parametrii generati dinamic. Pentru a remedia aceasta problema si pentru ca Google sa nu observe 3 pagini cu acelasi continut trebuie sa va folositi de atributul rel=canonical.