Continut duplicat in WordPress – noindex, follow

Continut duplicat in WordPress – noindex, follow

Problema continutului duplicat in WordPress… nu stiu cati se gandesc serios la asta dar pe mine ma sperie modul in care WordPress-ul face categorizarea articolelor. In mod normal ar trebui ca numarul de pagini indexate de Google sa fie egal cu numarul pe posturi + pagini scrise… lucrurile nu stau asa, WordPress creeaza pagini pentru paginatie, search, trackback, autor, data, categorii (arhiva), in care pune o parte din continutul posurilor (excerpt), sau chiar intregul post.

Modul in care este aranjata informatia este util, fara indoiala, pentru vizitatori, dar devine suparator atunci cand motoarele de cautare indexeaza 200 de pagini pentru un numar real de posturi de trei ori mai putin.

Ati zice ca o sa aveti mai mult trafic din Google daca sunt mai multe pagini, poate chiar e asa… dar pentru o evolutie sanatoasa a site-ului recomand scoaterea continutului duplicat din motoare pentru ca acestea sa se concentreze asupra articolelor individuale. Avantaje evidente in crawling complet, distributia sanatoasa a pagerank-ului, continut original… adio supplemental results.

Problema se poate rezolva simplu prin adaugarea “noindex, nofollow” pentru paginile nedorite, ele vor fi vazute de spideri care isi vor continua crawlink-ul linistiti, dar nu li se vada voie sa le indexeze.

Folosind functiile din WordPress se creeaza codul urmator, cod care va fi adauigat in header.php, inainte de </head>.

<?php if ( $paged > 1 ) {
echo '<meta name="robots" content="noindex,follow" /> ';
}?>
<?php if (is_author() ) {
echo '<meta name="robots" content="noindex,follow" /> ';
}?>
<?php if (is_trackback() ) {
echo '<meta name="robots" content="noindex,follow" /> ';
}?>
<?php if (is_search() ) {
echo '<meta name="robots" content="noindex,follow" /> ';
}?>
<?php if (is_date() ) {
echo '<meta name="robots" content="noindex,follow" /> ';
}?>

Pentru blogul 4seo am ales sa las spiderii sa indexeze categoriile, acolo sunt excerpt-uri ale posturilor, deci continutul nu este atat de asemanator ca al paginiilor originale. Urmatorul cod il puteti folosi doar daca vreti sa scoateti si categoriile din index-ul Google.

<?php if (is_category() ) {
echo '<meta name="robots" content="noindex,follow" /> ';
}?>

Google tinde sa dea importanta ridicata paginilor mai mari, si in mod normal arhivele (paginatia de exemplu) primesc mai mult credit de la Google, decat posturile.

Dupa folosirea codului de mai sus trebuie sa va asteptati la scaderi de trafic, este normal atunci cand scoateti pagini din Google. Lucrurile vor reveni la normal in timp odatata cu redistribuirea “link juice-ului”.

Pentru a verifica daca lucrurile au mers bine uitati-va in codul sursa al paginilor respective si dati un search pentru “noindex, follow”, va trebui sa gaseasca un randulet ca:
<meta name="robots" content="noindex,follow" />

Verificati daca Google a inteles mesajul, la urmatoarea indexare paginile respective nu vor mai fi listate pentru cautarea site:www.exemplu.ro, ceea ce inseamna ca ele nu mai sunt indexate. Folosind acelasi opertor de cautare, site:www.exemplu.ro, va puteti da seama care pagini din site sunt considerate cele mai importante, acestea fiind ordonate de la cea mai buna pagina (index), pana la cele mai slabe (rezultatele suplimentare), cu continut putin.

Hint 1: Folositi interdictii in robots.txt pentru a controla accesul motoarelor de cautare in site. Studiu de caz: Indexare, robots.txt in WordPress
Hint 2: Creati metataguri unice pentru fiecare pagina pentru a le tine departe de indexul suplimentar. Permalinks, titluri si metataguri in WordPress.

3 Comments

  • Reply

    LaNoapteReplied on 13/03/2011

    foarte util ghidul man , ms !

  • Reply

    MihaiCReplied on 14/06/2011

    Asta e o mare duda!
    Nu mai speriati lumea cu “continut duplicat”.

  • Reply

    AndreiReplied on 15/06/2011

    @MihaiC daca era o mare duda dupa cum zici u verifica si u cu webmaster tools si apoi mai vedem daca este sau nu.

Leave a comment

Your email address will not be published. Required fields are marked *

© 2010 - 2015 4SEO. All rights reserved.