Dupli sadržaj i Wordpress
Napisano 8.11.2006. u 1:56 unutar Onpage SEO kategorije(a).Dupli sadržaj mnogo se koristio u svrhe spama i sličnih stvari. Filteri koji takav sadržaj miču daleko su napredovali. Na SEOmozu, Geoffrey je otvorio diskusiju o duplom sadržaju i ukazao na patent za duplikate (PDF) iz 2000. godine. Zanimljivo je, kako je Google već tada koristio neki sustav za otkrivanje istih ili sličnih sadržaja.
Meni osobno zanimljivu tezu o Wordpressu i duplom sadržaju Goeffrey je adresirao na svome blogu. Velik dio svjetske blogerske scene koristi Wordpress kao svoj alat za pisanje.
Na njemu se pojavljuju na nekoliko mjesta isti sadržaji. Na primjer, home page ima listu postova, čiji je sadržaj isti kao i na detaljnom prikazu samoga posta. Kada se tome dodaju kategorije koje sadrže isto, te arhiva po mjesecima nastaje velika zbrka. Na sreću, mnoge se stvari mogu riješiti robots.txt datotekom i zabranom pristupa za neke direktorije.
Moje osobne postavke su ovakve:
User-agent: * Disallow: /wp-admin/ Disallow: /wp-content/plugins/ Disallow: /wp-includes/ Disallow: /feed/ Disallow: /blog/2006/
No s time treba biti oprezan, jer ukoliko onemogućite dio koji je potreban, morat ćete opet čekati na reindeksiranje nakon ispravka istog.
U wp-admin-u roboti nemaju šta raditi, kao i u wp-includes. Ukoliko koristite neki od pluginova koji prikazuje slike ili što već iz wp-content/plugins, onemogućite samo one koji vam nisu potrebni, a ne i cijeli taj direktorij.
U /feed/ se nalazi opet isti cijeli sadržaj svih postova, pa je i njega dobro isključiti. Roboti za feed-ove su drugačiji nego obični, te se ne drže exclusiona (bar neki od njih).
Meni je baza svih postova /blog/, a detaljni postovi /blog/%ime-posta%/, tako da arhivu postova mogu isključiti s /blog/2006/ - što uključuje sve mjesece u 2006. Ukoliko imate po defaultu naziv posta /2006/%ime-posta%/ time biste isključili sve postove, pa je potreban oprez.
Na home page-u prikazujem samo sažetke postova, pa nemam problema s detaljnim prikazom koji prikazuje cijeli post. Kategorije nisam htio isključiti, no i one sadrže sažetke.
Tu postoji i kanonizacijska duplikacija same domene - verzija stranice sa www i bez www verzije, koja se jednostavno može riješiti dodavanjem 301 redirecta u .htaccess datoteku:
RewriteEngine On
RewriteCond %{HTTP_HOST} ^seofruits.com.hr
RewriteRule (.*) http://www.seofruits.com.hr/$1 [R=301,L]
Sam home page ima duplikat: www.domena.com i www.domena.com/index.php.
Rješenje toga možete naći na SEOmoz-u.
Mislim da ovo rješava veliku većinu problema za dupli sadržaj i Wordpress.


Del.icio.us
Digg it
DvaNula