4516356622_6cf2ee33bb_o Danas je Google Webmaster Tools lansirao novu poruku upozorenja kako bi vlasnici web sajta znali kada se pojedini URL ne pojavljuje jer ga Google vidi ga kao duplikat URL-a na drugom domenu. Na Google Webmaster Central blogu pružene su pojedinosti o tome kako Google prepoznaje duple klastere sadržaja i odabire "canonical" verziju tog klastera za prikaz u rezultatima pretraživanja.

Kada otkrijemo skupinu stranica sa dupliranim sadržajem, koristimo algoritme za odabir jednog reprezentativnog URL-a za taj sadržaj. Skupina stranica može sadržavati URL-ove sa istog sajta ili sa različitih sajtova, navodi se na Google blogu.

U slučajevima kada više URL-ova sadrži isti sadržaj (na primjer, zbog infrastrukture konfiguracije, dodatnih parametara ili internacionalizacije), postoji nekoliko opcija sa kojima vlasnici web sajta mogu Google-u ukazati koja je verzija "canonical".

Međutim, u nekim slučajevima, vlasnik web sajta ne iskoristi ove opcije za određivanje preferirane verzije ili se pak desi da Google odabere neku drugu verziju od one koju je vlasnika web sajta odredio.

Ova nova značajka upozorava vlasnike web sajta kada je "algoritam odabrao neki drugi URL, umjesto jednog od njegovih web stranica." Najčešćih razloga za to može biti:

  • Specifikacija od strane vlasnika sajta – ako ste preselili svoje domene ili ste implementirali rel=canonical atribut da ukazuje na to da je stranica na drugom domenu canonical, onda je to upozorenje jednostavna potvrda da je Google indeksirao to kao što ste naveli.
  • Regionalni web sajtovi – ako imate isti sadržaj na više regionalnih sajtova (na primjer, isti engleski sadržaj na domenima .com, co.uk i com.au), Google može indeksirati samo jednu verziju u slučaju ako niste konfigurirali regionalne informacije.
  • Pogrešna “canonicalization“ – stranica nehotice može koristiti atribut rel=canonical za specifiranje druge stranice kao canonical.
  • Loše konfiguriran server – loše konfiguriran hosting (posebno se događa sa djeljenim hostingom) može uzrokovati dva različita domena na kojima se prikazuje isti sadržaj.
  • Hakirani sajt – sajtovi su ponekad hakirani kako bi ukazivali na neke druge domene.
  • Ukradeni sadržaj – na blogu se navodi da "u rijetkim situacijama", Google može odabrati URL web sajta koja ima sadržaj ukraden od vas.