Livrem og seler plejer at give en ekstra sikkerhed, og det var med den bagtanke, at en webmaster for ikke så længe siden valgte at løse et duplicate content problem med en – troede han – sindig brug af en kombination af Canonical URL tag og “noindex. Men det skulle vise at være en alt andet end heldig “forsikring”. Godt nok blev duplicate content problemet løst – men ikke helt på den måde, det var ønsket. Det blev løst, fordi Google ganske enkelt fjernede både den canonicale URL og alle de underliggende i et snuptag. Og det kostede dyrt, for der var tale om sider på 1. pladser med en meget høj omsætning. Men hvad var det egentlig, der gik galt?

Baggrunden

Lad os starte med begyndelsen – det er nu engang en smart ting at gøre. Der er tale om en webshop, der sælger højt profilerede brands. For nogle af disse brands vedkommende er der så mange varer, at produktoversigten er opdelt over op til 6-7 sider.

Den grundlæggende URL (den canonicale) så således ud: shopnavn.dk/brand-betegnelse/ og de underliggende URLs er så dannet efter denne model: shopnavn.dk/brand-betegnelse/?page=2, shopnavn.dk/brand-betegnelse/?page=3 osv.

Selve siden er opbygget som skitseret med min barnlige streg herunder. Den beskrivende tekst om brandet i de grønne felter går igen på samtlige undersider:

Dette er jo en helt klassisk og fremragende opbygning – hvis der kun er én side. Men når der er flere sider som i tilfældet her, er det den sikre vej i duplicate content problemer, for tekstmæssigt er alle varianterne (/?page=2, /?page=3 osv.) ganske ens. Det er kun produktbillederne og den nærmest ikke eksisterende tekst til hvert af produkterne, der varierer.

For at undgå duplicate content valgte webmasteren at sikre sig med et canonical tag, der henviste til shopnavn.dk/brand-betegnelse/ på alle siderne. Helt efter bogen og med den ønskede virkning.

Men sikkerhed er jo en god ting, og derfor valgte den omhyggelige webmaster at tilføje “noindex/follow” på alle undersiderne – altså på /?page=2, /?page=3 osv. Dette baseret på læsning af “eksperters” sikkert velmente råd.

I princippet burde den jo holde vand og yde et ekstra bolværk mod duplicate content. Med den sag på plads sov webmasteren roligt om natten – lige til han en dag vågnede og konstaterede, at hans ekstremt givtige nr. 1 placeringer på de meget stærke brands var forsvundet. Og ikke bare røget ned i placering – næ de var ganske enkelt forsvundet fra indeks!

Fejl i Googles håndtering eller logisk konsekvens?

Den gode webmaster kontaktede mig og bad om hjælp – og jeg tog et kig på sagen. Mit første indtryk var dyb undren, for der er tale om et yderst velbygget site uden tekniske fejl eller uhensigtsmæssigheder. Der er ingen robots.txt på sitet, der kunne give problemer. Der var ikke cloaket noget, og selv en meget minutiøs gennemgang af kildekoden på hver af hovedsiderne afslørede intet andet end godt håndværk.

Det var lige før, jeg skulle til at bede til de algoritmiske Guder – for der var bare ikke noget galt med de der landingssider. I bare desperation tjekkede jeg kildekoder på de underliggende, og der fandt jeg så den der “noindex/follow” i hver af dem. Så var det at tanke slog ned i mig: Hvad nu, hvis Google tager værdien af “noindex” med over på den canonicale side?

Altså: Vi har en URL, der hedder shopnavn.dk/brand-betegnelse/?page=3 og i head på den står der et canonical tag, der siger <link rel=”canonical” href=”http://shopnavn.dk/brand-betegnelse/” /> og en “meta name robots”, der siger “noindex/follow”. Kunne det virkelig tænkes, at Google tager den “noindex” værdi med fra /?page=3 og over på den canonicale URL?

Jeg var noget i tvivl – for på den ene side lød det helt vanvittigt, men på den anden side var der en vis indre logik i det. Jeg fik min nye kunde til at fjerne “noindex/follow” på alle undersiderne – og så var der bare at vente.

Ventetiden blev kort. Efter to døgn var de tilbage på de gamle placeringer. Og der blev ikke foretaget andet overhovedet end at fjerne “noindex/follow” på undersiderne. Jeg tør derfor godt drage konklusionen, at den omtalte konstruktion medførte en deindeksering. Dette bakkes op af, at samtlige de brandsider, hvor der IKKE er paginering, overhovedet ikke blev ramt.

Google har altså taget meldingen om “noindex” på undersiderne og overført den til den canonicale URL.

Om det er sådan, Google har skruet det sammen bevidst, eller om der er tale om en fejl, har jeg ikke kunnet finde entydige svar på. Men i forhold til denne sag er det også ligegyldigt.

Nu ved du, at du skal passe på. Lad være med at sætte “noindex” ind på URLs, du allerede har angivet en canonical URL for.

Og det var det, jeg lige ville dele med dig.

Rosenstand out!