Gennem flere år har Google haft en sætning i deres vejledning til, hvordan du nemmest skaber en søgemaskinevenlig hjemmeside, som godt nok er overset af flertallet, og som nu er væk. Indtil videre kun i den engelske version af retningslinjerne – men det er nok bare et spørgsmål om, at det ikke er oversat endnu. Det handler om dynamiske URL – altså adresser med dynamiske parametre som f.eks. “?” i.

Google retningslinjer

Lad os lige starte med at genopfriske den omtalte sætning, som du – hvis du er programmør – naturligvis kender og har fulgt….ikke?

Overvej at oprette statiske kopier af dynamiske sider. Selvom Google-indekset indeholder dynamiske sider, udgør de en lille del af vores indeks. Hvis du har mistanke om, at dine dynamisk genererede sider (f.eks. webadresser, der indeholder spørgsmålstegn) medfører problemer for vores webcrawler, kan du oprette statiske kopier af disse sider. Hvis du opretter statiske kopier, skal du huske at føje dine dynamiske sider til filen robots.txt for at forhindre os i at behandle dem som duplikater.

Hele dette afsnit er nu fjernet fra Googles retningslinjer på engelsk – det observerede Brian Ussery i Atlanta i dag.

Vi har gennem lang tid efterhånden set, hvordan Google er blevet bedre og bedre til at crawle indhold, der er “puttet” bag diverse barrierer, som for blot et år siden var umulige for Google at gennemtrænge. Det er selvfølgelig herligt, men det stiller stadigt større krav til udviklerne af hjemmesider og – ikke mindst – til udviklere af CMS.

Det er jo, som tidligere dokumenteret, ikke ligefrem Google retningslinjer, der er frokostlæsning hos de danske CMS huse, så derfor snupper vi lige et lille uddrag fra de vejledninger, der gælder:

Opret ikke flere kopier af en side under forskellige webadresser. Mange websteder tilbyder tekstbaserede eller udskriftsvenlige versioner af sider, der indeholder det samme indhold som de tilsvarende sider med grafik. Hvis du vil sikre, at din foretrukne side inkluderes i vores søgeresultater, skal du spærre kopier for vores spiders ved brug af en robots.txt-fil. Du finder oplysninger om brug af en robots.txt-fil ved at referere til vores oplysninger om spærring af Googlebot.

Venlige URL – for øjet

At Google i henhold til deres retningslinjer nu ikke længere ser dynamiske URL som en hindring, ændrer ikke på det faktum, at relativt korte og beskrivende URL er at foretrække for øjets skyld. Det er stadig nemmere at afkode en adresse i Googles søgeresultat, der hedder “billige-kaffemeaskiner.dk/kaffemaskiner-med-kalkfilter” end “billige-kaffemaskiner.dk/category.asp?catalog_name=kaffemaskiner&category_name=Ceva&parent_category_name=stor&Expand=$2$$2$&ISOLanguage=DNK”. Du kan godt se forskellen, ikke? 😉

Altså: Google har tilsyneladende tunet den lille og flittige Googlebot endnu engang – til glæde og gavn for dynamisk opbyggede sites. Og til eftertanke for webudviklere, der ikke ved, at duplicate content ikke er noget, der kommer ud af en kopimaskine.

Rosenstand out!