Google begynder at crawle links i forms

En af de mange ting der gør det sjovt at arbejde med mit fag – søgemaskineoptimering – er, at gårsdagens sandhed ikke altid er morgendagens ditto. Gennem mange år – faktisk alle årene – har det været en sandhed uden forbehold, at søgemaskinernes robotter aldrig kunne følge links i “Forms” – altså i formularer, rullefelter etc. Faktisk er det en af de ting, som det efterhånden er lykkedes at overbevise flertallet af programmører om. Og så sker der pludselig noget i dag.

Nu melder Google ud, at de er begyndt at crawle links i forms på visse hjemmesider. På normalt “Googlesk” fortæller de, at der er tale om udvalgte sites med høj trust – og kommer så ikke nærmere ind på, hvad det skal fortolkes som. Kan du ikke lige huske, hvad det går ud på? Se her, hvad crawl, indeksering og ranking er.

Både på Googles officielle webmaster blog og hos Matt Cutts skrives der om de nye muligheder. Du kan selv læse om crawling af forms hos Google og hos Matt.

Hvad betyder det så?

Ikke en hel masse lige med det samme – for Google siger klart, at det kun er visse sites, der beæres med denne særlige opmærksomhed fra Googlebot. Og da du ikke ved, om du er i det selskab, kan du ikke forlade dig på, at links i dine forms bliver crawlet.

På lidt længere sigt kunne jeg godt se nogle yderst interessante Black Hat muligheder. Når disse bliver udnyttet, vil Google naturligvis justere efter det – og sandsynligvis undlade at crawle de sites, hvor det sker.

Men der er da åbnet for eksperimenter, ikke? Mon ikke vi vil se nogle sjove og kreative udnyttelser af Googlebots nyfundne evne udi crawl af forms? Jeg tror det!

Update 12. april: Det viser sig, at min yderst begrænsede forstand på internet og den slags har medført nogle misforståelser. Lad mig derfor præcisere: Google eksperimenterer med at udføre det med forms, rullefelter etc., som mennesker gør – altså udføre såkaldte queries. Resultaterne af disse følger de så og crawler indholdet.

For text boxes, our computers automatically choose words from the site that has the form; for select menus, check boxes, and radio buttons on the form, we choose from among the values of the HTML. Having chosen the values for each input, we generate and then try to crawl URLs that correspond to a possible query a user may have made.

Det var det, der fik sådan en amatør som mig til at kalde det, at Google følger links i forms. Jeg må nok hellere øve mig på at være mindre “dagligdags” i mit sprogbrug – eller overlade det tekniske til dem, der ved meget mere end jeg gør 🙂

Rosenstand out!

Få et opkald fra Thomas Rosenstand - Så er du på vej til den ultimative SEO løsning!

Invalid Email
Invalid Number

15 kommentarer til “Google begynder at crawle links i forms”

  1. Mon ikke det ligepræcis er risikoen for udnyttelse af googlebots ny egenskab at man vælger kun at slippe den løs på ‘trusted domains’. Men helt sikkert en spændende udvikling, både for SEO og webdesign formål.

  2. Du er hurtig ude i dag 😉

    Jeg tror også vi vil se en masse black hat, hvis Google begynder at indeksere FORMS og SELECT bokse, men nu må vi ser hvordan det udarter sig, og mon ikke de har taget højde for lidt af hvert?

    Jeg er ihvertfald i gang med at teste.

  3. Eh, hvad pokker er et link i en form? Og hvordan adskiller det sig fra normale links? 😛

    Nyheden er at Google eksperimenterer med at følge FORMS, og at lave mere eller mindre random valg i alle form elementerne.

    Og de eksperimenterer kun med det på et lille udvalg af websites: “Only a small number of particularly useful sites receive this treatment”.

  4. Hej Søren
    Et link inde i et er et link i en form. Det adskiller sig udelukkende ved, at Google ikke tidligere har fulgt disse af den simple årsag, at de ikke før har udført query i forms. Og som følge deraf ikke har fulgt de resultater, en given query leverer.
    Du kan læse en uddybende forklaring via de links, jeg har nævnt – men jeg har på fornemmelsen, det mere handler om semantik end om manglende viden om, hvad et link i en form er? Du er jo ikke hvem som helst, og jeg vover pelsen og påstår, at du godt ved, hvad jeg mener med det, jeg skriver.

    Jeg er ikke programmør – jeg får bare ting til at virke. Ofte ved at bede programmører om at gøre det, jeg beder. Syntaksen at kalde det for et link i en form er uden tvivl ikke korrekt. Men forstås nok af dem der vil?

    Netop vendingen “We only do this for a small number of high-quality sites right now” er åben for megen fortolkning. Hvis man synes, det er sjovt. Jeg synes, det er en spændende nyhed, og får Google det til at spille, som de gerne vil, rulles det nok bredere ud.

    Beklager min manglende indsigt i de korrekte termer. Jeg mener det godt 😉

  5. Rosenstand: Du skal ikke tage det så tungt! Jeg er programmør, og jeg har arbejdet med faget siden begyndelsen af 1990. Det er rigtigt, at det er ukorrekt brug af terminologien, når du skriver om “links i forms”.

    Til gengæld er det en fuldstændigt korrekt beskrivelse af, hvad der sker. Og din måde at forklare på gør, at jeg er en fast læser af din weblog. Det er mange af mine kolleger også, og dine forklaringer “helt nede på jorden” bliver flittigt læst her i virksomheden i både web- og marketingafdelingerne. Så fortsæt du roligt med at beskrive dit fag i lægmandstermer, for det glæder flere, end du tror! Og det er jo slet ikke en teknologiblog, du driver her.

    Tillykke med dit kursus på Teknologisk Institut i sidste uge! Jeg har hørt godt om det, og jeg kan jo også læse under din rubrik “Foredrag og kurser” her på webloggen, at du fik en fantastisk score.

    Søren: Jeg har også dit feed i min reader, og det er en fornøjelse. Jeg generes ikke af, at du ikke er så stærk i dansk grammatik, for indholdet er godt nok. Prøv at nyde Rosenstands indlæg på samme vis og med samme overbærenhed for de ikke fagligt korrekte betegnelser, som jeg nyder dine indlæg trods din kommasætning.

  6. Hej Mr. .net og velkommen her!

    Jeg tager det nu heller ikke særlig tungt 🙂 Men fuldstændigt upåvirket af det meste af en dags havearbejde fordi min gartner har svigtet mig – det er jeg godt nok ikke. Kun en tåbe frygter ikke haven!

    Tak for roserne.

  7. Bare rolig, jeg nyder skam at læse indlæg her på bloggen 😛

    Det eneste jeg såmænd ville sige med min kommentar, var:

    – At der rent teknisk ikke er noget der hedder “links i forms”. Med mindre man rent faktisk taler om et link man har placeret inden i en formular, hvilket Google ikke har problemer med at indeksere. Så jeg så et potentiale for at noget af posten kunne misforståes af mindre-tekniske individer.

    – At kilderne der er linket til siger at det kører på eksperiment stadiet på udvalgte sites. Det er langt fra sikkert at det går live, så du skal ikke forvente at se at GoogleBot’en laver random søgninger på din hjemmeside lige med det samme. Larsbachmann.dk, hvor jeg originalt blev ledt hen på denne post, havde ikke lige lagt mærke til denne detalje, og var allerede gået igang med sin egen “test”. Derfor tænkte jeg det var vigtigt lige at få nævnt her.

    Efter at have genlæst min kommentar kan jeg KLART se jeg burde havde formuleret mig anderledes og mere konstruktivt. Det er taget til efterretning.

    …Og ja, jeg stinker til tegnsætning 😛

  8. Og jeg stinker til korrekt brug af termer i forhold programmering – så har vi hver vores speciale der. Og det er jo i grunden ikke så ringe endda. God søndag!

  9. Hej Søren
    jeg havde skam godt lagt mærke til den detajle, men selvom jeg med 99,99% sikkerhed ikke er blandt Googles udvalgte, så kan det skam være meget rart at få testet. Der kan jo være andre søgemaskiner der læser URL’s i form tags.

    Og et er jo hvad Google siger, og noget andet er hvad de gør 😉

  10. I min software (fx A1 Website Analyzer) kan du også følge “links” i GET forms… Men hvis du har mange select/option elementer… Så kan der hurtigt blive en del kombinationer 😉

  11. Google har i mange år indekseret resultatet af GET forms – det eneste nye her er, at de nu forsøger at gætte sig til hvad en formular skal udfyldes med. De sites der i forvejen supplerer med link-navigation til de GET resultat-sider de gerne vil have indekseret får det allerede.

    Derudover er det vigtigt at understrege, at Google fortsat ikke indekserer POST forms – det kommer de heller ikke til, at helt åbenlyse tekniske årsager, sådan lige med det samme.

  12. Det var et sjovt spørgsmål fra én, der arbejder med SEO 🙂 De skal bruge det til at crawle og indeksere indhold på nettet med. Der ligger jo masser af indhold “gemt” bag dårlig programmering etc. Og det vil Google gerne kende.

Skriv en kommentar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *