Kategorier
Søk


Avangsert søk
Søk på Internett
Nyhetsbrev:

Meld deg på vårt nyhetsbrev, så holder du deg oppdatert om hva som skjer på våre sider.

Angi din e-post adresse:


Klikk her for å melde deg av!

Article Options
Dine siste leste artikler
Populære artikler
  1. SOFT-analyse
  2. Direkte- og indirekte kostnader
  3. Hvordan bli en "Super-selger" ?
  4. Deskriptivt design
  5. Den linære kommunikasjonsmodellen
Ingen populære artikler funnet.
Populære forfattere
  1. Kjetil Sander
  2. JanHelge Maurtvedt
Ingen populære forfattere funnet.
 »  Home  »  Søkemotor optimalisering (SEO)  »  Robots.txt
Robots.txt
By Kjetil Sander | Publisert  04/17/2005 | Søkemotor optimalisering (SEO) | Rating:
Kjetil Sander
Ansvarlig redaktør og daglig leder for OnNet AS. Utdannet Diplom økonom og -markedsfører fra NMH/BI, med mellomfag i markedskommunikasjon. 

View all articles by Kjetil Sander
Hva er robots.txt og hvorfor er denne filen viktig?
Det finnes to metoder for å fortelle robotene til søkemotorene hva de skal indeksere.

Den ene metoden er å lage en "robots.txt" fil som legges på root-katalogen til nettstedet. Så snart roboten kommer til nettstedet vil den spørre etter filen. Eksisterer denne filen vil roboten følge de instruksene som er angitt her. Filen skal ha et spesielt format, bestående av records. Hver record skal bestå av to felt; en User-agent linje og en eller flere Disallow: linjer.

Lag filen i et program som lager en ren tekst fil. Ikke bruk en HTML editor.

User-agent:
User-agent linjen forteller hvilke roboter recorden gjelder for. For eksempel:

User-agent: googlebot
Du kan også bruke "wildcard". F.eks. "*" for å angi alle robotene:

User-agent: *

Disallow:
Den andre delen av record settet inneholder en Disallow: linje som spesifiserer hvilke filer og/eller kataloger som roboten ikke skal indeksere. F.eks., forteller denne instruksen at roboten ikke skal indeksere email.htm:

Disallow: email.htm

Du kan også spesifisere kataloger:

Disallow: /cgi-bin/

Denne linjen gjør at innholdet i katalogen cgi-bin ikke blir indeksert.

Examples:

Denne angivelsen tillater alle roboter å besøke alle filer:

User-agent: *Disallow:

Denne holder alle robotene borte:

User-agent: *Disallow: /

Denne holder robotene borte fra katalogene cgi-bin og images:

User-agent: *Disallow: /cgi-bin/Disallow: /images/

Denne gjør at googlebot ikke får ta i filen cheese.htm:

User-agent: googlebotDisallow: cheese.htm
Fortell hvor ditt nettkart (sitemap) er:
 
  1. User-agent: *
  2. Sitemap: http://www.onnet.no/sitemap.xml
Dette forteller robotene til søkemotorene hvor nettkartet ditt ligger

Besøk The Web Robots Pages for å lære nærmere hvordan du skriver denne filen for å instruere robotene til å besøke dine sider. Du kan selv teste om denne filen er skrevet korrekt ved å benytte robots.txt analysis tool som er tilgjengelig i Google Webmaster Tools.

Den andre metoden er å legge inn "meta-tags" til roboten, såkalte "spider tagg". Dette er et filter som forteller søkeroboten om websiden skal indekseres og eventuelt hvordan det skal gjøres. Denne metataggen er en fleksibel mulighet for de som ikke kan kontrollere robots.txt filen på webområdet. Den er spesielt nyttig viss du ikke ønsker siden indeksert etter standard metoden ALL (se under)  Robots metatagger har følgende alternativ:

- utelater du Robots taggen gjelder standarden ALL

ALL Nettsiden indekseres og søkeroboten følger linker til andre nettsider.
NONE ingenting registreres av søkeroboten
INDEX siden indekseres på søketjenesten.
FOLLOW linker på websiden din følges og indekseres.
NOINDEX siden skal ikke indekseres
NOFOLLOW linker på websiden skal ikke følges/indekseres.

Du kan kombinere Robots på følgende vis:

INDEX, NOFOLLOW = siden indekseres men linker skal ikke følges/indekseres
NOINDEX, FOLLOW = websiden skal ikke indekseres men linker følges/indekseres.

Sider som om oss, bruker policy og så videre, inneholder sjelden informasjon folk flest er spesielt interessert i å få vite. Dessuten vil slike sider ofte være linket til fra alle sidene på nettstedet ditt, og følgelig kan søkemotorene komme frem til at de er viktige. Det virker mot sin hensikt.

Note: Mange blokkerer kontakt oss, men dette skal du være forsiktig med. Hvis folk er ute etter telefonnummeret eller besøksadressen til firmaet ditt, så kan det godt hende de søker etter dette.

Tenk nøye gjennom hvilke sider dine besøkende vil betegne som lite viktige, og bruk robots.txt til å fortelle søkemotorene at du ikke ønsker dem indeksert.

Flere sider med likt innhold er drepen for SEO. Dersom du har mange duplikater på nettstedet ditt, så kan du også bruke robots.txt for å nekte indeksering av disse. Uten å bli for teknisk, så er det slik at mange bruker URL rewriting. Da må du enten sørge for at crawlerne ikke indekserer URL'ene med query string (spørrestreng), eller videresende dem (med 301 redirect) til de omskrevne URL'ene.

En enkel robots.txt generator finner du under. Den genererer de vanligste taggene til din robots.txt fil.

Robots.txt generator

Robots.txt Generator Tool © SEO Chat™

Allowed User Agent
Select user agent or use default for all agents

Enable All Webpages
Yes
No

Exclude These URL's
Enter URLs you wish to exclude

Enter Captcha To Continue
To prevent spamming, please enter in the numbers and letters in the box below

Andre, litt mer avanserte generatorer er:


How would you rate the quality of this article?
1 2 3 4 5
Poor Excellent

Godkjennelse:
Skriv inn sikkerhetskoden under:
imgRegenerate Image


Legg til en kommentar
Article Series
This article is part 12 of a 47 part series. Other articles in this series are shown below:
  1. SEO SKOLENS OPPBYGNING
  2. SEO TRINN 1: Introduksjon til søkemotoroptimalisering
  3. Søkemotorenes betydning for markedsføringen av ditt nettsted
  4. Hva er en søkemotor?
  5. Hvilke søkemotorer finnes?
  6. Hvordan fungerer søkemotorene?
  7. Slik ser søkerobotene din nettside
  8. Bli funnet i Google lokalt søk
  9. Hva er en HTML side og HTML koder?
  10. Hvilken informasjon indekserer søkemotorene?
  11. Meta-tags
  12. Robots.txt
  13. Hvordan få best mulig ranking?
  14. Google PageRank – enkelt forklart
  15. SEO TRINN 2: Registrering av domene/nettsted i søkemotorene
  16. Tips for rask indeksering av nye domenenavn
  17. SEO TRINN 3: Valg av nøkkelord/søkeord
  18. SEO TRINN 4: Valg av SEO grunnmur (Domene, webhotell og CMS løsning)
  19. Velg riktig domenenavn til dine søkeord
  20. Velg riktig hosting leverandør/webhotell!
  21. Velg riktig publiseringssystem (CMS)
  22. SEO TRINN 5: Søkemotoroptimalisering av innholdet
  23. Velg ut 2-3 nøkkelord pr side
  24. Lag en selgende Title taggs for nettsiden din
  25. Skriv en søkemotor vennlig body tekst
  26. Bruk av linker, bilder og tagger i body seksjonen
  27. Sørg for at søkemotorene kan følge dine linker
  28. Lag og publiser ditt nettkart (sitemaps) til søkemotorene
  29. Hvordan ønsker du at søkemotorene skal presentere siden i sine søkeresultater?
  30. Unngå indeksering av duplikatsider - fortell søkemotorene hvilken side som er originalen
  31. Å bygge skyggedomener for høy synlighet i søkemotorene
  32. Oppdater sidene dine jevnlig
  33. SEO TRINN 6: Søkemotoroptimalisering av utforming og webdesign
  34. Hva må du huske på når du designer sidene?
  35. Mappe- og filstruktur
  36. Unngå trege nettsider!
  37. Bruk av bilder og video
  38. Bruk av Flash
  39. Bruk av script, rich text format og dynamiske nettsider
  40. Kontroller sidene for tekniske feil
  41. Lag og publiser din egne 404 feilmeldingssider (Page Not Found)
  42. SEO TRINN 7: Lag en lenke-strategi
  43. SEO TRINN 8: Administrasjon og kontroll
  44. Google SEO verktøy
  45. Lag administrative rutiner for lenke-programmet
  46. Dette er grunnen til at det er så vanskelig å lage effektive lenke-strategier.
  47. Vil min rangering i søkemotorene bli endret hvis jeg endrer hjemmesidene mine eller flytter dem til en annen hosting leverandør?
Comments