Robots.txt -Pirmas žvilgsnis
Yra keletas svrbiausių parametrų rašant šį failą: ‘User-agent’
‘Allow’ ‘Disallow’. User agent parametras nurodo kuriam paieškos
voriukui skirta komanda. Disallow parametras nurodo kurias vietas ar
failus/pletinius neindeksuoti.
Leisti visus paieškos robotus
User-agent: *
Disallow:
Uždrausti visus paiesškos robotus
User-agent: *
Disallow: /
Neleisti Google paieškos robotui pas jus lankytis
User-agent: Googlebot
Disallow:
Daugiau paremetrų
Galite naudoti parametrą ‘Allow’. Jei pavyzdžiui norite uždrausti googlei indeksuoti visus paveikslėlius išskyrus vieną
Leidžiame indeksuoti tik vieną išskirtinį paveikslėlį
User-Agent: Googlebot
Disallow: /images/
Allow: /images/example.gif
Kitas svarbus parametras kurį rekomenduoju naudoti - ‘Sitemap’.
Nurodome kur yra tinklapio žemelapis (sitemap)
User-agent: *
Disallow:
Sitemap: http://www.uzdarbis.biz/sitemap.xml
Wordpress pavyzdys
Štai pavyzdys kurį naudoja manasis wordpress naudojantis blogas
User-agent: *
# Neleidžiame indeksuoti failų esančių šiose direktorijose
Disallow: /cgi-bin/
Disallow: /stats/
Disallow: /dh_
Disallow: /wp-admin/
Disallow: /wp-includes/
Disallow: /contact/
Disallow: /wp-content/b
Disallow: /wp-content/p
Disallow: /wp-content/themes/askapache/4
Disallow: /wp-content/themes/askapache/c
Disallow: /wp-content/themes/askapache/d
Disallow: /wp-content/themes/askapache/f
Disallow: /wp-content/themes/askapache/h
Disallow: /wp-content/themes/askapache/in
Disallow: /wp-content/themes/askapache/p
Disallow: /wp-content/themes/askapache/s
Disallow: /trackback/
Disallow: /*?*
Disallow: */trackback/
User-agent: Googlebot
# Neleidžiame indeksuoti failų su šiais plėtiniais
Disallow: /*.php$
Disallow: /*.js$
Disallow: /*.cgi$
Disallow: /*.xhtml$
Disallow: /*.php*
Disallow: */trackback*
Disallow: /*?*
Disallow: /z/
Disallow: /wp-*
Allow: /wp-content/uploads/
# Leidžiame google robotui indeksuoti paveikslėlius.
User-agent: Googlebot-Image
Allow: /*
# Leidžiame adsense botui naršyti ir ieškoti raktažodžių
User-agent: Mediapartners-Google*
Disallow: /*?*
Allow: /about/
Allow: /contact/
Allow: /wp-content/
Allow: /tag/
Allow: /*.php$
Allow: /*.js$
# Neleidžiame archyvuoti tinklapio
User-agent: ia_archiver
Disallow: /
# uždraudžiame lankytis duggmirror
User-agent: duggmirror
Disallow: /
Apibendrinimas
Robots.txt nėra kažkas labai sudėtingo, tačiau pravers apsaugant
administratoriau “ploteli” ar privačias zonas tinklapyje. Jei turite
minčių kaip papildyti šį straipniuką leiskite man žinoti ![]()
Norėdami patalpinti šią informaciją savo tinklalapyje, nepamirškite
nurodyti straipsnio autoriaus tinklalapio adreso: http://uzdarbis.biz