BLOGas.lt
Lėktuvų bilietai
Sukurk savo BLOGą Kitas atsitiktinis BLOGas

Robots.txt -Pirmas žvilgsnis

 

Yra keletas svrbiausių parametrų rašant šį failą: ‘User-agent’
‘Allow’ ‘Disallow’. User agent parametras nurodo kuriam paieškos
voriukui skirta komanda. Disallow parametras nurodo kurias vietas ar
failus/pletinius neindeksuoti.

Leisti visus paieškos robotus

User-agent: *

Disallow:

Uždrausti visus paiesškos robotus

User-agent: *

Disallow: /

Neleisti Google paieškos robotui pas jus lankytis

User-agent: Googlebot

Disallow:



Daugiau paremetrų

Galite naudoti parametrą ‘Allow’. Jei pavyzdžiui norite uždrausti googlei indeksuoti visus paveikslėlius išskyrus vieną

Leidžiame indeksuoti tik vieną išskirtinį paveikslėlį



User-Agent: Googlebot

Disallow: /images/

Allow: /images/example.gif

Kitas svarbus parametras kurį rekomenduoju naudoti - ‘Sitemap’.

Nurodome kur yra tinklapio žemelapis (sitemap)

User-agent: *

Disallow:

Sitemap: http://www.uzdarbis.biz/sitemap.xml

Wordpress pavyzdys

Štai pavyzdys kurį naudoja manasis wordpress naudojantis blogas

User-agent: *

# Neleidžiame indeksuoti failų esančių šiose direktorijose

Disallow: /cgi-bin/

Disallow: /stats/

Disallow: /dh_

Disallow: /wp-admin/

Disallow: /wp-includes/

Disallow: /contact/

Disallow: /wp-content/b

Disallow: /wp-content/p

Disallow: /wp-content/themes/askapache/4

Disallow: /wp-content/themes/askapache/c

Disallow: /wp-content/themes/askapache/d

Disallow: /wp-content/themes/askapache/f

Disallow: /wp-content/themes/askapache/h

Disallow: /wp-content/themes/askapache/in

Disallow: /wp-content/themes/askapache/p

Disallow: /wp-content/themes/askapache/s

Disallow: /trackback/

Disallow: /*?*

Disallow: */trackback/

User-agent: Googlebot

# Neleidžiame indeksuoti failų su šiais plėtiniais

Disallow: /*.php$

Disallow: /*.js$

Disallow: /*.cgi$

Disallow: /*.xhtml$

Disallow: /*.php*

Disallow: */trackback*

Disallow: /*?*

Disallow: /z/

Disallow: /wp-*

Allow: /wp-content/uploads/

# Leidžiame google robotui indeksuoti paveikslėlius.

User-agent: Googlebot-Image

Allow: /*

# Leidžiame adsense botui naršyti ir ieškoti raktažodžių

User-agent: Mediapartners-Google*

Disallow: /*?*

Allow: /about/

Allow: /contact/

Allow: /wp-content/

Allow: /tag/

Allow: /*.php$

Allow: /*.js$

# Neleidžiame archyvuoti tinklapio

User-agent: ia_archiver

Disallow: /

# uždraudžiame lankytis duggmirror

User-agent: duggmirror

Disallow: /

Apibendrinimas

Robots.txt nėra kažkas labai sudėtingo, tačiau pravers apsaugant
administratoriau “ploteli” ar privačias zonas tinklapyje. Jei turite
minčių kaip papildyti šį straipniuką leiskite man žinoti :)

Norėdami patalpinti šią informaciją savo tinklalapyje, nepamirškite
nurodyti straipsnio autoriaus tinklalapio adreso: http://uzdarbis.biz

Rodyk draugams