Beth yw Ffeil Robots.txt? Popeth y mae angen i chi ei ysgrifennu, ei gyflwyno, a'i ail-gronni ffeil robotiaid ar gyfer SEO
Rydym wedi ysgrifennu erthygl gynhwysfawr ar sut mae peiriannau chwilio yn canfod, cropian, a mynegeio eich gwefannau. Cam sylfaenol yn y broses honno yw'r robots.txt
ffeil, y porth i beiriant chwilio gropian eich gwefan. Mae deall sut i adeiladu ffeil robots.txt yn gywir yn hanfodol wrth optimeiddio peiriannau chwilio (SEO).
Mae'r offeryn syml ond pwerus hwn yn helpu gwefeistri i reoli sut mae peiriannau chwilio yn rhyngweithio â'u gwefannau. Mae deall ffeil robots.txt a'i defnyddio'n effeithiol yn hanfodol ar gyfer sicrhau mynegeio effeithlon gwefan a'r gwelededd gorau posibl yng nghanlyniadau peiriannau chwilio.
Beth yw Ffeil Robots.txt?
Ffeil testun yw ffeil robots.txt sydd wedi'i lleoli yng nghyfeiriadur gwraidd gwefan. Ei brif bwrpas yw arwain ymlusgwyr peiriannau chwilio ynghylch pa rannau o'r wefan y dylid eu cropian a'u mynegeio ai peidio. Mae'r ffeil yn defnyddio Protocol Gwahardd Robotiaid (REP), defnydd safonol o wefannau i gyfathrebu â chrawlwyr gwe a robotiaid gwe eraill.
Nid yw'r REP yn safon Rhyngrwyd swyddogol ond mae'n cael ei dderbyn yn eang a'i gefnogi gan beiriannau chwilio mawr. Yr agosaf at safon dderbyniol yw'r ddogfennaeth o beiriannau chwilio mawr fel Google, Bing, a Yandex. Am fwy o wybodaeth, ewch i Manylebau Google Robots.txt argymhellir.
Pam fod Robots.txt yn Hanfodol i SEO?
- Cropian dan Reolaeth: Mae Robots.txt yn caniatáu i berchnogion gwefannau atal peiriannau chwilio rhag cyrchu adrannau penodol o'u gwefan. Mae hyn yn arbennig o ddefnyddiol ar gyfer eithrio cynnwys dyblyg, ardaloedd preifat, neu adrannau â gwybodaeth sensitif.
- Cyllideb Cropio wedi'i Optimeiddio: Mae peiriannau chwilio yn dyrannu cyllideb cropian ar gyfer pob gwefan, nifer y tudalennau y bydd bot peiriant chwilio yn cropian ar wefan. Trwy wrthod adrannau amherthnasol neu lai pwysig, mae robots.txt yn helpu i wneud y gorau o'r gyllideb cropian hon, gan sicrhau bod tudalennau mwy arwyddocaol yn cael eu cropian a'u mynegeio.
- Gwell Amser Llwytho Gwefan: Trwy atal bots rhag cyrchu adnoddau dibwys, gall robots.txt leihau llwyth gweinydd, gan wella amser llwytho'r wefan o bosibl, sy'n ffactor hollbwysig yn SEO.
- Atal Mynegeio Tudalennau Di-Gyhoeddus: Mae'n helpu i gadw ardaloedd nad ydynt yn gyhoeddus (fel safleoedd llwyfannu neu ardaloedd datblygu) rhag cael eu mynegeio ac ymddangos mewn canlyniadau chwilio.
Robots.txt Gorchmynion Hanfodol a'u Defnydd
- Caniatáu: Defnyddir y gyfarwyddeb hon i nodi pa dudalennau neu rannau o'r wefan y dylai'r ymlusgwyr gael mynediad iddynt. Er enghraifft, os oes gan wefan adran arbennig o berthnasol ar gyfer SEO, gall y gorchymyn 'Caniatáu' sicrhau ei fod yn cropian.
Allow: /public/
- Caniatáu: I'r gwrthwyneb i 'Caniatáu', mae'r gorchymyn hwn yn cyfarwyddo bots peiriannau chwilio i beidio â cropian rhannau penodol o'r wefan. Mae hyn yn ddefnyddiol ar gyfer tudalennau heb unrhyw werth SEO, fel tudalennau mewngofnodi neu ffeiliau sgript.
Disallow: /private/
- Cardiau gwyllt: Defnyddir cardiau gwyllt ar gyfer paru patrymau. Mae'r seren (*) yn cynrychioli unrhyw ddilyniant o nodau, ac mae'r arwydd doler ($) yn dynodi diwedd URL. Mae'r rhain yn ddefnyddiol ar gyfer nodi ystod eang o URLs.
Disallow: /*.pdf$
- Mapiau gwefan: Mae cynnwys lleoliad map gwefan yn robots.txt yn helpu peiriannau chwilio i ddod o hyd i'r holl dudalennau pwysig ar wefan a'u cropian nhw. Mae hyn yn hanfodol ar gyfer SEO gan ei fod yn helpu i fynegeio gwefan yn gyflymach ac yn fwy cyflawn.
Sitemap: https://martech.zone/sitemap_index.xml
Robots.txt Gorchmynion Ychwanegol a'u Defnydd
- Asiant defnyddiwr: Nodwch pa ymlusgwr y mae'r rheol yn berthnasol iddo. Mae 'User-agent:*' yn cymhwyso'r rheol i bob ymlusgwr. Enghraifft:
User-agent: Googlebot
- Noindex: Er nad yw'n rhan o'r protocol robots.txt safonol, mae rhai peiriannau chwilio yn deall a Noindex cyfarwyddeb yn robots.txt fel cyfarwyddyd i beidio â mynegeio'r URL penodedig.
Noindex: /non-public-page/
- Oedi cropian: Mae'r gorchymyn hwn yn gofyn i ymlusgwyr aros am gyfnod penodol o amser rhwng trawiadau i'ch gweinydd, sy'n ddefnyddiol ar gyfer gwefannau â phroblemau llwyth gweinydd.
Crawl-delay: 10
Sut i Brofi Eich Ffeil Robots.txt
Er ei fod wedi ei gladdu yn Consol Chwilio Google, mae consol chwilio yn cynnig profwr ffeiliau robots.txt.
Gallwch hefyd ailgyflwyno eich Ffeil Robots.txt trwy glicio ar y tri dot ar y dde a dewis Gofyn am Ailgopian.
Profi neu Ailgyflwyno Eich Ffeil Robots.txt
A ellir Ddefnyddio Ffeil Robots.txt i Reoli AI Bots?
Gellir defnyddio'r ffeil robots.txt i ddiffinio a AI gall bots, gan gynnwys ymlusgwyr gwe a botiau awtomataidd eraill, gropian neu ddefnyddio'r cynnwys ar eich gwefan. Mae'r ffeil yn arwain y botiau hyn, gan nodi pa rannau o'r wefan y caniateir iddynt neu na chaniateir iddynt gael mynediad iddynt. Mae effeithiolrwydd robots.txt o ran rheoli ymddygiad bots AI yn dibynnu ar sawl ffactor:
- Cadw at y Protocol: Mae'r rhan fwyaf o ymlusgwyr peiriannau chwilio ag enw da a llawer o bots AI eraill yn parchu'r rheolau a osodwyd
robots.txt
. Fodd bynnag, mae'n bwysig nodi bod y ffeil yn fwy o gais na chyfyngiad gorfodadwy. Gall bots anwybyddu'r ceisiadau hyn, yn enwedig y rhai a weithredir gan endidau llai gofalus. - Penodoldeb y Cyfarwyddiadau: Gallwch chi nodi cyfarwyddiadau gwahanol ar gyfer gwahanol bots. Er enghraifft, efallai y byddwch yn caniatáu i botiau AI penodol gropian eich gwefan tra'n gwahardd eraill. Gwneir hyn gan ddefnyddio'r
User-agent
gyfarwyddeb yn yrobots.txt
enghraifft ffeil uchod. Er enghraifft,User-agent: Googlebot
byddai'n nodi cyfarwyddiadau ar gyfer ymlusgo Google, traUser-agent: *
byddai'n berthnasol i bob bot. - Cyfyngiadau: Er bod
robots.txt
yn gallu atal bots rhag cropian cynnwys penodedig; nid yw'n cuddio'r cynnwys oddi wrthynt os ydynt eisoes yn gwybod y URL. Yn ogystal, nid yw'n darparu unrhyw fodd i gyfyngu ar y defnydd o'r cynnwys ar ôl iddo gael ei gropian. Os oes angen diogelu cynnwys neu gyfyngiadau defnydd penodol, efallai y bydd angen dulliau eraill fel diogelu cyfrinair neu fecanweithiau rheoli mynediad mwy soffistigedig. - Mathau o Bots: Nid yw pob bot AI yn gysylltiedig â pheiriannau chwilio. Defnyddir botiau amrywiol at wahanol ddibenion (ee, cydgasglu data, dadansoddeg, crafu cynnwys). Gellir defnyddio'r ffeil robots.txt hefyd i reoli mynediad ar gyfer y gwahanol fathau hyn o fotiau, cyn belled â'u bod yn cadw at y REP.
Mae adroddiadau robots.txt
Gall ffeil fod yn arf effeithiol ar gyfer nodi eich dewisiadau o ran cropian a defnyddio cynnwys gwefan gan AI bots. Fodd bynnag, mae ei alluoedd yn gyfyngedig i ddarparu canllawiau yn hytrach na gorfodi rheolaeth mynediad llym, ac mae ei effeithiolrwydd yn dibynnu ar gydymffurfiaeth y bots â'r Protocol Gwahardd Robotiaid.
Mae'r ffeil robots.txt yn arf bach ond nerthol yn yr arsenal SEO. Gall ddylanwadu'n sylweddol ar welededd gwefan a pherfformiad peiriant chwilio pan gaiff ei ddefnyddio'n gywir. Trwy reoli pa rannau o wefan sy'n cael eu cropian a'u mynegeio, gall gwefeistri gwe sicrhau bod eu cynnwys mwyaf gwerthfawr yn cael ei amlygu, gan wella eu hymdrechion SEO a pherfformiad gwefan.