Semalt: Cad é Googlebot?



  1. Réamhrá
  2. Cad é Googlebot?
  3. Cén fáth ar chóir go mbeadh baint ag duine le Googlebot?
  4. Cén fáth nach ndéanann Googlebot gach leathanach a chraobháil ar roinnt suíomhanna?
  5. Conas do shuíomh a bharrfheabhsú chun buiséad Googlebot a uasmhéadú
  6. Conclúid

Réamhrá

An bhfuil a fhios agat conas a aimsíonn Google acmhainní do do chuardach? Mar a chreidtear go forleathan, ní spiorad eolach é Google a bhfuil a fhios aige gach ábhar ar líne. Ní síceach de chineál éigin é a bhfuil a fhios aige cá bhfuil an freagra cruinn ar do cheist.

Cosúil le gach inneall cuardaigh eile, tá bogearraí aige a théann trí billiúin leathanach (agus suíomhanna) gach soicind chun faisnéis a bhailiú; luach an ábhair agus a ábhar a bhaint amach. Mar sin nuair a dhéantar cuardach, tarraingítear an freagra ó na leathanaigh sin - cosúil le leabharlann.


Fuaimeann sé go leor cosúil le Sinsearach, agus sin toisc go bhfuil baint mhór aige leis. Nuair a dhéantar suíomh a bharrfheabhsú go héifeachtach, feiceann Google an suíomh go gasta, léann sé trína leathanaigh, agus cuireann sé suas é nuair a dhéantar cuardaigh gaolmhara ar an inneall cuardaigh.

Ach ní tharlaíonn sé seo do gach leathanach ar shuíomh, ag déanamh roinnt leathanaigh dofheicthe don domhan. Cén fáth a dtarlaíonn sé seo? Agus cad is féidir a dhéanamh ina choinne (go háirithe i gcás leathanaigh an-tábhachtach)? Seo treoir a thugann mionsonraí faoi crawler láithreán gréasáin Google (Googlebot), cén fáth nach ndéanann sé a dhóthain leathanaigh a chraobháil, agus conas is féidir le húinéir láithreán gréasáin barrfheabhsú láithreán gréasáin agus Sinsearach a úsáid chun buiséad crawling Googlebot a uasmhéadú.

Cad é Googlebot?



Damhán alla! Crawler! Is ainmneacha coitianta iad seo a thugtar don Googlebot. Tá sé seo toisc go n-oibríonn sé ar an mbealach sin. Cruthaítear an bogearra chun crawláil agus breathnú trí billiúin leathanach suíomhanna Gréasáin a foilsíodh don phobal.

Sin ceart - má fhanann suíomh Gréasáin príobháideach, níl aon bhealach ann gur féidir le Googlebot scanadh trína leathanaigh, a mheabhrú nach bhfuil an damhán alla síceach. Ní leanann sé ach naisc leathanaigh (ó leathanach amháin go leathanach eile), ansin leanann sé ar aghaidh le próiseáil sonraí. Tar éis é seo a chríochnú, tiomsaítear an fhaisnéis ansin in innéacs (is furasta cuimhneamh air mar leabharlann nó stór Goggle).

Mar gheall ar na bogearraí seo a bheith i láthair, is féidir le Google faisnéis dar luach níos mó ná milliún ghigibheart (GB) a thiomsú agus a charnadh i níos lú ná an dara ceann (ceart go leor - sin draíocht anois). Ansin ón innéacs seo a nuashonraítear go rialta, tarraingíonn Google amach acmhainní do gach cuardach ar líne ar dheasc agus ar ghléas soghluaiste.

Cén fáth ar chóir duine a chur ar Googlebot?

Tá baint mhór ag crawling Googlebot le Sinsearach láithreán gréasáin (barrfheabhsú inneall cuardaigh). Is é croílár iomlán an damháin alla faisnéis a bhailiú ó leathanaigh láithreáin ionas gur féidir leis an leathanach a thaispeáint mar cheann de na torthaí cuardaigh ar líne nuair a dhéantar cuardach ar ábhair bhainteacha. Dá bhrí sin, nuair a bhíonn Googlebot ag crawláil an chuid is mó de leathanaigh an láithreáin i gcónaí, beidh infheictheacht mhéadaithe ann a fhágfaidh go mbeidh níos mó tráchta láithreáin ar an leathanach sin (atá ar cheann de na haidhmeanna ceart?).

Úsáid an léaráid seo:

Tá suíomh Gréasáin ag X le leathanach ar an ábhar: Sinsearach gairmiúil do láithreáin ghréasáin. Agus déanann Y cuardach ar Sinsearach láithreán gréasáin. Má tá Googlebot tar éis crawled trí leathanach X ar SEO agus é a innéacsú, bheadh ​​sé ar cheann de na torthaí a nochtfaidh torthaí cuardaigh Google. Agus tharlódh an rud céanna maidir le cuardaigh gaolmhara eile a dhéantar fiú má tharlaíonn sé seo céad uair in aghaidh an lae ar fud an domhain.

Tabhair faoi deara go bhfuil tosca eile ag baint leis seo, mar shampla struchtúr maith suíomh Gréasáin, uaireanta in-athlódáilte, ualaigh thapa. Ach ach Saineolaí Sinsearach is féidir leis a chinntiú go ndéantar iad seo i gceart agus go dtaispeántar leathanach láithreáin ar an gcéad leathanach de thorthaí cuardaigh Google.


Cén fáth nach ndéanann Googlebot gach leathanach a chraobháil ar roinnt Láithreán?

Le linn ceann de na huaireanta oifige Sinsearach ag Google, cuireadh ceist maidir le cén fáth nach raibh Googlebot ag crawláil a dhóthain leathanach ar roinnt suíomhanna. Foilsítear os cionn na céadta billiún leathanach go poiblí don suíomh Gréasáin. Foilsíonn daoine leathanach nua don fhreastalaí gach lá, rud a chiallaíonn níos mó leathanaigh le haghaidh Googlebot a innéacsú. Uaireanta, áfach, ní oibríonn an bot mar a bhí súil leis; Is é sin; breis agus milliún GB faisnéise a charnadh i níos lú ná an dara ceann. Tá cúiseanna éagsúla leis seo.

Ar dtús, d’fhéadfadh sé a bheith go bhfuil an iomarca ábhar, leathanaigh, agus suíomhanna Gréasáin ar líne le hinnéacsú. Agus tá cuid acu ar cháilíocht íseal, tá luas luchtaithe láithreáin mall ag cuid eile, agus d’fhéadfadh go mbeadh ábhar nach mbaineann le hábhar ag an gcuid eile le struchtúr casta láithreáin (nó aon rud eile a oibríonn i gcoinne eispéireas maith úsáideora). Sin é an fáth gur chruthaigh Google straitéis chun leathanaigh ghréasáin ar ardchaighdeán a innéacsú agus leathanaigh ar chaighdeán níos ísle a eisiamh. Ar an mbealach seo, is féidir na leathanaigh a scagadh agus a laghdú (in ionad gach leathanach a innéacsú ar líne - leathanaigh luachmhara agus leathanaigh neamhluacha araon).

Ach ní fhreagraíonn an méid thuas an cheist go hiomlán: Cén fáth nach ndéanann Googlebot crawl ar gach suíomh? Ina ionad sin is í an cheist spéise ná cén fáth nach ndéanann Googlebot na leathanaigh go léir (nó a ndóthain leathanach) a chraobháil ar shuíomh. Agus tá dhá fhreagra air seo. An freagra fada agus an freagra gairid:

An Freagra Gearr

Ceanglaíonn Google méid áirithe acmhainní agus ama le crawling gach suíomh in aghaidh an lae. Tugtar buiséad crawl láithreáin air seo. Dá bhrí sin, déanann an bot a chuid oibre ag crawláil agus ag innéacsú laistigh den bhuiséad seo. Agus mar sin, maidir le suíomh Gréasáin le breis agus deich míle leathanach, ní dhéanfaí gach leathanach a innéacsú.

Tá níos mó leis seo, áfach, rud a thugann an freagra fada dúinn:

An Freagra Fada


Is é an buiséad crawl an rud a chinneann líon na leathanach is féidir leis an Googlebot a chraobhscaoileadh agus a innéacsú in aghaidh an láithreáin gach lá. Ach mar a luadh cheana, tá a lán eile leis seo. Cinneann roinnt fachtóirí luas an damháin alla agus é ag crawláil trí gach láithreán laistigh den bhuiséad crawl. Déan ciall? Ciallaíonn sé, cé gur chruthaigh an buiséad teorainn, gur féidir le roinnt fachtóirí luas an bot a bhrostú nó a mhoilliú. Ina measc tá:
  1. Freastalaí Mall: Má tá an t-am freagartha do fhreastalaí an-mhall, féadfaidh sé an ráta ag a dtéann an bot a chraobháil trí gach leathanach laistigh den bhuiséad crawl. Is féidir le húinéirí láithreán gréasáin iad seo a sheiceáil ina dtuarascáil stats crawl. Comhairlítear duit nach am freagartha maith é aon rud os cionn 300 milleasoicind.
  2. Óstach Freastalaí Suíomh Gréasáin: Má dhéantar suíomh Gréasáin a óstáil ar fhreastalaí roinnte, féadfaidh sé seo an ráta ag a ndéantar gach leathanach a sheirbheáil ar Google a mhoilliú le linn crawlála. Tá sé seo toisc go bhféadfadh suíomhanna eile ar an bhfreastalaí céanna é a mhoilliú trí acmhainní móra a úsáid. Tá sé níos measa fós nuair a bhíonn an freastalaí céanna ag óstáil go leor suíomhanna.
  3. Bots Rouge: Is bots eile iad seo ar féidir leo seasamh ar an mbealach, gníomhartha Googlebot a bhac, nó a mhoilliú. Is féidir leo teacht i bhfoirmeacha éagsúla agus uaireanta, teastaíonn cúnamh gairmiúil ó shuíomh Gréasáin chun gníomhartha na róbónna seo a bhainistiú agus a rialú.
  4. Crawlability an Láithreáin Ghréasáin: Seo an méid rochtana atá ag crawler ar leathanaigh uile an láithreáin ghréasáin. Nuair a bhíonn rochtain éasca ag na bogearraí ar ábhar an láithreáin, dhéanfaí go leor leathanaigh a chrapadh agus a innéacsú laistigh den bhuiséad crawl.

Conas Do Láithreán a Optamú Chun Buiséad Googlebot a Uasmhéadú


Sa chuid roimhe seo, phléamar na tosca a chinneann cé chomh tapa (nó cé chomh mall) a chraolann Googlebot leathanach. Ach tá níos mó ná mar is féidir le duine a dhéanamh chun an méid leathanaigh a théann an bot laistigh den bhuiséad a uasmhéadú. Go hachomair, seo cúpla rud is féidir le húinéir láithreán gréasáin a dhéanamh chun an méid leathanaigh a dhéanann Googlebot a chraobhscaoileadh agus a innéacsanna laistigh den bhuiséad crawl in aghaidh an lae a uasmhéadú.
  1. Léarscáil suímh a fhorbairt: Seo ceann de na rudaí is féidir a dhéanamh chun cabhrú le Googlebot crawling trí shuíomh níos tapa. Is féidir léarscáil suímh a shuiteáil, a ghiniúint ó ghineadóir léarscáil an láithreáin, nó a chruthú ón tús.
  2. Infheistiú in eagrú an láithreáin: Baineann sé seo leis an gcaoi a ndéantar láithreán gréasáin a struchtúrú agus le leathanaigh a chatagóiriú laistigh de shuíomh. Nuair a bhíonn suíomh struchtúrtha ionas gur féidir le cuairteoirí a mbealach a thuiscint agus a nascleanúint go héasca, tá dóchúlacht ard ann go mbeidh sé éasca ag Googlebot dul tríd.
  3. Optamú an láithreáin ghréasáin: Seo achoimre ar na pointí go léir a luaitear thuas. Nuair a dhéantar suíomh Gréasáin a bharrfheabhsú i gcónaí (ar an mbealach ceart), déanfar comhéadan an láithreáin ghréasáin a struchtúrú i gceart, agus cruthófar léarscáil an láithreáin. I measc rudaí eile tá smacht ar fhachtóirí a chuireann bac ar chrawláil (mar robots.txt), barrfheabhsú teidil, inléiteacht ábhair, luach an ábhair, agus go leor eile. Cuideoidh optamú suíomh Gréasáin i gceart le Googlebot scanadh trí leathanaigh a leithéid de shuíomh níos tapa.

Conclúid

Is féidir Googlebot a fheiceáil mar róbat beag idirlín ag obair do Google. Téann sé timpeall ar leathanaigh a fháil ón bhfreastalaí gréasáin trí naisc chuig láithreáin ghréasáin. Ansin féachann sé trí gach leathanach agus cuireann sé leis an mbailiú faisnéise innéacsaithe. Mar gheall ar roinnt fachtóirí agus athróg, áfach, ní féidir leis an bot dul trí leathanaigh uile gach láithreáin (i ndáiríre, uaireanta, ní leor é). Agus de na tosca agus na réitigh go léir a luaitear, is é an réiteach is éasca cuideachta ghairmiúil a fhostú mar Semalt is féidir leis sin gach a theastaíonn a dhéanamh ar an mbealach ceart agus ag an am ceart chun a chinntiú go ndéantar leathanaigh thábhachtacha ar do shuíomh Gréasáin a chrapadh agus a innéacsú - mura bhfuil na leathanaigh uile.

mass gmail