Back to Question Center
0

Semalt Li Bots, Spiders û Crawlers Bi Çawa Pêdivî Bersaziyê pêşkêş dike

1 answers:

Ji bila pirtûkên lêgerînê yên malpera çêtirîn, pelê .htaccess file ji bo webmasters botsayên taybetî yên ku ji malpera xwe re bigihîjin asteng bikin. Ji bo rêbazên van van robotan rawestînin ji pelê re robot.txt. Lê belê, Ross Barber, Semalt Rêveberê Serkeftinê Serkeftî, diyar dike ku wî çend cerdevan dît ku ev daxwaz nade. Yek ji rêbazên herî baş e ku pelê hhtaccess bikar bînin ku ew ji naveroka xwe veşartinê rawestînin.

van bendên çi ne?

Ew cureyek nivîsbarî ji hêla engineeyên lêgerînê ve tê bikaranîn ku naveroka nû ya ji înternetê ji bo armancên veguhastinê jêbirin.

Ew karên jêrîn kar dikin:

  • Rûpelên malperê yên ku we girêdayî ye
  • koda HTML-ê ji bo çewtiyên xwe binêrin
  • Ew pirtûka kîjan malperên ku hûn girêdankirinê diparêzin û bibînin ka kîjan rûpelên malperê bi naveroka we re girêdan
  • Ew materyalên we

Lêbelê, hinek hûrsên xerab in û lêgerîn ji bo navnîşên nameyên xwe û navnîşên xwe yên ku lê bi gelemperî têne ku hûn bikarhênerên nedixwest an jî spî bişînin. Hinek din jî ji bo koda ewlehiyê di ewlehiya xwe de dibînin.

Pêdivî ye ku hewceyên krawîlên malperê bigire?

Beriya ku pelê bikaranîna hacaccessê, hûn hewce nebin ku van tiştan kontrol bikin:

1. Divê we malpera xwe li ser servera Apache Apache bike. Niha, her weha şîrketên mêvandar ên ku di karê xwe de di nîvê xwe de baş bûn, hûn dakêşiya pelê bidin.

2. Hûn divê hûn bi we re malperên têketin yên rawestî yên malpera we yên ku hûn rûpelên malperên xwe diçin ka hûn dikarin bibînin.

Navnîşan tune ku tu awayî ku hûn ê nikarin hemû botsên zehfî yên asteng bikin, heta ku hûn hemî wan bifikirin, heta ku hûn ji bo we re bibînin. Botshek nû her roj dihatin, û pîrên guhertin. Riya herî herî çêtir e ku ji bo koda xwe ewle bîne û ji bo boteyên ku ji te re spas bike dijwar e.

botên nasnameyê

Bot dikarin di navnîşana IP-an an ji "Rêveberiya Agahiya String," an ku ew di nav HTTP de bişînin têne naskirin. Wek mînak, Google bi "Googlebot" tê bikaranîn.

Heke hûn bi navê wê botê ye ku hûn dixwazin dixwazin bikar anîn .htaccess (11)

Rûyek din e ku ji pelên hemû pelan têketin ji bo vekirina pelê û ew bikarhênerê nivîskî nivîskî vekin vekin. Cihê wan li ser veguherîna pergala guhertina serverê li ser guhartina xwe bigire. Heke hûn nikarin wan nabînin, lêgerîn alîkarî ji mêvandarê malperê.

Heke hûn dizanin ka çi rûpelê serdana, an wextê serdana, ew bi hêsantirek botê re were. Hûn dikarin pelê têketinê bi van parameteran bigerin.

Dema ku hûn hewceyên ku hûn hewce ne bisekinin asteng bikin; Hûn dikarin di nav hhtaccess de pelan de bibin. Ji kerema xwe bikişîne ku blok blovajî ne bes e ku wê raweste bike. Ew dikare bi IP-ê an navnîşê nû ve hatî.

Çawa ji wan re asteng bikin

Kopiyek pelê hilbijêre. Heke hewce be

Method 1: astengkirina IP

Vê kodê snippet bloya bloya IP-ê Bikaranîna IP-IP-197.0.0.1

Daxuyaniya Daxuyaniya, Allow

Deny ji 197.0.0.1

Pîvana yekemîn tê wateya ku server dê hemû daxwazên bendên ku hûn diyar kirin û hemî hiştin tevlihev bikin.

Peyva duyemîn serverê dide ku ji bo 403 issue: pela qedexe

Method 2: Astengkirina ji hêla agentên bikarhêner

Tiştek herî zehf e ku bikarhênerê veguherîna Apache ya Apache

RewriteEngine On

RewriteCond% {HTTP_USER_AGENT} BotUserAgent

RewriteRule. - [F, L]

Rêza yekemîn piştrast dike ku modulek nûvek vekirî ye. Her du şert e ku desthilatdar e ku destûrê ye. Di "4" de "F" di nav serverê de dibêje ku 403 vegerin: Dema ku "L" tête qedexekirin tê wateya ev rêbazek dawîn e.

Hûn dê pelê hhtaccessê ji bo servera xwe re barkirin û li ser heyî ya nû bike. Bi wextê, ​​hûn ê hewceyê ku IP-ê botê nû bikin. Heke ku hûn xeletiyek çêbikin, tenê barkirinê ya ku hûn çêkirî barkirin.

November 29, 2017
Semalt Li Bots, Spiders û Crawlers Bi Çawa Pêdivî Bersaziyê pêşkêş dike
Reply