Skrapningen av innehållet (aka webbskrapning, webbskörd, webbdatautvinning etc.) är förfarandet för att kopiera data från en webbplats. "Skraporna" (vindrutetorkare) innehåll är personerna eller programvaran som kopierar data. Webbskrapning är inte en dålig sak.

I själva verket är alla webbläsare i princip innehållsskrapor. Det finns många legitima syften för att göra innehållsskrapning, till exempel webbindexering för sökmotorer.

Se vår artikel på Hur man hindrar Google från att indexera din WordPress-blogg

Den verkliga oro är om skraparna av innehåll på din webbplats är skadliga eller inte. Konkurrenter kanske vill stjäla ditt innehåll och publicera det som tillhör dem. Om du kan berätta för legitima användare från skurkar, har du en bättre chans att skydda dig själv. Den här artikeln förklarar grunderna för webbskrotning samt vissa metoder för att bli av med det (eller åtminstone minska deras betydelse).

Men tidigare, om du aldrig har installerat WordPress-upptäckt Hur man installerar en Wordpress blogg i fyra steg et Hur man hittar, installera och aktivera en Wordpress tema på din blogg 

Tillbaka till varför vi är här.

Typer av innehåll skrapor

Det finns många olika sätt för innehållsskrapor att ladda ner data. Det är viktigt att känna till de olika metoderna och tekniken de använder. Metoderna sträcker sig från lågteknologi (en person manuellt kopiera och klistra in innehåll) till sofistikerade robotar (automatiserad programvara som kan simulera mänsklig aktivitet i en webbläsare). Här är en sammanfattning av vad du kan göra:

  • Spindlar: Webbgenomsökning är en stor del av hur innehållsskrapor fungerar. En spindel som Googlebot börjar med att plocka upp en enda webbsida och gå från länk till länk för att ladda ner webbsidor.
  • skalskript: Du kan använda Linux Shell för att skapa innehållsskrapor med skript som GNU Wget för att ladda ner innehåll.
  • HTML-skrapa: de liknar skalskript. Denna typ av skrapa är mycket vanlig. Det fungerar genom att få HTML-strukturen på en webbplats för att hitta data.
  • Visningsskärmar: En skärmtorkare är ett program som samlar in data från en webbplats genom att efterlikna beteendet hos en mänsklig användare som använder en dator för att surfa på Internet.
  • mänsklig kopia: Det är här en person manuellt kopierar innehåll från din webbplats. Om du någonsin har publicerat online kanske du har märkt att plagiering är utbredd. Efter att den första smickret försvinner passar verkligheten att någon tjänar på ditt jobb.

Det finns flera sätt att göra detsamma. De kategorier av skrapor som anges ovan är inte en uttömmande lista. Dessutom finns det mycket överlappning mellan kategorierna.

Läs också vår artikel om Hur och varför att göra en kvalitativ revision av ditt innehåll

Hur du skyddar din blogg

Skydda en blogg från innehållsskrapor

1. Betygsätt begränsning och blockering

Du kan bekämpa många bots genom att upptäcka problemet först. Det är typiskt för en automatiserad robot att skräppost din server med ett exceptionellt stort antal förfrågningar. Prisbegränsning, som namnet antyder, begränsar serverförfrågningar från en enskild klient genom att ställa in en regel.

Du kan göra saker som att mäta millisekunder mellan förfrågningar. Om interaktionen med din webbplats är för snabb så vet du att det är en bot. Därefter blockera denna IP-adress. Du kan blockera IP-adresser baserat på ett antal kriterier, inklusive deras ursprungsland.

2. Registrering och anslutning

Registrering och inloggning är ett populärt sätt att hålla innehåll borta från nyfikna ögon. Du kan hindra utvecklingen av robotarna. Allt du behöver göra är att göra tillgång till ditt innehåll villkorat av en anslutning. Grunderna för anslutningssäkerhet gäller här. Tänk på att sidor som kräver registrering och inloggning inte kommer att indexeras av sökmotorer.

3. Honeypots och falska data

Inom datavetenskap är "honeypots" virtuella stingoperationer. Du avrundar potentiella angripare genom att sätta fällor med en smekmånad för att upptäcka trafik från innehållsskrapor. Det finns ett oändligt antal sätt att göra detta.

Du kan till exempel lägga till en osynlig länk på din webbsida. Skapa sedan en algoritm som blockerar IP-adressen till klienten som klickade på länken. Mer sofistikerade honungskrukor kan vara svåra att installera och underhålla. Den goda nyheten är att det finns många open source Honeypot-projekt där ute. Kolla in det här fantastiska lista över fantastiska smekmånad på github.

4. Använd en CAPTCHA

Captcha betyder " Helt automatiserad Public Turing test för att berätta datorer och människor Apart i grund och botten ett test för att se skillnaden mellan människor och robotar. Captchas kan vara tråkiga, men de är också användbara. Du kan använda en för att blockera områden som du tror att en bot kan vilja rikta in sig på, som en e-postknapp på din kontakt~~POS=TRUNC formulär~~POS=HEADCOMP. Det finns många bra Captcha-plugins tillgängliga på WordPress, inklusive " captcha Från Jetpack.

Upptäck också några premium WordPress-plugins  

Du kan använda andra Wordpress plugins för att ge ett modernt utseende och för att optimera hanteringen av din blogg eller hemsida.

Vi erbjuder dig här några premium WordPress-plugins som hjälper dig att göra det.

1. Stripe for Arforms

ARForms har ett nytt tillägg som accepterar betalningar via Stripe-betalningsgateway. Det kallas ”ARForms Stripe”. Den senare integrerar formulärinmatningar och betalningar i en enda process.

Strip för arforms

du kan fakturera kunder med ett dynamiskt belopp direkt efter att ARForms formulär har skickats in.

Läs också vår artikel om Använda rand på WooCommerce och Easy digital hämtning

Du behöver bara skapa ett formulär med ARForms, konfigurera det med Stripe och allt är gjort! Du kan ställa in betalning med Stripe på nolltid.

Ladda ner | demo | webbhotell

2.AX Social Stream

Om du vill visa flera sociala medie-flöden på din webbplats, sedan plugin Wordpress socialstyrelsen låter dig göra detta genom att ge dig sex sätt att se din kontoaktivitet. Du kommer också att få stöd för 17 sociala nätverk och flera anpassningsbara layouter.

Ax social stream wordpress plugin

Dess funktioner är bland annat: 6 olika matningsvisningslägen, stöd för en stor majoritet av sociala nätverk, helt responsiv layout, stöd för reklambanners, Flerspråkigt stöd, en temahanterare, detaljerad dokumentation, etc ...

Ladda ner | demo | webbhotell

3. Interaktiva världskartor

Interaktiva världskartor hjälper dig att skapa så många kartor som du vill, kontinenter, länder eller regioner ... och detta med interaktiva och färgade markörer.

Kartor Interactive World

Den är kompatibel med de senaste versionerna av WordPress och passar perfekt med Plugin för Visual Composer.

Upptäck vårt 8 WordPress plugins för att anpassa utseendet på din webbplats

Tack vare interaktiva världskartor kan du visa flera typer av regioner, t.ex. en karta över hela världen, en kontinent eller en subkontinent, ett land och mycket mer.

Ladda ner demo | webbhotell

Andra rekommenderade resurser

Vi inbjuder dig också att konsultera resurserna nedan för att gå vidare i greppet och kontrollen av din webbplats och blogg.

Slutsats

Där! Det var allt för den här handledningen, jag hoppas att den hjälper dig att skapa en praktisk att-göra-lista för att effektivt skydda din Wordpress bloggKänn dig fri att dela tipset med dina vänner på dina sociala nätverk.

Du kommer dock också att kunna konsultera vår medel, om du behöver fler element för att genomföra dina projekt för att skapa webbplatser, genom att konsultera vår guide om WordPress blogg skapande.

Men under tiden berätta om din commentaires och förslag i det dedikerade avsnittet.