Einfach alle Bots bis auf Google in der robots.txt sperren?

muelltonne@feddit.de · 4 months ago

Einfach alle Bots bis auf Google in der robots.txt sperren?

ThermoToaster@exng.meme · 4 months ago

Ich denke den Datensammlern ist die robots.txt herzlich egal. Schaden sollte es jedoch nicht.

taladar@feddit.de · 4 months ago

Spricht überhaupt nichts dagegen. Allerdings wùrde ich nicht erwarten dass sich alle daran halten.

Kissaki@feddit.de · 4 months ago

Dein Denken ist korrekt. Du scheinst dir der Nachteile und Konsequenzen bewusst.

In dem Kontext zu erwähnen ist noch, dass die robots.txt auch keine Garantie ist. Wer die Anweisungen ignoriert oder gar nicht erst abfragt wird dadurch nicht abgefangen.

PlexSheep@feddit.de · 4 months ago

Wenn du es drauf anlegen willst kannst du im robots.txt eine Seite verbieten. Wenn ein crawler dennoch auf diese zugreift kannst du ihn mit müll zu spucken, dann verlieren die Daten aktiv an wert. Alternativ einfach alle IPS blocken die drauf zugreifen.