How do I detect bots programmatically(如何以编程方式检测僵尸程序)
问题描述
我们有这样一种情况,我们记录访问量,访问者在页面点击上,而僵尸程序阻塞了我们的数据库。我们不能使用验证码或其他类似的技术,因为这甚至是在我们要求人工输入之前,基本上我们是在记录页面点击量,我们只想记录人工的页面点击量。
是否有已知的bot IP列表?检查已知的bot用户代理是否工作?
推荐答案
没有万无一失的方法可以捕获所有僵尸程序。如果有人需要,机器人可以像真正的浏览器一样工作。
大多数严重的bot在代理字符串中清楚地标识自己,因此通过已知bot的列表,您可以筛选出它们中的大多数。您还可以将一些HTTP库默认使用的代理字符串添加到列表中,以便从甚至不知道如何更改代理字符串的人那里捕获僵尸程序。如果您只记录访问者的代理字符串,您应该能够挑选出要存储在列表中的访问者。
您还可以通过在页面上放置一个隐藏链接来创建"坏机器人陷阱",该链接指向在robots.txt文件中被过滤掉的页面。严重的机器人不会跟随该链接,并且人类无法单击它,因此只有不遵守规则的机器人才会请求文件。
这篇关于如何以编程方式检测僵尸程序的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!
本文标题为:如何以编程方式检测僵尸程序


基础教程推荐
- 错误“此流不支持搜索操作"在 C# 中 2022-01-01
- 将事件 TextChanged 分配给表单中的所有文本框 2022-01-01
- 如何动态获取文本框中datagridview列的总和 2022-01-01
- 首先创建代码,多对多,关联表中的附加字段 2022-01-01
- 是否可以在 asp classic 和 asp.net 之间共享会话状态 2022-01-01
- 经典 Asp 中的 ResolveUrl/Url.Content 等效项 2022-01-01
- 在 VS2010 中的 Post Build 事件中将 bin 文件复制到物 2022-01-01
- JSON.NET 中基于属性的类型解析 2022-01-01
- 从 VS 2017 .NET Core 项目的发布目录中排除文件 2022-01-01
- 全局 ASAX - 获取服务器名称 2022-01-01