使用Nginx过滤网络爬虫

2018-10-08 18:19:26 5050

其实Nginx可以非常容易地根据User-Agent过滤请求,我们只需要在需要URL入口位置通过一个简单的正则表达式就可以过滤不符合要求的爬虫请求:


    ...

    location / {

        if ($http_user_agent ~* "python|curl|java|wget|httpclient|okhttp") {

            return 503;

        }

        # 正常处理

        ...

    }


提交成功!非常感谢您的反馈,我们会继续努力做到更好!

这条文档是否有帮助解决问题?

非常抱歉未能帮助到您。为了给您提供更好的服务,我们很需要您进一步的反馈信息:

在文档使用中是否遇到以下问题: