首页程序员资讯正文

我要投稿

PHP防爬虫：屏蔽robots

admin 程序员资讯

2023-06-19 0 319

原副标题：PHP防食腐：过滤robots

1.甚么是食腐robots

食腐robots是一类智能化流程，它被用作从网络上搜集重要信息。浏览器是最常用的食腐众所周知。但，除了浏览器以外，除了许多其它类别的食腐，它可能会对你的中文网站导致严重威胁。

2. robots.txt文档是甚么

robots.txt文档是两个文本文档，它说食腐甚么样网页能被截取，甚么样网页不假如被截取。这个文档一般来说放到中文网站的子目录下。

3.怎样过滤食腐robots

要过滤食腐robots，最简单的方式是在中文网站子目录下建立两个名叫”robots.txt”的文档，并在里头加进准则。比如说，假如你想过滤大部份的爬虫，则能在文档中加进附注：

User-agent:*

Disallow:/

这意味著大部份的食腐都不假如出访你的中文网站。

4. PHP怎样辨识robots

PHP能透过$_SERVER[HTTP_USER_

5.怎样采用PHP过滤食腐robots

要采用PHP过滤食腐robots，能在标识符中加进附注：

$user_agent =$_SERVER[HTTP_USER_AGENT];

if (preg_match(/bot|crawl|slurp|spider/i,$user_agent)){

header(“HTTP/1.1 403 Forbidden”);

exit();

}

这段标识符会检查用户代理重要信息中是否包含”bot”、”crawl”、”slurp”或”spider”等关键字。假如包含，则返回403 Forbidden响应码，并结束流程执行。

6.怎样测试是否过滤成功

为了测试是否过滤成功，能采用一些在线工具，比如说Google Search Console。在该工具中，你可以测试你的robots.txt文档是否被正确解析，并查看浏览器对你的中文网站的出访情况。

7.注意事项

在过滤食腐robots时，需要注意以下几点：

-不要采用robots.txt文档来过滤机密重要信息，因为那个文档不是安全的。

-不要采用robots.txt文档来过滤敏感重要信息，因为它可能会被其它人看到。

-不要采用robots.txt文档来过滤不希望被浏览器收录的网页，因为这并不能保证浏览器不会收录这些网页。

8.总结

透过本文的介绍，我们了解了怎样采用PHP过滤食腐robots。在实际开发中，需要根据自己的需求和情况选择适当的方式来保护中文网站的安全。

收藏 (0) 点赞 (0)

admin

PHP防爬虫：屏蔽robots

上一篇： PHP异步提交采集，数据更快捷

PHP防爬虫：屏蔽robots

下一篇： PHP程序员薪资竟然垫底、PG取代MySQL成为最流行数据库

相关文章

Adobe Prelude CC2022Pl视频编辑软件中文直装版

Adobe Prelude CC2022Pl视频编辑软件中文直装版

程序员资讯

admin

2年前 1,927

萌新小白的提问，影视剪辑需要学哪几个软件？

萌新小白的提问，影视剪辑需要学哪几个软件？

程序员资讯

admin

2年前 2,115

怎样给自己的视频换背景？试试视频编辑软件

怎样给自己的视频换背景？试试视频编辑软件

程序员资讯

admin

2年前 2,416

(超清)2023 React 18 系统入门进阶实战《欢乐购》

(超清)2023 React 18 系统入门进阶实战《欢乐购》

程序员资讯

admin

2年前 2,095

猜你喜欢

Adobe Prelude CC2022Pl视频编辑软件中文直装版 2023-09-06
萌新小白的提问，影视剪辑需要学哪几个软件？ 2023-09-06
怎样给自己的视频换背景？试试视频编辑软件 2023-09-06
(超清)2023 React 18 系统入门进阶实战《欢乐购》 2023-09-06
视频截取软件有哪些？带你了解这三个视频编辑软件 2023-09-06
服务器有哪几种类型呢？ 2023-09-06
视频编辑培训，制作视频用哪个软件好？ 2023-09-06
云服务器是什么？你需要知道这些基本知识 2023-09-06
Apple Motion for Mac 苹果电脑视频编辑软件 2023-09-06
“中药房配酸梅汤”火了，医院服务器被挤爆，网友：更适合中国宝宝体质 2023-09-06

发表评论

暂无评论

官方客服团队

为您解决烦忧 - 24小时在线专业服务

联系官方团队在线提交工单