首頁>>網站建設
相信每位站長都很煩那些垃圾蜘蛛和垃圾ip,總是使勁的爬自己的網站,以SemrushBot、SM-G900P等垃圾蜘蛛UA和某個特別熟悉的安卓UA(SM-G900P)為例,它們一天天爬個不停,把服務器cpu爬得通紅都不放過。
下面以寶塔為例,教大家怎么簡單的快速屏蔽垃圾的蜘蛛和垃圾ip。
屏蔽國外蜘蛛我們只需要分三步:
1、打開寶塔的網站管理-點擊你要屏蔽的網站的設置;
2、彈窗出來后點擊偽靜態;
3、復制下方的代碼到里面第一行;
if ($http_user_agent ~* (SemrushBot|DotBot|HttpClient|MJ12bot|SemrushBot|Barkrowler|AhrefsBot|PetalBot|BLEXBot|SM-G900P)) {return 403;}
操作成功的圖片如下:
在寶塔面板通過偽靜態屏蔽垃圾蜘蛛的方法
通過上面的一番操作對垃圾蜘蛛返回403錯誤提示,即可有效的屏蔽掉這些垃圾爬蟲了。
查看服務器日志發現,有很多國外的蜘蛛不停的抓取一些其他頁面,比如tag,許多ip段批量的不間斷的抓取,這導致小帶寬服務器壓力太大,訪問緩慢,百度蜘蛛就不再繼續抓取效驗直接告知錯誤,查詢后發現這些蜘蛛全是國外的各類型蜘蛛對于我們來說一點作用都沒有,簡直就是浪費帶寬,沒用就禁了它。下面說說方法,我也是網上查詢到的,看來是比較管用的
寶塔面板下使用方法如下:
1、找到文件目錄/www/server/nginx/conf文件夾下面,新建一個文件命名:agent_deny.conf 你也可以隨意起名,創建完文件后,點擊編輯這個文件,把下面的代碼放進去保存。
#禁止Scrapy等工具的抓取
if ($http_user_agent ~* (Scrapy|Curl|HttpClient)) { return 403; } #禁止指定UA及UA為空的訪問 if ($http_user_agent ~* "FeedDemon|Indy Library|Alexa Toolbar|AskTbFXTV|AhrefsBot|CrawlDaddy|CoolpadWebkit|Java|Feedly|UniversalFeedParser|ApacheBench|Microsoft URL Control|Swiftbot|ZmEu|oBot|jaunty|Python-urllib|lightDeckReports Bot|YYSpider|DigExt|HttpClient|MJ12bot|heritrix|Bytespider|Ezooms|Googlebot|JikeSpider|SemrushBot|^$" ) { return 403; } #禁止非GET|HEAD|POST方式的抓取 if ($request_method !~ ^(GET|HEAD|POST)$) { return 403; }
如圖:
2、找到網站設置里面的第7行左右 寫入代碼:
include agent_deny.conf;
添加完畢后保存,重啟nginx
如果你網站使用火車頭采集發布,使用以上代碼會返回403錯誤,發布不了的。如果想使用火車頭采集發布,請使用下面的代碼
#禁止Scrapy等工具的抓取 if ($http_user_agent ~* (Scrapy|Curl|HttpClient)) { return 403; } #禁止指定UA訪問。UA為空的可以訪問,比如火車頭可以正常發布。 if ($http_user_agent ~ "FeedDemon|Indy Library|Alexa Toolbar|AskTbFXTV|AhrefsBot|CrawlDaddy|CoolpadWebkit|Java|Feedly|UniversalFeedParser|ApacheBench|Microsoft URL Control|Swiftbot|ZmEu|YandexBot|jaunty|Python-urllib|lightDeckReports Bot|YYSpider|DigExt|HttpClient|MJ12bot|heritrix|Bytespider|Ezooms|Googlebot|JikeSpider|SemrushBot" ) { return 403; } #禁止非GET|HEAD|POST方式的抓取 if ($request_method !~ ^(GET|HEAD|POST)$) { return 403; }
猜你喜歡
- 2022-11-10 【官方文檔】百度搜索網站被黑防范指南
- 2022-11-03 【干貨必備】百度搜索優質內容指南
- 2022-08-01 百度隱藏“快照”功能:原因未知-百度快照沒了?
- 2022-06-20 淺析“百度搜索基礎信息設置規范”!
- 2022-06-15 SEO尷尬,有排名,沒流量,沒咨詢,怎么辦?
- 2022-05-16 IE瀏覽器宣布6月16日退役 Edge瀏覽器將接棒
- 搜索
-
- 2022-11-17 全中國一共有多少IP地址?
- 2022-11-10 【官方文檔】百度搜索網站被黑防范指南
- 2022-11-10 PbootCMS 默認Sqlite數據庫···
- 2022-11-03 【干貨必備】百度搜索優質內容指南
- 2022-11-03 SEM投放前,需要做哪些準備?
- 2022-11-02 淺談代運營服務的商業模式
- 2022-11-01 SQlite刪除數據后DB大小無改變解決···
- 2022-11-01 在寶塔面板通過偽靜態屏蔽垃圾蜘蛛的方法
- 2022-10-31 制造業SEO,怎么做是正確的,高性價比!
- 2022-10-31 Unknown robot是什么蜘蛛?怎···
- 2022-10-26 win7/win10其他電腦無法訪問我的···
- 2022-10-24 中小企業打廣告去哪個平臺?一般選擇哪種推···
- 2019-11-01 Origin DNS error:使用百···
- 2020-12-01 一級域名好還是二級域名好?
- 2020-10-13 百度抓取診斷工具一直抓取失敗怎么辦?
- 2020-06-20 “401 - 未授權: 由于憑據無效,訪···
- 2019-12-09 域名解析后,網站返回狀態碼511應對方法
- 2021-01-06 百度移動端的搜索結果上線“踩頂”功能,對···
- 2020-09-03 element.style樣式的修改
- 2019-08-12 網站出現“403,服務器上文件或目錄拒絕···
- 2019-11-06 正確打開.db數據庫文件的兩種方式,避免···
- 2020-04-10 百度下拉框怎么刷?刷百度下拉框軟件原理及···
- 2020-10-20 UC神馬搜索怎么做快速排名優化
- 2020-09-27 css3實現一個div設置多張背景圖片
- 2021-04-08 合肥seo,不要再搞“內卷”了
- 2022-07-22 淺析,百家號“快排”的亂象叢生,希望百度···
- 2020-01-14 用快排做百度排名了,為啥關鍵詞還沒有上升···
- 2019-09-07 網站搜索優化操作中JS壓縮的流程問題的討···
- 2022-11-17 全中國一共有多少IP地址?
- 2020-01-08 頁面內容被百度放進底層索引庫,怎么起死回···
- 2020-02-27 跳槽時,如何才能爭取到更高的薪資?
- 2019-11-11 相同的SEO方法去提升同一個關鍵字,為何···
- 2020-05-26 js空鏈接點擊不跳轉
- 2021-06-10 打開首頁提示No input file ···
- 2019-07-10 偽靜態和靜態有什么區別?對SEO效果相同···
- 2020-08-31 不玩黑帽SEO就無法生存?有太陽的地方就···
- 熱門標簽
-
- Error 1016
- Origin DNS error
- 源DNS服務器錯誤
- element.style
- css
- .db文件
- 域名解析
- 別名解析
- CNME解析
- A記錄
- asp.net
- php
- jsp
- 開發語言對比
- 白名單
- 香港主機
- 主機白名單
- 寶塔
- 個人備案
- 企業備案
- 網站備案
- 字體大小
- 用戶體驗
- 錨點跳轉
- 500錯誤
- 301
- 301重定向
- 301永久重定向
- 虛擬主機
- 網站搭建
- 自適應網站
- web前端
- 移動端
- 響應式網站
- 網站被黑
- 后臺入侵
- 源碼安全
- 開源CMS
- 阿里云服務器
- 實例類型
- ftp
- flashfxp
- 織夢cms
- 偽元素選擇器
- 偽類選擇器
- CSS3
- js空鏈接
- 備案駁回
- 阿里云備案
- 域名備案
- 谷歌插件
- Chrome
- 百度轉碼
- 禁止轉碼
- 服務器流量
- 網站流量耗盡
- win10連接遠程服務器
- 網站建設
- 低成本網站
- 服務器空間
- 網站空間選擇
- 網站設計
- seo要點
- seo建站方案
- html標簽
- seo標簽
- 網站標簽
- 標簽優化
- 獨立ip主機
- seo服務器
- 網站安全
- dede
- 分頁樣式代碼
- 網站體驗設計
- 老年用戶
- X-Powered-By
- 0收錄
- 新域名收錄
- 網站收錄
- 營銷型網站
- 定制網站
- robots.txt
- javascript
- 編程語言
- 服務器穩定性
- 網站續費
- 蜘蛛
- 屏蔽蜘蛛
- PbootCMS
- sqlite
- mysql
- 數據庫