• Home
  • Python
  • Web Design
  • Db & SQL
  • Mac & Linux
  • Go & Ruby
  • Life & Work
  • Resume

禁止

禁止爬虫爬你的页面

by Liu Yue/2013-04-21
标签:   爬虫   页面   禁止

    众所周知,使用robots.txt文件可以对爬虫能否爬页面进行声明,但是这只是一个“君子协定”,有人遵守也有人不遵守,所以还需要对页面进行一个声明,加入meta代码<meta name="robots" content="noindex">     这样才能有效的对爬虫进行封禁,例如本站就是如此,但是这是一个双刃剑,禁止爬虫的同时,SEO就不那么友好了......

了解更多

社交内容平台

著作/出版物 北京航空航天大学出版社 ISBN:9787512442436

Tornado(龙卷风)编程实战

公众号

刘悦的技术博客公众号

标签云

正在加载...

随机文章

前端已死?全栈当立?取法于中,仅得其下。

2023-02-21

某公司技术经理媚上欺下,打工人应怼尽怼,嘤其鸣兮,求其友声!

2023-04-06

python3.7+Tornado5.1.1+Celery3.1+Rabbitmq3.7.16实现异步队列任务

2019-07-31

春秋笔法,微言大义,中山二院“癌症事件”情况说明解析

2023-11-09

使用Django2.0.4集成钉钉第三方扫码登录

2019-12-21

python花式读取大文件(10g/50g/1t)遇到的性能问题(面试向)

2019-07-12

基于NOSTR协议的“公有制”版本的Twitter,去中心化社交软件Damus用后感,一个极端走向另一个极端

2023-02-04

使用Python3.7+Tornado5.1集成新浪微博三方登录(无需企业资质)

2020-03-11

将博客迁移阿里云并且切换成https解析的过程

2018-01-20

关于响应式设计最新的适配方案

2017-07-12

兼容并蓄广纳百川,Go lang1.18入门精炼教程,由白丁入鸿儒,go lang复合容器类型的声明和使用EP04

2022-08-07

Home Brew 常用命令总结

2019-03-16

具体谈谈如何优化前端性能的总结

2019-05-30

颜值即正义,献礼就业季,打造多颜色多字体双飞翼布局技术简历模板(Resume)

2023-04-14

python3.7.3操作FastDfs来进行文件操作

2019-05-20
Copyright ♥  刘悦 | RSS订阅 | 友情链接:卡瓦邦噶! | 剑二十七 | 星海智算 | 见字如面 | Jason | forecho | 完美的胖达 | SAUCERMAN | Debug客栈 | 晚晴幽草轩 | 隔叶黄鹂 | LFhacks.com | the5fire | P3TERX ZONE | UsubeniFantasy | 糊涂说

京ICP备17064481号-1