限制网络爬虫的抓取内容

54阅读 2上传 举报/认领 展开

本文档由 分享于2016-03-31 13:15

除了使用robots.txt文件来限制搜索引擎蜘蛛不要随便访问某个文件夹之外,还可以使用nofollow属性来控制某些HTML链接不要被搜索引擎追踪。
文档格式:
.pdf
文档大小:
82.48K
文档页数:
2
顶 /踩数:
0 0
收藏人数:
0
评论次数:
0
文档热度:
文档分类:
IT计算机  —  SEO
添加到豆单
文档标签:
SEO 搜索引擎优化
系统标签:
爬虫 抓取 nofollow 限制 链接 属性
下载文档
收藏
打印

扫扫二维码,随身浏览文档

手机或平板扫扫即可继续访问

推荐豆丁书房APP  

获取二维码

分享文档

将文档分享至:
分享完整地址
文档地址: 复制
粘贴到BBS或博客
flash地址: 复制

支持嵌入FLASH地址的网站使用

html代码: 复制

默认尺寸450px*300px480px*400px650px*490px

支持嵌入HTML代码的网站使用





82