当前位置:首页 > 技术分享

网站禁止搜索引擎结果页被抓取的方法

1年前 (2024-12-01)技术分享1030

在搜索引擎(例如百度,谷歌等中看到一些网站的页面被搜索了大量的垃圾信息页面,其中一些搜索结果页还被索引,这些垃圾信息一旦被索引,就有可能被收录。如果不想搜索结果页面被收录的话,可以使用robots.txt和Robots Meta告诉搜索引擎不索引这些搜索结果页。一般 SEO 用的是robots.txt或Meta robots标签是针对某个特定页面。


1、robots.txt

创建robots.txt文件放在网站根目录或运行目录里,robots.txt文件格式如下:

User-agent: *

Disallow: /?*
Disallow: /admin
Disallow: /search

User-agent:告诉哪些搜索蜘蛛遵循规则,哪些不遵循规则,* 代表所有搜索引擎都遵循;

Allow:允许访问的页面或目录,允许访问所有的页面或目录;

Disallow:禁止访问页面或目录,如/?*所有带?后面的都不索引,禁止访问所有的页面或目录


2、Robots Meta

在网页头部添加以下代码:

<meta name='robots' content='index, follow, max-image-preview:large, max-snippet:-1, max-video-preview:-1' />


有些博客或论坛会有SEO相关的设置,可以研究一下。


扫描二维码在手机访问。

版权声明:本文由明乐 iMLDM发布,如需转载请注明出处。

本文链接:https://www.imldm.com/p/8.html

“网站禁止搜索引擎结果页被抓取的方法” 的相关文章

CentOS 7停止更新支持后yum源失效,解决方法

CentOS 7已经6月30号停止更新支持,同时官方也把yum源删除了,目前CentOS 7系统使用yum命令安装软件包提示“Could not resolve host: mirrorlist.centos.org; Unknown error”,因此需要更换yum源。在ssh界面执行以下命令即可…

网站分类目录推荐与使用指南

一、分类目录的核心价值?…

如何轻松查看电脑的IP地址?内网、外网一文搞定

你是否曾遇到过需要填写网络设置、连接打印机,或进行远程游戏时,被要求提供电脑的IP地址的情况?IP地址就像是你在互联网或家庭网络中的“门牌号”,是设备之间相互识别和通信的基础。本文将为你提供Windows和macOS系统下,查看内网IP和公网IP的详细指南,即使你是电脑新手也能轻松学会。一、 首先,…

有什么好用免费的采集器?

市面上有许多强大且免费的采集器(也称为网络爬虫工具),适合不同技术背景的用户。我将它们分为几类,你可以根据自己的需求选择。一、 可视化/无代码工具 (适合新手、普通用户)这类工具最大的优点是你不需要懂编程,通过点击和简单配置就能抓取数据。八爪鱼采集器特点:国内最知名的采集器之一,功能非常强大,界面友…

如何让网站更好被搜索引擎收录?

让网站更好地被搜索引擎收录是一个系统工程,通常被称为搜索引擎优化(SEO)。这不仅仅是让搜索引擎“找到”你的网站,更是要让其“理解”、“喜欢”并“优先推荐”你的网站。…