当前位置:首页 > 技术分享

网站禁止搜索引擎结果页被抓取的方法

2年前 (2024-12-01)技术分享1209

在搜索引擎(例如百度,谷歌等中看到一些网站的页面被搜索了大量的垃圾信息页面,其中一些搜索结果页还被索引,这些垃圾信息一旦被索引,就有可能被收录。如果不想搜索结果页面被收录的话,可以使用robots.txt和Robots Meta告诉搜索引擎不索引这些搜索结果页。一般 SEO 用的是robots.txt或Meta robots标签是针对某个特定页面。


1、robots.txt

创建robots.txt文件放在网站根目录或运行目录里,robots.txt文件格式如下:

User-agent: *

Disallow: /?*
Disallow: /admin
Disallow: /search

User-agent:告诉哪些搜索蜘蛛遵循规则,哪些不遵循规则,* 代表所有搜索引擎都遵循;

Allow:允许访问的页面或目录,允许访问所有的页面或目录;

Disallow:禁止访问页面或目录,如/?*所有带?后面的都不索引,禁止访问所有的页面或目录


2、Robots Meta

在网页头部添加以下代码:

<meta name='robots' content='index, follow, max-image-preview:large, max-snippet:-1, max-video-preview:-1' />


有些博客或论坛会有SEO相关的设置,可以研究一下。


扫描二维码在手机访问。

版权声明:本文由明乐 iMLDM发布,如需转载请注明出处。

本文链接:https://www.imldm.com/p/8.html

“网站禁止搜索引擎结果页被抓取的方法” 的相关文章

Linux下安装traceroute

Linux下安装traceroute

在HHS下使用traceroute提示未找到命令则是没有安装traceroute。…

CentOS 7停止更新支持后yum源失效,解决方法

CentOS 7已经6月30号停止更新支持,同时官方也把yum源删除了,目前CentOS 7系统使用yum命令安装软件包提示“Could not resolve host: mirrorlist.centos.org; Unknown error”,因此需要更换yum源。在ssh界面执行以下命令即可…

如何实现Google富媒体搜索结果

富媒体搜索结果是在标准搜索结果(蓝色标题、URL和摘要)的基础上,通过添加图片、评分、价格、可用性、事件日期等结构化数据,使搜索结果更具视觉吸引力和信息量的展示形式。…

使用Nginx正向代理提升网站性能与安全性

在当今高速发展的互联网环境中,网站性能和安全性已成为衡量服务质量的关键指标。Nginx作为一款高性能的Web服务器和反向代理服务器,其正向代理功能同样强大。通过合理配置Nginx正向代理,不仅可以显著提升网站的访问速度,还能有效增强系统的安全性。…

小白也能懂:网站TDK优化完整指南,快速拿下搜索引擎第一印象

您的网站是否在搜索引擎中缺乏曝光与点击?问题可能出在TDK上!本文为您提供一套即学即用的TDK优化方法论,通过精准撰写Title标题与Description描述,有效提升搜索排名与点击率,为网站带来源源不断的精准流量。…

HTTPS加密原理详解:从“握手”到“锁头”,你的数据这样被安全送达

为什么HTTPS是安全的?本文用“挂锁与钥匙”的生动比喻,带你一步步看懂HTTPS的TLS握手流程,揭秘非对称加密与对称加密如何分工协作,为你构建一道坚固的数据传输防火墙。…