当前位置:首页 > 技术分享 > 正文内容

网站禁止搜索引擎结果页被抓取的方法

12个月前 (12-01)技术分享782

在搜索引擎(例如百度,谷歌等中看到一些网站的页面被搜索了大量的垃圾信息页面,其中一些搜索结果页还被索引,这些垃圾信息一旦被索引,就有可能被收录。如果不想搜索结果页面被收录的话,可以使用robots.txt和Robots Meta告诉搜索引擎不索引这些搜索结果页。一般 SEO 用的是robots.txt或Meta robots标签是针对某个特定页面。


1、robots.txt

创建robots.txt文件放在网站根目录或运行目录里,robots.txt文件格式如下:

User-agent: *

Disallow: /?*
Disallow: /admin
Disallow: /search

User-agent:告诉哪些搜索蜘蛛遵循规则,哪些不遵循规则,* 代表所有搜索引擎都遵循;

Allow:允许访问的页面或目录,允许访问所有的页面或目录;

Disallow:禁止访问页面或目录,如/?*所有带?后面的都不索引,禁止访问所有的页面或目录


2、Robots Meta

在网页头部添加以下代码:

<meta name='robots' content='index, follow, max-image-preview:large, max-snippet:-1, max-video-preview:-1' />


有些博客或论坛会有SEO相关的设置,可以研究一下。


扫描二维码在手机访问。

版权声明:本文由明乐 iMLDM发布,如需转载请注明出处。

本文链接:https://www.imldm.com/p/8.html

“网站禁止搜索引擎结果页被抓取的方法” 的相关文章

如何实现Google富媒体搜索结果

核心概念:什么是富媒体搜索结果?富媒体搜索结果是在标准搜索结果(蓝色标题、URL和摘要)的基础上,通过添加图片、评分、价格、可用性、事件日期等结构化数据,使搜索结果更具视觉吸引力和信息量的展示形式。常见的富媒体搜索结果类型包括:食谱:带有图片、评分、烹饪时间等。商品:带有价格、库存状态、评分。文章:...

对SEO友好URL设置指南

设置对SEO友好的URL规则是网站优化的基础且关键的一步。一个清晰的URL结构不仅有助于搜索引擎更好地理解和排名你的页面,也能提升用户体验和点击率。以下是一套完整且可操作的设置指南,涵盖了核心原则、最佳实践、技术实现和常见陷阱。一、核心原则(“什么是对SEO友好的URL?”)一个对SEO友好的URL...

如何查看网站是否被各大搜索引擎收录?

查看网站是否被搜索引擎收录,以及了解收录的具体情况,是网站运营和SEO工作中的基础且非常重要的一环,它可以帮助我们的网站是否被搜索引擎收录和索引,从而提高网站的流量和排名。下面我将为您详细介绍几种主流的方法:一、 最直接的方法:使用 Site 指令这是最快、最直接的查询方法,直接...

使用Nginx正向代理提升网站性能与安全性

在当今高速发展的互联网环境中,网站性能和安全性已成为衡量服务质量的关键指标。Nginx作为一款高性能的Web服务器和反向代理服务器,其正向代理功能同样强大。通过合理配置Nginx正向代理,不仅可以显著提升网站的访问速度,还能有效增强系统的安全性。本文将深入探讨如何利用Nginx正向代理优化网站性能并...

多款输入法推荐及选择建议

多款输入法推荐及选择建议

选择一款好用的输入法能大大提升打字效率和使用体验。由于每个人的需求和习惯不同,整理了当前主流的几款输入法,你可以根据自己的情况来选择。一、主流输入法特点和适用场景我们首先通过一个表格,快速概览几款主流输入法的核心定位。输入法名称核心标签最大优势特别适合的人群链接搜狗输入法全能冠军,词库王者智能联想强...

小白也能懂:网站TDK优化完整指南,快速拿下搜索引擎第一印象

在搜索引擎优化(SEO)的庞大体系中,有许多复杂的策略和技术。然而,最基础、最有效且往往被忽视的环节,便是对网站TDK的精细化优化。理解并运用好TDK,就如同为网站的每个页面配备了精准的GPS定位和诱人的广告牌,能直接引导搜索引擎与用户行为。一、重新认识现代SEO中的TDK首先,我们需要明确TDK在...