加载

论坛| Webflow

为什么谷歌不索引文件夹中的页面?

出版的帮助搜索引擎优化

Izzywashere(依奇) 2022年8月29日，晚上7:12 # 1

除了文件夹中的页面外，所有页面都被谷歌索引。

如何将文件夹中的页面索引到谷歌?

Drew_Schafer(画了谢弗) 2022年8月29日，晚上10:15 ＃2

你好@Izzywashere欢迎来到论坛。

你能分享一个链接到你发布的网站和只读链接吗?

此外，在您的项目设置，SEO选项卡，在robots.txt文件中设置了什么?

干杯!

Izzywashere(依奇) 2022年8月30日，凌晨12:26 # 3

嗨了!

这里是链接
https://preview.www.raktarban.com/preview/btr-596c1a?utm_medium=preview_link&utm_source=designer&utm_content=btr-596c1a&preview=dac7b6b2d1c9d3d94c68a354bb5431d4&workflow=preview

SEO下的robots.txt字段为空

1像

memetican(迈克@ Sygnal) 2022年8月30日，凌晨2:53 # 4

谷歌在决定索引哪些页面和不索引哪些页面时非常随意。一般来说，我的经验是谷歌将索引站点的主要区域，在站点的20%到60%之间，然后如果它看到了兴趣，就扩展它。

为什么?因为Zipf定律．大多数互联网从来没有被搜索过，那么为什么要索引它呢?

在你的网站上，一切看起来都很好，可能除了你的robots . txt．
我将在下面解释原因。

这是我检查过的——

您的“折叠”页面只是您的社区页面。所有其他的/道路/页是Collection-generated页面。

SITEMAP.XML

您的社区页面在您的sitemap.xml所以谷歌知道它们。

https://www.buildtorentlist.com/sitemap.xml

< url > < loc > https://www.buildtorentlist.com/communities/tx/build-to-rent-homes-dallas < / loc > < / url >

它们也没有密码保护，或包含任何明显的“禁止机器人”的指令< >头．我没有检查无索引指令的链接，但这不太可能。

robots . txt

你也没有robots . txt配置好了，这通常不是问题。然而Webflow的404页，您有一个重定向脚本回到您的主页。

也就是说，如果你试图访问你的robots . txt-

https://www.buildtorentlist.com/robots.txt

服务器正确地响应404但之后你会被重定向。同样，这应该不会引起问题，但您最好设置您的robots . txt内容显式为allow-all;

User-agent: * Allow: /

除此之外，我最好的建议是努力让这些页面更有价值。添加好内容，定期更新，不断为你的网站添加内容等等。

如果您正在使用谷歌Search Console，您可能会得到一些关于什么被索引、什么没有被索引以及原因的更好的信息。

1像

Izzywashere(依奇) 2022年8月30日下午1:49 # 5

谢谢，这很有帮助。

我使用谷歌搜索控制台，这是我发现它没有索引文件夹内的那些页面(具体地说)

好的，我将按照你的建议在robots.txt字段中添加以下内容:
用户代理:*
允许:/

我需要删除404重定向到主页脚本吗?

此外，由于sitemap.xml识别文件夹中的页面，我是否应该直接将sitemap提交给谷歌?

memetican(迈克@ Sygnal) 2022年8月30日晚上9:21 # 6

不，我认为这很好，而且很酷。如果是我，我可能会更改它以显示一个漂亮的404，然后在4秒后自动重定向。或者提供搜索等，帮助人们找到他们想要的东西。

基本上，“不会有伤害。”在客户端站点上，我总是设置谷歌搜索控制台并提交他们的sitemap.xml。这能让我更快地追踪。

Izzywashere(依奇) 2022年8月31日，凌晨1:59 # 7

我已经在webflow中输入了一个自定义的站点地图(在我清理了它之后)，并将它提交到谷歌以及。webflow生成了我不想被索引的链接(例如，网站自带的电子商务/结帐页面，无法删除或起草它们)

谢谢你的洞察力

1像

memetican(迈克@ Sygnal) 2022年8月31日，凌晨4:09 # 8

据我所知，删除页面sitemap.xml不会告诉谷歌“不要索引这个。”它只是帮助谷歌找到什么应该索引，并确定自上次访问以来是否发生了更改。

为了防止在页面上建立索引，你可能需要在页面的头部添加META;

< meta name = "机器人"内容=“noindex”>

如果您可以将页面标记为“无搜索引擎索引”，然后让Webflow自动适当地更新HTTP响应头、meta、robots.txt和sitemap.xml，那将是最理想的。

https://wishlist.www.raktarban.com/ideas/WEBFLOW-I-211

1像

Izzywashere(依奇) 2022年8月31日下午1:29 # 9

啊，好的，我明白了。我将添加这个来排除页面，并从webflow切换回自动站点地图

Izzywashere(依奇) 2022年9月1日下午2:27 # 10

嗨，我输入了你的代码< meta name = "机器人"内容=“noindex”>但是webflow autositemap仍然在生成这些页面

改变应该是即时正确的吗?

memetican(迈克@ Sygnal) 2022年9月1日晚上9点29分 # 11

是的，这是正确的，您不需要担心sitemap.xml。
META noindex告诉谷歌不要索引你的页面。

多年来，搜索引擎索引在许多不同的举措下不断发展，我相信它将继续发展，但今天你可以把它看作三个主要部分……

/ sitemap.xml
告诉搜索引擎你的页面在哪里，以及它们最近一次更改的时间。
它没有告诉引擎他们可以看什么，或者他们应该索引什么，它只是一个方便的机制，使爬行和变化检测更有效。

/ robots . txt
告诉搜索引擎他们可以做什么看看．
这与告诉引擎它们被允许做什么是不同的指数．
一般来说，在这里排除页面是没有用的，因为如果谷歌已经索引了您的页面，并且然后你把它加到robots . txt，谷歌将不再查看它，这意味着它将永远不会更新或取消索引它。

< meta name = "机器人"内容=“noindex”>
当你在一个页面的HEAD中有这个META时，它告诉搜索引擎不要索引这个页面，如果他们已经索引了这个页面，就删除它。

对于99%的Webflow网站，最好的方法是自动生成sitemap.xml来显示所有内容，在你不想索引的页面上使用META NOINDEX。

Izzywashere(依奇) 2022年9月1日晚上10:05 # 12

明白了，谢谢你的澄清。听起来noindex脚本将实现我想要的

由话语，最好在启用JavaScript的情况下查看

▼

上午10点(太平洋标准时间)直播

map