通知内容:小白站长云与小白站长论坛两站强强合作,凡是小白站长论坛的正式会员注册小白站长云并需要购买云服务器或者服务器租用/托管、云防御、ssl证书的可联系管理员享受升级成小白站长云金牌会员,永久享受8折优惠。还等什么,小白站长论坛的用户们赶快行动起来吧。
查看: 140|回复: 0

百度网站地图的作用和提交方法?

[复制链接]
发表于 2018-8-31 09:33:18 | 显示全部楼层 |阅读模式
百度网站地图的作用和提交方法?


作用:

  网站地图这个名词,相信好多做过网站的人并不陌生。所谓网站地图,就是将网站的链接结构呈现给搜索引擎及网站浏览者的一系列代码,它有两种最常见的表现形式:html形式和xml形式。Html网站地图,其实就是一个网页,和其他内页一样,是网站的一个普通页面,上面按照网站的结构列出了网站内比较关键的、甚至是全部的链接入口,一般以文本链接的形式呈现在人们面前,主要是为方便网站的浏览者了解网站结构、快速找到自己需要的内容页面的一个导航页。而xml网站地图,则是另一种非网页形式的网站地图,它主要是服务于搜索引擎的,作用是告知搜索引擎在浏览和收录该网站的时候,哪些页面是主要的、哪些页面是次要的,哪些的更新频率较高,哪些反之。Html网站地图这里就不多说了,我着重要讲的是xml网站地图。一句话:做好xml网站地图实在太重要啦!!
  我的经历是这样的:我的网站www.paipai520.com曾经收录和排名都还不错,但是因为是企业性质的小网站,内页不多且全部是静态,所以我也没有做网站地图。后来有段时间,为了优化首页的关键词,我曾经多次修改首页的标签和内容,结果造成了百度把我的首页降权并放入沙盒。之后好长时间里我的网站内页收录正常,但首页一直site不到。我费了九十牛二十虎之力用了将近三个月的时间,才终于使网站首页重新被收录,然而让我更加郁闷的是,收录后的首页虽然能够site到,但排名却十分靠后,远远不如好多内页的排名,而排在最前的却是“关于我们”那一页。为此我十分着急,因为“关于我们”那一页根本没有什么有效的关键词,这样就算排名再好也不会带来客户,于是我想方设法想要恢复首页的排名。发外链、调整内链、更新首页、友情链接等等……可以说能用的方法都用尽了,却一点效果都没有。但奇怪的是,虽然首页在站内的排名一直没变,“关于我们”一页一直排在最前,但网站的总体排名却随着外链和友情链接的增加而不断提升,这让我逐渐确认了一件事:百度蜘蛛已经认定“关于我们”这一页是我的网站首页了。
  说实在的,对于我这样一个菜鸟级的站长来说,这实在是难住我了。在网上查了无数相关的资料,问了好多人,还是一无所获。就在我最无助绝望的时候,我突然鬼使神差地想到了以前曾经看到过的一个名词——“网站地图”,虽然自己以前从来没有尝试过,但在这种时刻我也没有那么多时间去考虑了。于是打开百度,认真的搜集关于网站地图的知识。由于我的问题主要出在搜索引擎而不是浏览客户,所以我把重点放在了xml网站地图上。
  在我的努力下,几经尝试,我终于做出了第一个网站地图Sitemap.xml,我把首页的优先级设置成1.0(最高),更新频率设置为daily(每日),其他次级页优先级设置为0.5和0.1,更新频率设置为weekly(每周)和monthly(每月),最后按照网友的提示,将网站地图的网址添加到robots.txt里,上传到了服务器。说实话,其实我并没有抱太大的希望,也许是因为失败了太多次吧。可没想到……
  第二天一早,我一如往常地打开SEO查询网站——我发现了令我意想不到的情况:我的网站首页竟然从原来的隔日收录变成了每日收录,头一天刚做的更新今天已经被收录啦,虽然首页的排名还是没有大的变化,不过我还是觉得很吃惊。而就在我对Sitemap.xml的作用半信半疑的时候,第三天的早晨,当我打开网站,我的天啊,首页的权重恢复啦!!我都有点不敢相信自己的眼睛!之前做了那么多的努力都没有一点效果,没想到这问题就被一个小小的网站地图解决啦!
  通过这段时间观察网站地图对百度的影响,我对百度等搜索引擎的“网站地图规则”有了一点点大胆的猜想,或者说是一些线索把:首先,我觉得搜索引擎对网站内所有网页权重的分配,与网站地图中的参数有很大关系。对于一个没有制作网站地图的网站来讲,百度对站内网页的权重分配似乎并不是固定的,百度不一定会认定网站的真实首页就是最重要的,而是会根据各个网页的更新状况、浏览状况等进行评定,最终把它认为最重要的网页放到最前;而如果你的网站有了网站地图,那么它就会通过地图内priority(优先级)参数的高低来权衡网页的重要性,使权重分配更加符合站长的本意。其次,百度等搜索引擎对网页的收录频率,似乎也遵循网站地图的指示,就像我以前的首页是隔日甚至隔两日收录的,但自从我做了网站地图并设置首页的更新频率为daily(每日)后,收录就变成了每日收录。对于这一现象,我想原因也许是这样的:在网站未制作地图以前,百度对网站的抓取和收录是随机的,也就是说百度不知道你什么时候会更新,所以一有时间就会来抓来看,于是这便无形中给百度蜘蛛增加了很大的工作量,想想看,一个网页数量庞大的网站,蜘蛛不知道你哪页更新了哪页没更新,于是只好通通爬一遍,这是多大的工作量啊!而当你告诉蜘蛛,我的网站中哪些网页是需要你“每天爬一次”,而哪些是需要“每周爬一次”、“每月爬一次”甚至“每年爬一次”的,那么自然会大大降低百度蜘蛛的工作量,减轻百度压力,这样百度自然是很喜欢的。所以我觉得搜索引擎应该是都很喜欢网站提供地图的。
  不过需要强调的是,要想网站地图有效果,一定要注意以下几点:第一,不要所有网页的优先级设置成一样的数值,比如全站所有网页全部设置成1.0,这样在搜索引擎的认定是无效的。一个网站内的页面的重要性必然是有轻重之别的,一定要根据网站的结构层次来合理设置优先级。第二,网站地图Sitemap.xml也和网页一样需要同步更新的。这一点我觉得对于网页的收录尤其重要,如果搜索引擎真的是按照你提出的changefreq(更新频率)来浏览和抓取你的网页,那么你除了设置网页更新频率外,还要根据实际更新日期来更新lastmod值到正确的日期,因为如果搜索引擎按照你的提示来进行抓取,那么它必然在收录你的网页的同时会记录你的更新日期,以此作为参照来进行下次的抓取和收录。举例来说,假设你某一页的第一次更新是在8月16日,且该页设置的地图参数是<lastmod>2012-08-16</lastmod>, <changefreq>daily</changefreq>,然后当你的网页17日被收录了,那么搜索引擎很有可能会记录这个日期,这时如果你又更新了网页,但却不把lastmod更新成2012-08-17的话,那么到18日的时候,搜索引擎很有可能不会去抓取你的网页哦,因为你的地图告诉人家<lastmod>2012-08-16</lastmod>,也就是说你的上次更新是发生在8月16日而不是17日。你要知道,任何搜索引擎在访问和抓取网站之前,都是要先看你的网站地图的(如果有的话)。第三,尽量按照你的地图中所说的更新频率来更新网页,虽说这个会不会影响搜索引擎的收录还在进一步观察中,但诚信是绝对没错的。第四,重复的网页不要出现在网站地图中。如果你在地图中出现重复的链接,要是他们的设置完全一样还好说,可万一要是不一样,那后果可就很难说了……所有历史事实都告诉我们:让搜索引擎为难的网站,一定不会有好的结果,切记,切记~~
  以上便是本人的经历以及从中悟出的一点点拙见,希望高手给予指正,更希望能对一些朋友起到一点点帮助。
  下面说下xml的制作方法把:
  首先,推荐大家一个非常好用的xml网站地图制作软件:老虎网站地图生成器。据说当年我在网上找了好多网站地图制作软件,结果不是未注册的添加链接受限制,就是软件操作过于复杂。各位不要误会哈,我不是不愿意花钱注册正版软件,只是鄙人小站只有三十几个页面,只需暂做一个简单的xml全解燃眉之急,况且当时鄙人还不知道会不会有效果,所以不敢铺张,就找个操作简单、功能一般的就可以。这款老虎网站地图制作软件,纯绿色只有一个Sitemap.exe文件,没有任何功能限制,且操作极其简单。
  首先,运行程序,选择“新建工程”确认。第二页中随便起个工程名称,然后输入你的网站的域名,然后确认。第三页生成格式就选xml,保存地址点“浏览”选择,然后起名叫Sitemap.xml,确认,下一步。第四页建议不要动,直接下一步。此时软件界面出现,点“开始”后,软件开始搜索你刚才输入的域名内的所有链接并一一列出。此时你需要做的就是根据列出各个链接的实际情况,来一一设定其更新频率(changefreq)和优先级(priority)的数值。只需在对应的空白处双击,即可出现一个对话框,这里,更新频率有“always”(经常)、 “hourly”(每小时)、“daily”(每天)、“weekly”(每周)、“monthly”(每月)、“yearly”(每年)可选,首页一般建议选daily,其他一般用后面几种。优先级为0.1-1.0可选,数字越大代表网页的重要性越大,首页一般选1.0,而其他内页一般不超过这个数值。全部设定完成后,点“导出”,即在你刚才选择的保存位置形成一个成形的Sitemap.xml文件,这个文件便是你的网站地图文件。将这个文件存放到你的网站服务器根目录即可。
  很多朋友说百度不支持xml网站地图,其实这样说是很不对的,据我观察百度不仅支持xml网站地图,并且十分重视和喜欢Sitemap.xml,只是百度没有像谷歌那样专门提交Sitemap的入口,所以要想让百度读取你的地图,你需要在网站的robots.txt中添加一句代码-Sitemap: <网站地图的完整网址> ,如Sitemap: http://www.paipai520.com/sitemap.xml
  这样不仅百度,就连谷歌、雅虎之类的其他搜索引擎也不需要再提交,它们都会主动来访问您的网站地图了。要记住,这句代码中http://是绝对不能少的,并且robots.txt和Sitemap.xml一般都要放在网站的根目录下才能最大限度的发挥作用。


提交方法:

我如何向百度、雅虎等其他搜索引擎提交呢?我是否需要制作一个类似 Google Sitemap 一样的 baidu Sitemap 呢?
答案:搜索引擎都遵循一样的 Sitemap 协议,baidu Sitemap 内容和形式可以和 Google Sitemap 完全一样。但因为百度还没开通类似 Google 网站管理员工具的提交后台,所以,我们需要采用以下方式提交"baidu Sitemap" 。
一 我们可以通过在 robots.txt 文件中添加以下代码行来告诉搜索引擎 Sitemap 的存放位置。包括 XML Sitemap 和 文本形式的 Sitemap。
Sitemap:<sitemap_location>
<sitemap_location> 填写 Sitemap 的完整网址
如:http://www.paipai520.com/sitemaps.xml. http://www.paipai520.com/m/sitemap.txt

如果有很多个.xml 或 .txt 文件,则你可以先建立一个索引文件,把这些.xml 或 .txt 文件的完整网址列在其中。<sitemap_location> 中填写完整的该索引文件的网址。

以上代码行放在 robots.txt 文件的任何位置都可以。
Google 网站管理员工具可以清楚看到 Sitemap 文件是否正确以及其他索引统计信息,所以除了以上的设置,我们建议你通过 Google 管理员工具再提交一次,以方便 Google 对你网站的更好收录。

二 通过百度的互联网论坛收录开放协议页面提交,打开网址http://news.baidu.com/newsop.html,在框内提交你网站的XML地图即可。
我们建议采取第一种的方式向百度提交Sitemap,那样不仅仅百度会知道,其他的搜索引擎也能找到你网站的Sitemap。
关于这个方法大家应该注意以下几点:
robots.txt中添加Sitemap,可以放置在里面任意一行。
Sitemap开头必须大写
Sitemap后面必须是完整的绝对路径
也可以把几种Sitemap形式放置在一个索引文件里面,然后后面的地址就是这个索引文件的绝对地址。
版权申明:此文如未标注转载均为本站原创,自由转载请注明 本贴地址:https://www.xbadmin.cn/thread-21-1-1.html 上篇帖子: 西部数码服务器/VPS主机使用感受! 下篇帖子: 华山飞役/文煞/派派阅读网
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

小白站长云与小白站长论坛两站强强合作,凡是小白站长论坛的正式会员注册小白站长云并需要购买云服务器或者服务器租用/托管、云防御、ssl证书的可联系管理员享受升级成小白站长云金牌会员,永久享受8折优惠。还等什么,小白站长论坛的用户们赶快行动起来吧。

云服务器赞助商|sitemap|小黑屋|手机版|小白站长论坛

GMT+7.98, 2019-8-25 18:15 , Processed in 0.059805 second(s), 19 queries .

Powered by Discuz! X3.4

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表