1、何为Sitemap?
Sitemaps是某个网站中网页的列表,网站管理员能够通过提交Sitemaps来通知搜索引擎网站中可用的网页。最简单的Sitemap就是一个XML文件,它包含了网站中URL列表以及其他的一些元数据信息,更多信息请参见的列表,
http://www.sitemaps.org.
2. Sitemaps能够带来什么好处?
通过创建并且提交Sitemaps,搜索引擎能够更加全面、更加及时地抓取网站的内容。通过分析Sitemaps包含信息,搜索引擎爬虫能够更加准确地确定什么候重新页,以及重点抓取哪部分网页。
大家在了解Sitemaps的一些基本原理后,主角登场了。。。。
最近,我参与了Google Sitemap Generator的最后测试工作,数据和心得会在稍微送上,因为有些机密问题,所以只能将一些功能页面的截图共享给大家,不过,我们可以高兴的是,Google会在第二季度将此软件进行开源,那时候大家就都可以用上了.
生成原理和局限性:
Google Sitemap Generator生成工具的基本原理是,通过跟踪网站的访问记录来得到网站中网页的地址,以及网页的重要程度。它主要包括两个部分:服务器过滤插件和Sitemap生成服务软件。作为服务器的插件,过滤器可以跟踪网站中所有的访问记录,然后把访问记录发送给Sitemap生成服务软件。Sitemap 生成服务软件可以高效地保存所有的访问记录,然后定时更新并提Sitemap。由于主要的工作都由Sitemap生成服软件务完成,并且它独立于网站服务器,因此,Sitemap 生成工具对于网站并不会产生大的影响。
安装完成
当生成工具启动后,网站管理员可以通过访问http://localhost:[settingport]/来配置该生成工具。也可以通过直接修改配置文件SiteSettings.xml 来完成配置(默认可在C:\Program Files\Google\GoogleSitemapGenerator\或/etc/sitemap/下找到)配置页面的端口默认是8181(可通过检查sitesettings.xml 或服务器日志来获得确
切的端口号)。该值可以在配置页面中修改。目前支持中英文两种配置页面,可以由服务器自动识别用户游览器的设置,也可以在地址后添加参数hl=zh-cn 或hl=en-us 来手动选择。
当你访问该地址时,首先会看到如下页面:
需要输入密码以登录。初始密码是admin,可以在配置页面中修改该密码。当你登录后就可以看到配置页面了:
该页面由四个部分组成:
站点列表
左边是站点列表,你可以在这切换想要编辑的站点设置页面。所有在网站服务器(IIS 或Apache)中配置的站点都会在这里列出来。排在站点列表第一个的是全局设置页面,它不是用来设置某一个站点的,而是用来设置一批站点的。当你在该页面对某一项配置改动时,所有被设定为与之同步的站点设置都将一起改变。
标签页栏
在配置页面的上方是标签页栏,你可以通过它来切换该站点下想要配置的子页。第一个标签页是关于所有与特定sitemap 无关的站点设置,最后一个标签页是提供该站点实时运行情况信息的。其余的标签页都对应特定的sitemap。目前为止,我们共支持5 种sitemap:网页,新闻,视频,手机网站,代码搜索网站。未来可能还将添加更多的种类。
命令按钮
在配置界面的右上角有四个按钮,可以执行以下命令:
· 保存: 保存已作的配置修改到服务器。
· 刷新: 从服务器得到最新的配置; 要小心,该命令会覆盖当前未保存的修改。
· 保存并重启: 保存修改到服务器之后,重启服务器,然后页面自动重定向到新的配置地址(如果端口被修改了的话)。
· 注销: 注销当前会话,页面将被重定向到登录界面。注意: 这里的服务器是指正在运行的Google sitemap 生成工具,我们在该工具中内嵌了一个简易版本的HTTP 服务器。
配置区域
用户可在该区域进行配置。
全局设置:
网页Sitemap 设置
视频站点Sitemap 设置
运行情况页面:
其他情况会及时想大家通报,便于我们在几个月后可以充分的利用Google为我们提供的服务。
蓝杉SEO独家,未经许可,禁止转载,本站保留法律追究的权利,如转载请联系penny(QQ:51611065 mail:penny622@gmail.com)
