何为网站架构,其对搜索引擎优化有何影响?
网站架构涵盖:“物理架构”和“逻辑架构优化”两个方面。
物理架构优化
网站物理架构指的是网站目录及所包含文件所存储的实际位置所展现的结构,物理架构通常包含两种不同的形态:扁平式物理架构和树形物理架构。
对于小型网站而言,所有网页都存放在网站根目录下,这种结构便是扁平式物理架构。采用扁平式物理架构的网站。
这种扁平式物理架构对搜索引擎而言是最为理想的,因为只需一次访问即可遍历所有页面。然而,如果网站页面较多,过多的网页文件都放在根目录下的话,查找、维护起来就显得相当繁琐,因此,扁平式物理架构一般适用于只有少量页面的小型、微型站点。
对于规模较大的网站,往往需要二到三层甚至更多层级子目录才能保证网页的正常存储,这种多层级目录也称为树形物理架构:即根目录下再细分成多个频道或目录,然后在每一个目录下面再存储属于这个目录的终极内容网页。
采用树形物理架构的好处是维护方便,但是搜索引擎的抓取将会显得相对困难。互联网上的网站,因为内容普遍比较丰富,所以大多都是采用树形物理架构。
逻辑架构优化
与网站的物理架构不同,网站的逻辑架构也称为链接架构,主要是指有网页内部链接所形成的逻辑架构,或者称为链接架构。逻辑架构和物理架构的区别在于,逻辑架构由网站页面的相互连接关系决定,而物理架构由网站页面的物理存放地址决定。
在网站的逻辑架构中,通常采用“链接深度”来描述页面之间的逻辑关系。“链接深度”指从源页面到达目标页面所经过的路径数量,比如某网站的网页A中,存在一个指向目标页面B的链接,则从页面A到页面B的链接深度就是1。
和物理架构类似,网站的逻辑架构同样可以分为扁平式和树形两种:
—扁平式逻辑架构:扁平式逻辑架构的网站,实际上就是网站中任意两个页面之间都可以相互连接,也就是说,网站中任意一个页面都包含其他所有页面的链接,网页之间的链接深度都是1。网络上,很少有单纯采用扁平式逻辑架构作为整站结构的网站。
—树形逻辑架构:是指用分类、频道等页面,对同类属性的页面进行链接地址组织的网站结构。在树形逻辑架构网站中,链接深度大多大于1。
SEO网站架构优化包括哪些
SEO网站架构优化包括以下内容:
1、URL地址优化
为网站上的文件创建具有良好描述性的分类名和文件名,不仅可以更好地组织网站架构,还有助于搜索引擎更有效地抓取文件。虽然搜索引擎能够抓取复杂的URL,但提供相对简单的URL,对于用户和搜索引擎来说都是有帮助的。
优化URL结构的主要方法有,网站自始至终都使用一个URL地址,不要来回变更地址,如果用带www的域名地址,则将不带www的域名使用301重定向技术重定向到主要地址,避免使用大小写字母的URL,网站的URL尽量使用静态URL,避免使用动态URL,URL越短越好,URL的内容使用拼音或者英文最好,方便记忆。
对于动态网站来说,使用伪静态技术可以让网站的外部看起来和静态网站一样,利于搜索引擎的索引。
2、目录结构
目录结构最好用一级到二级,不要超过三级。目录的组织方式尽量采用:首页-》栏目页-》内容页。目录名采用拼音或者英文。避免使用多层嵌套的子目录。
3、robots.txt
robots.txt是一种存放于网站根目录下的文本文件,用于告诉搜索引擎的爬虫(spider),此网站中的哪些内容是不应被搜索引擎的索引,哪些是可以被索引。robots.txt协议并不是一个规范,而只是约定俗成的,通常搜索引擎会识别这个文件,但也有一些特殊情况。
当我们不希望网站中的某些页面被搜索引擎抓取,也许这些网页在搜索结果中出现对于用户来说并没多大用处,就可以把这些页面放在robots.txt里,这可以保证网站的某些内容不出现在搜索结果中。
4、Sitemaps
Sitemaps可方便网站管理员通知搜索引擎他们网站上有哪些可供抓取的网页,有点象BLOG的RSS功能,是一个方便自己的服务,如果大家(互联网上所有的信息源)都采用了这种方式提交自己的更新的话,搜索引擎就再也不用派出那么多爬虫辛辛苦苦的到处乱窜了,任何一个站点,只要有更新,便会自动“通知”搜索引擎,方便搜索引擎进行索引。
Sitemaps文件通常是XML格式的,格式比较简单,Sitemaps协议以开始标记开始,以结束标记结束。每个网址包含一个作为父标记的条目。每一个父标记包括一个子标记条目。是网页文件的网址。此网址应以stmod>表示该文件上次修改的日期。此日期允许删除时间部分,例如YYYY-MM-DD。
5、网站导航
网站的导航功能对于帮助用户迅速找到他们想要的内容来说是很重要的,它对帮助搜索引擎理解该网站有哪些重要内容同样非常重要。网站地图是将网站上用于展示网站结构的网页以层级式列表的方式展示。网站导航的主要目的是为了方便用户,但同时它也有利于搜索引擎对整个网站页面更全面地抓取。
主要的网站导航方法有,创造一个自然的层叠结构的网站地图页面,这个导航页面可以让用户很容易地从主干页面找到他们需要的特定内容,有必要的话可以在保证内部链接结构合理的基础上添加导航页。
使用面包屑(breadcrumb)导航模式,面包屑导航是指在网页顶端或者底部放置的一排内部链接,它使用户可以方便地回到上一层结构中的网页或者主页。大多数面包屑导航通常会从最具概括性的页面开始(通常是主页),越往右指向的页面内容越具体,例如“首页-》栏目-》具体文章标题”。
采用碎屑导航(crumb trail)机制,碎屑导航即在网页顶部或底部排列的一串内部链接,它让用户能够轻松返回上一级结构中的网页或主页。多数碎屑导航一般从最具综合性的页面开始(通常是主页),越往右指向的页面内容越细致,例如“首页-》版块-》具体文章标题”。
7、Nofollow标签的应用
Nofollow标签是由谷歌发起的一个标签,旨在最大程度地降低垃圾链接对搜索引擎的影响,减少博客的垃圾评论,目前百度、谷歌、雅虎、微软等都支持这一标签。当超链接中包含Nofollow标签时,搜索引擎将不考虑这些链接的权重,也不会用这些链接参与排名。
Nofollow标签通常有两种使用方式:一种是将"nofollow"添加到网页的meta标签中,告知搜索引擎不要抓取网页上的所有外部和内部链接。例如:。另一种是在超链接中添加"nofollow",告知搜索引擎不要抓取特定的链接。例如:。
需要注意的是,如果一个网站链接到某些被搜索引擎视为垃圾网站的地址,那么这个网站的权重也会受到影响。因此,为了安全起见,一个网站中所有可能由第三方提交的超链接都应该添加Nofollow标签。
8、404页面
404网页是用户尝试访问不存在的网页(如因点击损坏的链接、网页已被删除或用户输入错误的网址)时看到的页面。之所以称为404网页,是因为网络服务器在收到丢失网页的请求时,会返回404HTTP状态代码,表示该网页未找到。
用户偶尔会因点击失效的链接或输入错误的URL而访问到网站域名下不存在的页面。使用自定义404页面能有效帮助用户回到网站有效页面,大幅提升用户体验。404页面最好提供回到网站主页的链接以及到网站热门内容页面的链接。
通常,用户最好创建一个自定义的404页面,以便获取这部分用户流量。一个优秀的自定义404页面可以帮助用户找到所需信息、提供其他实用信息并吸引用户进一步浏览网站。
然而,许多网站设计的404页面都很简单,不少网站为了不损失流量,在404页面中自动重定向到首页,这并不是一个改善用户体验的设计方法。
9、统计代码的应用
网站统计分析工具可以深入了解用户如何找到网站以及他们的行为习惯,同时发现网站最受欢迎的内容,衡量网站优化效果(例如,修改标题和描述性元标签是否有助于增加搜索引擎带来的流量?),还能了解访问者来源、寻找内容、进入和退出的页面。
使用网站统计分析工具的前提是在网站中添加统计代码,目前常见的统计工具有百度统计、谷歌分析等。为了不影响网站加载速度,统计代码最好放在网站底部。