西瓜业务是如何从 0-1 建设 SEO 的

lxf2023-04-07 16:26:01

出品:西瓜视频前端技术团队

作者:张浩弘

前言

对于各位前端开发者,SEO是一个老生常谈的话题,尤其对于运营着自己的博客、网店、个人网站的开发者来说,SEO是获取自然流量始终绕不开的话题。各大搜索引擎每天都会接收用户上亿次的搜索,是不可忽略的大流量入口,如何从这庞大的搜索流量中分一杯羹,是每一个站长都需要思考的问题。

本文将会具体结合西瓜热点详情页从0到1的SEO建设过程,为大家介绍作为FE业务方如何去学习了解、建设SEO;本文不会就SEO的一些基础理论和搜索引擎算法进行深入探讨,而是希望从热点推广的视角介绍一些SEO方法

基础概念

SEO(Search Engine Optimization) 中文译为「搜索引擎优化」。

简单地说,SEO是指网站从自然搜索结果获得流量的技术和过程,复杂且较为严谨的定义如下:

SEO是指在了解搜索引擎自然排名机制的基础上,对网站进行内部及外部的调整优化,改进网站在搜索结果页面上的关键词自然排名,以获得更多流量,从而达成网站销售及品牌建设的目标。

搜索引擎如何工作

搜索引擎的工作过程大体可以分成三个阶段:

  1. 爬行和抓取

搜索引擎蜘蛛通过跟踪链接发现和访问网页,读取页面HTML代码,存入数据库。

  1. 预处理

索引程序对抓取来的页面数据进行文字提取、中文分词、索引、倒排索引等处理,以备排名程序调用。

  1. 排名

用户输入查询词后,排名程序调用索引库数据,计算相关性,然后按一定格式生成搜索结果页面。

西瓜业务是如何从 0-1 建设 SEO 的

如何优化建设SEO

搜索引擎的工作流程主要涉及了2个角色——网站和搜索引擎,我们将第3个角色用户也加入其中后,就可以形成包含3个主要角色和6个核心环节的搜索生态模型。

主要围绕着这6个环节,我们将对网站逐步进行SEO的优化和建设:

西瓜业务是如何从 0-1 建设 SEO 的

抓取、收录

这里我不会按照上图的顺序先讲投放,因为投放在优化过程中其实属于后置位;在没有对网站本身结构进行优化,没有进行竞争分析(关键词选择)之前,你肯定不会轻易把网站大量投放出去吧?

网站的优化大致可以分为两部分:一是网站结构调整,二是页面优化。

我们的网站如果要顺利地被蜘蛛抓取和收录,很大程度上依赖于良好的网站结构。

网站结构优化

避免蜘蛛陷阱
  • Flash
  • 各种跳转
  • JS链接
设置robots文件

西瓜业务是如何从 0-1 建设 SEO 的

西瓜M站的robots文件

robots文件属于网站禁止抓取、索引机制的一部分,搜索引擎蜘蛛访问网站时,会先查看网站根目录下是否有一个robots.txt文本文件,它用于指定蜘蛛禁止抓取网站某些内容,或者允许抓取某些内容。

一些网站不存在robots文件时会返回200状态码和一些错误信息,而不是404状态码,这可能使搜索引擎蜘蛛错误解读robots文件信息,所以建议就算允许抓取所有内容,也要建一个空的robots文件,放在根目录下。

URL设计

在设计网站页面的URL时尽量遵循下面几个原则:

  • 越短越好
  • 避免太多参数
  • 目录层次尽量少
  • 包含关键词(英文)
  • 字母小写
  • 连词符使用「-」分隔
  • 使用https
西瓜热点H5详情页之前的URL:
https://h5.ixigua.com/xigua_hot_spot/detail/?hotspotId=7095918215196318727

现在的URL:
https://m.ixigua.com/xigua_hot_spot/detail/7095918215196318727
更换域名 & URL静态化

我们针对之前西瓜热点H5详情页的URL进行了域名更换和URL静态化。

域名更换:M站的域名拥有较高的权重(较长的域名年龄、收录页面总数多、特征关键词排名高等),将热点的域名更换至M站域名有利于我们的页面能够被搜索引擎收录,且在搜索排名上具有一定优势。

URL 静态化 :一般来说URL中有两三个参数,对于收录来说不会造成任何影响,但还是建议将URL静态化,既能提高用户体验,又能降低收录难度。

网址规范化

网址规范化指的是搜索引擎挑选最合适的URL作为真正网址的过程。

那什么是不规范的网址呢?

举个例子,一般来说一个网站的首页URL应该是固定的,但在一些网站链接回首页时所使用的URL并不是唯一的,有时连到www.xxx.com, 有时连到 www.xxx.com/index.html 。这样不规范化的网址会给搜索引擎造成困扰,可能造成权重分散、浪费爬取份额等问题。

解决方案

  • 百度站长平台中设置首选域名
  • 使用301转向,将不规范化URL全部转向到规范化URL
  • 使用canonical标签
HTML文件的head中加上这样一段代码:
<link rel="canonical" href="https://m.ixigua.com/xigua_hot_spot/detail/7101281806032313356">
表示这个网页的规范会网址应该是:https://m.ixigua.com/xigua_hot_spot/detail/7101281806032313356

网站页面优化

良好的TDK

TDK标签包括标题标签title(T)、网站的描述标签description(D),关键词标签keywords(K),一般在搜索结果中,页面的title和description是最有可能被展示出来的。

在设置网站的TDK之前,还有一个重要的事情便是竞争分析和关键词研究,我们需要简单了解下为什么需要有这个步骤。

  • 确保目标关键词有人搜索
  • 降低优化难度
  • 寻找有效流量
  • 搜索多样性
  • 发现新机会

TDK 通用标准

  • Title 标题

标准格式 : 关键词 - 副关键词 | 品牌名

长度建议 : 50 ~ 60 个字符

  • Description 描述

长度建议: 网页描述的长度任意,最佳实践长度在 155 ~ 160 个字符间之间,描述文本尽量使用关键词吸引用户的话术,提升点击率(CTR)。

  • Keyword 关键词

这里的keyword不仅仅指的是meta keywords,而是站点/文章title/视频描述中可以增加关键词

长度建议

  • 主页关键词布局一般是核心词,以5~10个为宜。关键词之间用英文状态下的逗号或者下划线隔开,搜索量大的在前,搜索量小的在后,同个关键词不可以反复出现,以免堆积。

  • 不同栏目设置不同的关键词。栏目页属于内页,所以关键词最好选择长尾关键词,并结合网站当前栏目名称选词,一般布局3~5个长尾关键词。

  • 视频页主要布局的关键词是长尾关键词,1~2个为宜,一定要和视频主题高度吻合。

举个