第3章〓SEO的基本理论 本章目标  掌握SEO的基本原则与导向。  掌握SEO的核心思维。  熟悉SEO的基本矛盾。  了解SEO的发展趋势。 本章理论既适用于百度等全网搜索引擎,也适用于淘宝网等内置搜索引擎;既适用于PC端搜索引擎,也适用于移动端搜索引擎。但是它们对某些表达对象的称呼不同,为了方便起见,我们把SEO对象默认为网站,读者在理解上注意通用性。 SEO工作主要受搜索引擎算法和SEO工程师的影响。搜索引擎算法的调整会给很多网站的搜索排名带来较大影响,SEO工程师的工作水平直接影响网站的搜索排名及排名的稳定性。本章简要总结了SEO工作的基本理论,供读者参考。 3.1SEO的基本原则与导向3.1.1SEO的基本原则1. 整体性搜索引擎对某个网站的评价是由多个因素根据重要性占不同的权重组成的综合评价。某个网站的几个优点并不能给网站带来多大的权重,只有整体各项指标都比较优秀,才会引起搜索引擎的足够重视,也才能给用户带来更好的浏览体验。像优化项目、指标兼顾用户体验和搜索引擎的友好性,网站在PC端和手机端都能有很好的浏览体验,网站的域名、服务器、页面内容、排版、样式都经过精心组织和选择等,都属于从整体性的角度去考虑优化工作。 因此,SEO工程师在对网站进行优化时,要注重制定整体性的策略,使各项优化项目和指标做到互相支持,同步促进。网站的整体评价得分高了,就会被搜索引擎列入重点关注对象,及时抓取网站内容,优先排序。 2. 战略性 与整体性不同,SEO工作的战略性更具有挑战性,对SEO工程师的要求更高,需要他们具有较强的战略规划能力。网站的SEO是一项见效慢的工作,甚至在一段时间内付出了资金和精力却没有任何回报。很多从业者缺乏战略眼光,急功近利,慢慢地偏离正常的SEO道路越来越远。特别是在使用一些方法取得了一定的成绩后,可能会加速其偏离正常轨道。SEO工作的战略性主要表现在以下几个方面。 1) 系统规划 从建设规划网站开始就执行系统的SEO思路,落眼全局,按部就班,逐步推进,不存在侥幸心理,按照正规做法,扎实做好每一步操作。 2) 重视原创 SEO工程师应该特别重视网站的内容建设,坚持创作有价值的原创内容,打造行业内的知名度,逐步争取成为业内的领导者。 3) 技巧为辅 SEO工程师要明白优化技巧只能是暂时性的、辅助性的,只要打造业内的标杆,在垂直领域内具备知名度,自然就会受到搜索引擎的重视,哪怕有些优化行为不被搜索引擎喜欢,也可能会被搜索引擎容忍。众多高质量的、用户追捧的网站,搜索引擎不会置之不理,毕竟搜索引擎的目的是提升用户的搜索体验。 3. 动态性 动态性是指网站的优化策略随着实际情况进行变化,但这一点与战略性并不矛盾。从搜索引擎技术发展的历程看,算法的改进是一个不断升级的过程,很多影响体验的优化方法并不能甄别出来,甚至有些很隐蔽的手法,并不会影响用户体验。像有些优化手法针对搜索引擎开发,能引起搜索引擎的好感,排名靠前,但用户觉察不到,实际提供的内容并不是用户需要的。另外,原来合法的优化方法,随着环境和技术的变化,搜索引擎可能将其认定为非法;原来不能实现的优化项目,随着技术的进步得以实现等。 第3章SEO的基本理论SEO搜索引擎优化实战SEO工作必须跟上互联网的发展,坚持动态性的原则,否则将不能取得长远的效果。SEO技术或优化手法不管如何调整,以提升用户体验为中心的思想不能变,取得用户和搜索引擎双重友好性的基本点不能变,核心战略规划不能轻易变。 3.1.2SEO的基本导向1. 以官方意见为导向搜索引擎的官方信息具有权威性,是搜索结果排名的重要依据,也是SEO工程师进行网站优化的基础。各大主流搜索引擎都提供了站长平台,从官方角度提供了很多资料,SEO工程师要从这些资料中总结搜索引擎优化的方向、技巧、方法等资源,然后用于实践操作。有些经验比较丰富的SEO工程师能够从搜索引擎平台公布的官方资料中找到优化方向的“蛛丝马迹”,可能取得很好的优化效果。 不同搜索引擎站长平台提供的资料有些可以通用,有些具有明显的平台特色。SEO工程师要仔细研究,针对不同的搜索引擎实施不同的优化策略,尽量在通用的基础上体现出平台特色,使网站在不同的搜索平台都取得较好的排名效果。如百度搜索资源平台、360搜索站长平台、搜狗搜索站长平台、谷歌站长平台等都提供了大量的官方资料,可以指导SEO工程师的工作。在此,以百度搜索资源平台为例,截取平台的部分页面了解相关内容,如图31所示。 图31百度搜索资源平台的部分界面 在图31中,百度官方提供了“VIP俱乐部”“站长社区”等交流功能,SEO工程师可以通过这些平台相互交流,体会不同优化人员对官方信息的解读、具体实践中的应用等信息,共同进步。 2. 以实践为导向 SEO工作是一项以实践为主的工作。搜索引擎官方虽然对外公布了很多资料,但不少资料都是概括性的,没有明确的方法,这也给SEO工程师留下了很多想象的空间。对搜索引擎官方公布的资料,不同优化人员可能有不同的理解,采取的优化措施可能不同,或者侧重点不同等,这就需要通过实践去摸索经验、检验成果。一个实战经验丰富、善于思考的优化人员往往能够取得比较好的优化效果。 SEO工程师之间通过“站长社区”等交流平台互相交流经验,也是实践中必不可少的环节。虽然有些人采用一些方法,取得了较好的排名效果,但并不能说这些方法就是正确的;有些人采用一些方法,没有取得较好的排名,也不能说这些方法就一定是落后的或者是错误的等。这也是SEO工作的魅力所在,一切都需要在实践中不断总结,不断提升。 3. 以适度优化为导向 SEO工作需要在一个适当的范围内进行,过于优化可能被搜索引擎判断为作弊手法,优化不到位可能达不到预期效果。适度优化要兼顾搜索引擎系统各要素的要求,尽量避免刻意优化的行为,优化内容要尽量符合多数用户的使用习惯。下面通过几个实例理解一下适度优化的含义。 1) 页面文章标题 页面文章标题所包含关键字及显示格式(加粗、字号大、居中等)应能够吸引搜索引擎优先抓取。 2) 页面文章排版 如果整篇文章全部加粗、字号一样大,就会让搜索引擎找不到重点,用户看起来也不方便。即使内容再好,全文自始至终不分段,标点符号乱用,用户也很容易放弃浏览。 3) 页面图片 相比文字,用户更喜欢看图片类的信息,但是页面包含太多的图片,就会打开缓慢,用户等待的时间越长,离开的概率就越大。相对于图片,搜索引擎更喜欢抓取文字类的信息。 4) 浏览设备 有些网站在手机端打开,展示的是PC端的页面,需要放大界面才能浏览,很不方便;针对手机屏幕开发的界面,有更好的浏览体验,更受搜索引擎的青睐,如图32所示。 图32手机端打开网站页面的部分界面 目前的搜索引擎技术仍然处于不断完善和发展的过程中。对于搜索引擎已经明确公开的违规方法,一定不能使用。很多SEO工程师为了取得比较好的搜索排名,很可能使用一些比较激进的优化方法。使用这些方法到什么程度被搜索引擎判为作弊的标准不好掌握,使用得当就是好的方法,使用过度就成了作弊手段,被搜索引擎判为违规。这一点需要在实践中不断摸索。 具体到某个网站,具体到每一次搜索引擎算法的升级,都会引起一部分网站的排名迅速下滑,可能就是搜索引擎对一些优化方法“适度”的调整。 总之,不管是用户还是搜索引擎,最终追求的都是好的体验。但是什么体验才算是好的,难以量化描述,搜索引擎也难以给出全部的指标,SEO工程师只能在实践中不断总结。 3.1.3SEO原则与导向的模型 我们可以把以上SEO工作中的原则和导向描述为一个模型(见图33),这是进行SEO工作的基础。 图33SEO工作的基本模型 在图33中,SEO工作的整体性、战略性、动态性原则是指导SEO工作的主要原则,在此基础上,SEO工程师要坚持以搜索引擎的官方意见、以具体实践操作、以优化适度的导向实施SEO策略。其中,“适度”是在搜索引擎官方意见和具体实践中总结出来的,并且具有动态性。 3.2SEO的核心思维与优缺点 很多人有这样的疑问: SEO管用吗?特别是当实施了一定的SEO后,优化人员没有见到网站排名有多大的变化,这种疑问更强烈,中途放弃的也不在少数。因此,要做好SEO工作,需要坚持SEO的核心思维。此外,SEO工作除了具有明显的优点外,还具有一定的缺点,需要优化人员正确对待。 3.2.1SEO的核心思维 下面分别从SEO工作围绕的核心要素、要达到的核心目的、核心要素间的变化关系3个方面介绍SEO核心思维方面的内容。 1. 核心要素 在互联网中,搜索引擎的一端连接着用户,另一端连接着网站,用户通过搜索引擎得到网站的信息。同样的道理,网站通过搜索引擎使用户发现自己,达到展现甚至收益的目的。可见SEO工作实际是围绕着用户、网站和搜索引擎3个核心要素展开的,它们之间的关系如图34所示。 如果用户在一个搜索引擎不能找到需要的信息,或者需要花费很长时间才能找到,那么用户极有可能转向其他搜索引擎。搜索引擎如果要迎合众多用户的需求,就要尽可能多地搜集网页,尽可能地把优质网页展示在搜索结果的前面,尽可能地根据关键字匹配到用户最需要的信息。 2. 核心目的 网站要在互联网中脱颖而出,首先要迎合搜索引擎的喜好,只有符合搜索引擎的要求,才有可能在搜索结果中靠前展示。当然,如果网站仅迎合了搜索引擎的喜好,却得不到用户的认可,最终也会被搜索引擎放弃。 所以,好的网站既要迎合搜索引擎的喜好(或者称为搜索引擎友好性),又要满足用户的需求;好的搜索引擎既能满足用户的需求,又能使好的网站有更多的展示机会。可见SEO工作的核心目的就是满足用户的需求,或者称为用户体验,如图35所示。 图34SEO工作围绕的核心要素 图35SEO工作的核心目的 3. 核心要素间的变化关系 SEO工程师的工作对象是网站,一个落脚点是用户方面,另一个是搜索引擎方面,偏向于任何一个方面,网站都不会取得长远的优化效果,要学会两手抓,两手都要硬,均衡发展。从用户体验的角度出发,当一方发生变化时,另一方也随之调整,达到用户体验的最优化。核心要素间的变化关系如表31所示。表31SEO核心要素间的变化关系 要 素状 态要 素状 态要 素状 态结 果备注用户需求变搜索引擎变网站变趋向新最优搜索引擎变用户需求不变网站变趋向新最优网站变搜索引擎变用户需求不变趋向新最优用户需求的变化主要是网民的需要和喜好;搜索引擎的变化主要是算法;网站的变化主要是结构和内容等表31的内容可以做如下解释: 用户需求发生了变化,搜索引擎的算法也要变化,提高用户的搜索体验,网站的内容、结构等方面也要跟上变化,否则网站的排名就会靠后。搜索引擎优先展示那些更符合算法的网站,搜索引擎的算法变了,用户的需求不变,为了更好地满足用户,网站的内容、结构等要跟上算法的改变,使自己的网站排名更靠前。网站的管理人员在运营中,不断做SEO工作,网站变得更优质,搜索引擎就要适时变化,使优化后的网站排名靠前,此时用户的需求没变,但他们的体验更好。 3.2.2SEO的优缺点 用户使用搜索引擎查询信息,很多时候搜索结果中会出现找到百万多个信息的提示。事实上,很多人可能在搜索结果的前几页就找到了需要的信息,或者翻几页后直接放弃,换一个关键字查询。也就是说,绝大部分搜索结果实际是“无用的”。 某个网站如果想在搜索结果中靠前排列,可以通过付费或者SEO的方式。但是这并不意味着付费推广的网站就没有必要做SEO了,这样极有可能出现付费结束后,网站排名迅速下降的情况。SEO的结果是网站价值的真实体现。 1. SEO的优点 1) 费用低 SEO工作除了人工成本外,基本不需要其他支出,而且正常的SEO技术还能给品牌形象、用户口碑等带来正面影响。 2) 效果持续 与付费营销结束后搜索结果不可预测不同,只要付出了,SEO就会有效果,并且这种效果是持续的,还会稳定上升,不大会受搜索引擎算法变更的影响。 3) 范围广 不同的搜索引擎具有很多相同的普遍规则,都建立在用户体验的基础上,经过SEO的网站,在各大搜索引擎的排名都可能提高。 4) 目标聚焦 用户通过搜索单击网站是一种主动行为,说明用户对网站内容在一定程度上是感兴趣的,如果用户在网站停留的时间比较长,解决了自己的问题,就极可能转化为网站的潜在客户。 5) 网站的吸引力更强 在互联网上,用户情愿或不情愿地被很多广告信息影响,他们更喜欢单击那些在搜索结果中自然排名靠前的网站,这些网站更能吸引用户的注意,并且用户在这些网站中往往能得到更好的应用体验。 6) 应用体验更好 如果网站要取得比较好的SEO效果,就必须对整个网站进行全方位的优化。这些优化从网站结构到网站内容,从域名到服务器,从链接到代码等,都要从用户习惯和搜索引擎运行的规律出发,这样优化的网站更容易带给用户良好的体验。 7) 网站更容易脱颖而出 很多企业并不重视SEO,这也给SEO工程师提供了很好的机会,特别是对于专业性的垂直网站来说,做付费推广都不是长远之计。当SEO工程师兢兢业业地做出搜索引擎和用户都喜欢的网站时,网站更容易在互联网中脱颖而出。 2. SEO的缺点 1) 见效慢 SEO的效果见效慢,甚至在一段时间内根本没效果,需要优化人员长期坚持下来,按照SEO的基本操作执行。 2) 不确定性 搜索引擎的运行规则与算法不为外界所知,人们只能通过其官方公布的资料和实际操作的经验推断出可能的优化方法,具有一定的不确定性。 3) 复杂性 互联网上的同类信息复杂多样、搜索引擎的算法复杂、网站需要优化的方面多、影响网站搜索排名的因素多、优化人员的素质和知识背景不同、某些优化方法需要多条件下相互印证等,都决定了SEO工作的复杂性。 3.3SEO的基本矛盾 从理论上讲,SEO工作的结果应该是网站按价值的优先级依次展示在搜索引擎的搜索结果中,用户对展现的搜索结果总是满意的,但现实情况难以实现。例如,在百度中搜索关键字“美食”,搜索结果如图36所示。 图36在百度中搜索“美食”的部分结果页界面 在百度数以亿计的搜索结果中,排在前4位的网站页面确实是其价值的真实体现吗?可以看到排在前两位的网站页面,百度已经标出是“广告”,也就是说它们可能不是用户最需要的内容。排在第3位的是百度图片,也可能不是用户需要的内容。可见搜索结果与SEO之间存在一定的矛盾,主要表现在以下几个方面。 1. 主体诉求不同带来的矛盾 用户、网站和搜索引擎之间诉求的差异存在一定的矛盾。用户通过搜索引擎从互联网中找到自己需要的信息是最主要的查询方式。网站通过提供内容吸引到用户,达到展示、宣传的目的,同时能在搜索引擎的结果中靠前排列,从而获得一定的收益。搜索引擎创建一个机制科学、富有吸引力的平台,吸引用户和网站聚集在平台上交互信息,最终取得一定的收益。 三者之间主要诉求的不同,导致在运行过程中难免会出现一些矛盾。例如,搜索引擎在搜索结果展现的黄金位置,优先安排给那些付费的网站;有些网站过于迎合搜索引擎的喜好,排名靠前,但对用户的价值一般等。 2. 主体喜好不同带来的矛盾 用户、网站和搜索引擎之间的喜好存在差异。由于技术、投入产出比等因素的影响,用户的很多喜好难以作为满足的首要条件。如用户更喜欢浏览一些图片、动画类的资料,但这些会影响存储空间、运行速度等,不被搜索引擎优先考虑;搜索引擎的技术发展是一个不断升级完善的过程,难以跟上用户的需求;有些网站出于成本考虑,选择的服务器不稳定、网站建设粗糙、缺少日常维护等,这些都是不被搜索引擎所青睐的。这些矛盾可能会随着主体的发展有所缓和,但它们是实实在在存在的。 3. 主体利益不同带来的矛盾 用户、网站和搜索引擎之间因为利益考虑而产生矛盾。这些矛盾有些是短期行为,受到惩罚后会改正,有些现象却经常发生,不会消失。如有些搜索引擎总会倾向于优先展现自己产品的相关信息,这些信息在专业性、阅读体验、质量等方面可能不如自然排名的网站,但是用户不得不接受这种现状。 4. 主体发展阶段带来的矛盾 在互联网发展的不同阶段,在用户、网站、搜索引擎各自发展的不同阶段存在一定的矛盾。这种矛盾会随着发展阶段的不同表现出不同的特点。如用户在使用互联网的初始阶段,可选择的余地小,对网站和搜索引擎的要求不是很高;网站在互联网初始阶段,竞争不是很激烈,对内容和结构的关注度一般;搜索引擎初始的技术水平一般,对一些网站违规行为疏于管控等。随着互联网的发展,用户、网站、搜索引擎也不断发展,它们之间也产生了矛盾,如用户更挑剔、网站竞争更激烈、搜索引擎算法更合理等。 总之,用户、网站和搜索引擎3个要素是矛盾的统一体。它们之间应相互依存,互为条件,互相补充,和谐相处。它们之间存在的矛盾也促进了各要素的不断进步,推动互联网的进步。同时,互联网的进步也促进了SEO工作的进步。 3.4SEO的发展趋势 互联网的信息量在不断增加,搜索引擎的算法在不断升级,SEO工程师的技术水平也在不断提高。在这个变化过程中,有些网站排名不断下滑甚至倒闭,有些网站排名不断上升,有些SEO从业者技术日渐精进,逐渐把握一些规律,有些从业者则跟不上时代的变化,在偏门左道上越走越远,不断被互联网抛弃。不管互联网怎么变化,始终以用户为中心的原则不会变。未来搜索引擎在搜索规则、搜索形式、排名因素等方面可能出现较大的变化,用户获取信息的渠道、方法也可能不同,SEO工程师要取得长远的进步,就要不断学习,开阔视野,认清未来SEO可能的发展趋势,提前做好应对准备。 1. 搜索途径广泛化 原来用户主要通过PC端的网络获取信息,随着移动互联网的发展,越来越多的人,越来越多地通过移动端获取信息。原来用户主要通过某个搜索引擎查询信息,随着市场竞争,将会有更多的搜索引擎参与到搜索市场的业务中来,用户的选择余地更大。随着物联网技术、智能设备的发展,未来用户极有可能通过电视、冰箱等终端设备搜索部分信息,形成生活场景搜索渠道等。以上这些变化要求SEO工程师掌握多途径的产品优化方法,在不同的应用场景中都能取得较好的优化效果。 2. 搜索方式多元化 当前,人们搜索信息基本是在搜索引擎的搜索框内输入关键字,然后在搜索结果中找寻自己认为满意的页面链接。这种方式比较单一,给用户带来了不便。如用户看到了一张图片,想查找这张图片的来源,就难以用文字表达。未来用户可以通过语音、图片、手势等多种方式进行搜索,搜索更加方便、快捷。这要求SEO工程师掌握不同搜索方式的优化方法,使产品在不同的搜索方式下都能得到较好的信息展现。 3. 搜索算法智能化 目前搜索引擎的算法还是以关键字匹配为主要信息提供方式,未来搜索引擎将更加理解用户的真实需求,将更符合用户需求的页面展现给用户。像搜索引擎能够记录用户使用互联网的习惯,从历史数据中判断用户的真实需求,也就是说在不同的搜索终端,用户搜索同一个关键字将得到个性化的搜索结果。例如,搜索引擎除了识别和分析页面的关键字外,更能够识别页面的主题思想,分辨出页面的核心表达内容,将其与用户的搜索请求精准匹配;再如搜索引擎能够从用户的搜索请求中判断出用户的真实需求,提醒用户哪些是他最需要的信息,从用户体验上升到用户洞察的层次;又如搜索引擎将更智能地分析用户的行为,通过对用户使用搜索引擎行为的记录和分析,得出网站的真实价值。 4. 搜索领域细分化 不管软件和硬件怎么变,用户通过搜索满足自己对某些信息的需求不会变,追求更好的搜索体验不会变。网络上的资源非常丰富,在细分领域里,越专业的信息,对用户越有用,越能解决用户的问题,这样的页面价值也越高,搜索引擎也会越重视。如某人使用某件商品的原创心得,是他在使用过程中遇到的问题和真实感受,搜索用户就是想通过这种切身体验来判断自己是不是应该购买。这样的内容对用户的价值高,搜索引擎就会把这样的页面排在搜索结果页的前面。 5. 搜索场景现实化 搜索引擎自身技术水平的提高,结合物联网等设备的广泛应用,让用户有机会体验搜索场景带来的现实体验。如用户搜索某家餐馆,搜索引擎就会以立体场景的形式显示餐馆周边及餐馆内部的现实图像,使用户犹如身临其境。这是在枯燥的文字、图片基础上的创新,更有利于提升用户体验。 3.5搜索引擎的算法与作弊 有些SEO工程师利用搜索引擎算法的漏洞实施作弊行为,达到欺骗搜索引擎的目的,使自己的网站或信息优先展示在搜索结果中。因此,搜索引擎的算法除了为用户和网站提供更好的服务,还要跟作弊行为作斗争,不断完善算法,打击作弊行为,维护信息的公平与公正性,保证用户、网站、搜索引擎三者间的利益平衡。 3.5.1搜索引擎的算法 搜索引擎通过特定软件系统搜集互联网上的海量信息,经过一系列的数据运算程序,向广大用户提供满足需求的搜索服务。这个过程实际就是一个复杂的数据处理过程,通常我们把数据处理中用到的方法或运算程序称为算法。 各大搜索引擎使用的算法都不为人所知,人们只能通过搜索引擎官方公布的一些信息,或者计算机领域内公开的知识,去推测搜索引擎可能使用的算法。或者人们把搜索引擎看成“黑匣子”,通过搜索引擎收录数据,经过处理后得到输出结果,并通过输入数据参数的变化,根据输出结果的变化来判断搜索引擎可能的算法等。 总之,大多数人不会从事技术性特别强的算法开发或处理工作,本节仅从应用的角度介绍相关算法内容。表32列出了不同搜索引擎官方公布的几个算法名称及核心内容,供读者了解,以对搜索引擎优化方面有所借鉴。搜索引擎每一次算法的发布和更新,都是为了维护和打造更好的搜索体验,创建良好和谐的互联网搜索环境。续表表32搜索引擎的算法 搜索引擎名称算法名称公布时间主要解决问题备注Google熊猫算法2012.1针对网站内容页面质量进行审核过滤,将质量低、含有垃圾内容的网页的排名降低,使高质量的内容得到应有的好的排名此后不断更新企鹅算法2012.4降低那些充斥着广告的网站的权重,提升高质量网站的排名此后不断更新百度绿萝算法2013.2.19打击买卖链接的行为,包括超链中介、出卖链接的网站、购买链接的网站等7月升级到2.0版本,加大力度过滤软文中的外链及惩罚发软文的站点石榴算法2013.5.17打击含有大量妨碍用户正常浏览的恶劣广告的页面冰桶算法2014.8.30打击强行弹窗App下载、大面积广告等影响用户正常浏览体验的页面此后,不断升级到2.0版本、3.0版本、4.5版本,严厉打击在百度移动端搜索中,打断用户完整搜索路径的行为,抵制不健康内容等天网算法2016.8打击网页嵌入恶意代码,用于盗取网民的QQ号、手机号等行为蓝天算法2016.11主要打击新闻源站点售卖软文、目录行为360搜索ICO(Index Clear Optimize)算法2014.5对已经入索引库的低质量URL和无效URL数据进行清理悟空算法2016.12快速、准确地识别针对网站的各种黑客攻击行为,及时发现被黑网站此后升级到2.0版本,能更加准确、快速地识别各种网站被黑客攻击的行为后羿算法2016.12对低劣的采集站点加以控制,对原创和稀缺性网页进行保护和提权,同时确保新闻网站之间正常的转载行为不受影响3.5.2作弊 人们使用搜索引擎搜索资料,很多人往往在前几页找不到满意的答案时,不会一直向后翻页,很可能会更换关键字,重新搜索。这种搜索习惯及搜索引擎的搜索排名机制决定了页面排名越靠前,越有可能被用户单击进入;越靠后,越不容易被用户发现。因此很多站长为了使自己的网站得到更多的展现,采用一些作弊手段短时间内取得较好的搜索排名。这种行为损害了其他网站的权益,影响了用户体验,搜索引擎一旦发现网站作弊,网站就会被降权或封禁。 1. 作弊的概念 搜狗搜索引擎认为,网页作弊是指在网页设计中,为了提升网页在搜索引擎中的排序而做的欺骗搜索引擎的行为。 百度搜索引擎认为,作弊网页是指不以满足用户需求为目的,而是通过不正当手段欺骗用户和搜索引擎从而获利的网页。任何利用和放大搜索引擎的策略缺陷,利用恶意手段获取与网页质量不符的排名,引起用户搜索结果质量和用户搜索体验下降的行为都会被搜索引擎当作作弊行为。 SEO中的很多手法不能被判定是不是属于作弊范围,存在一个发展与认定的过程。互联网在不断发展,搜索引擎的技术也在发展,很多人原来认为合法的优化方法,可能会被搜索引擎判定为作弊。如果某个行为泛滥,影响到了搜索引擎,最终伤害到用户的搜索体验,这个行为就会被认为是作弊行为。作弊手法与搜索引擎的反作弊技术处于一种长期斗争之中,最终使网络环境趋向于越来越公平、合理的搜索环境。 2. 黑帽技术、白帽技术、灰帽技术 在SEO工作中,经常有黑帽技术、白帽技术和灰帽技术的说法。黑帽技术实际上就是SEO的作弊手法,不符合主流搜索引擎的优化规定,具有短平快的特点,在短期内取得一定利益。 白帽技术是正常的优化技术,采用SEO的思维,合理优化网站,提高用户体验,提升网站的搜索排名。白帽技术关注网站的长远利益,需要较长的优化时间,效果稳定。 灰帽技术介于黑帽技术和白帽技术之间,是一种多样化的优化手段,既考虑长远利益,也考虑短期的收益问题,使用得当时会达到优化目的,使用不当时会被视为作弊,其中的度较难把握。 3. 常见的作弊手法 1) 隐身法 隐身法即网页设计的部分内容对搜索引擎可见,但对用户不可见,达到欺骗搜索引擎的目的,常见的有隐藏文本和隐藏链接两种方式。例如,把文本或链接文字的字体颜色设置为与页面背景色相同或十分接近的颜色,或者使用超小号文字、将文字放在图片层的后面、滥用图片的alt标签等行为都属于隐身。 另外一种隐身的方式是,网站提供一些隐性页面。这些页面对访问者或者搜索引擎隐藏真实的页面内容,向搜索引擎提供非真实的、对搜索引擎友好性强的内容,以提升搜索排名。 2) 分身法 第一种分身法通常是站长向搜索引擎提交经过优化的网站页面,网站被收录后,再用其他非优化的页面替换该网站,达到排名靠前,同时又向用户展示目标信息的目的。网站的优化页面按照搜索引擎的喜好设计,大大提升友好性;网站的非优化页面按照企业营销或者收益的目的设计,忽略用户的体验。这种做法严重影响了搜索引擎的真实性、客观性和权威性,降低用户对搜索引擎的好感,为搜索引擎所深恶痛绝。 第二种分身法就是欺骗性重定向,即把用户访问的第一个页面(着陆页)迅速重定向至另一个内容完全不同的页面。用户访问的着陆页是被搜索引擎识别参与排名的页面,重定向的页面是网站想让用户浏览的页面。例如,搜索结果中显示有关“SEO方法”的链接,用户单击后,展现给用户的是某广告页面,这将引起用户的反感。 第三种分身法是网站镜像,即站长建立大量镜像网站,复制网站或网页的内容并分配以不同域名和服务器,欺骗搜索引擎对同一页面内容进行多次索引。 3) 误导法 网站采用误导的方式引起搜索引擎的关注,取得较好的搜索排名,同时吸引用户访问网站。常见的行为主要有以下几种。 (1) 使用虚假关键字。网站页面中使用与页面主体内容不相关的关键字,误导用户访问网站。这种页面通常不能给用户带来多大的帮助,体验不佳。 (2) 堆砌关键字。页面中出现多个关键字,并且有意识地堆砌,引导搜索引擎判定页面内容与关键字有高度的相关性,从而提升搜索排名。 (3) 使用垃圾链接。站长为了强调网站的外部链接,增加外链权重,引起搜索引擎的重视,在两个网站的页面中互相建立大量指向对方网站的链接。 (4) 使用日志欺骗行为。通过对一些页面等级较高的站点进行大量的虚假单击以求名列这些站点的最高引用者日志中,从而获得它们的导入链接。 (5) 让页面包含恶意广告、恶意代码或恶意插件。用户单击搜索结果的链接进入页面后,页面会出现悬浮广告跟随鼠标移动、广告信息占据显眼位置、广告信息满屏显示等方式,使用户不得不单击广告才能顺畅地浏览信息。有些页面存在恶意插件自动下载安装,或者用户安装后才能正常浏览页面信息等行为,给用户带来较差的体验。 4) 假冒法 非法人员利用正常网站的漏洞,黑掉网站,偷偷放上作弊内容,通过搜索引擎获取流量,并利用木马盗取用户信息。例如假冒知名公司官网,用户在其网站上发生交易完全没有保障。 常见的还有非法人员利用BSP、BBS、分类信息等渠道发布虚假的知名公司的客服电话,用户拨打电话后诈骗用户钱财。 3.5.3反作弊 搜索引擎主要是通过算法升级应对作弊行为。搜索引擎的反作弊系统会实时监控作弊网站,一旦发现网站存在作弊行为,就会根据作弊等级对作弊网站进行相应的处罚。 1. 主流搜索引擎的反作弊惩罚 (1) 搜狗搜索引擎的处罚。 搜狗搜索引擎对作弊网站的处罚主要分为3级。 ① 常见处罚: 降低网站在搜狗的整体排名。 ② 一般处罚: 仅索引正常网页如首页,其他网页不予收录。 ③ 严厉处罚: 包含非法内容及恶意程序、用户集中投诉的网站,搜狗将拒绝收录整个网站。 (2) 百度搜索引擎的处罚。 百度搜索引擎认为任何损害用户利益和搜索引擎结果质量的行为,都应受到搜索引擎的惩罚。作弊行为在不断发展,搜索引擎的处理手段也在不断变化,但始终都会维持“轻者轻罚,重者重罚”的原则。 ① 轻者轻罚: 对用户体验及搜索结果质量影响不大的,去除作弊部分获得的权值。 ② 重者重罚: 对用户体验及搜索结果质量影响严重的,去除作弊部分获得的权值并降低网站的权重,直至从搜索结果中彻底清除掉。 2. 申请解除处罚的方法 (1) 搜狗搜索引擎解除处罚。 被搜狗视为有作弊行为的网站,在清除作弊内容后,可在站长平台中的网站申诉,提交解除作弊处罚申请。 搜狗工作人员会在收到申诉之后的20~30个工作日内对站点质量进行审查,如果确认网站已经不存在作弊行为,搜狗将恢复对该网站的正常收录。解除处罚的网站一旦被发现再次作弊,将会受到更为严厉的处罚,可能导致永久封禁。 (2) 百度搜索引擎解除处罚。 百度认为: 惩罚不是目的,让互联网洁净才是目的。取消作弊行为的网站,百度都持欢迎态度。百度有完善的流程,会定期自动对作弊网站进行检测,大部分修正了作弊行为的网站,会在一定的观察期满后自动解除惩罚。 补充知识点: 网站被黑问题 以下内容来自搜狗搜索引擎站长平台,供读者参考。 1. 什么是网站“被黑” 网站被黑,是指黑客利用网站的程序、设置等方面的安全漏洞或管理员安全疏忽(如密码复杂度低),未经管理员授权,对网站进行了篡改(例如添加垃圾内容或者添加其他网页)或者向网站注入恶意代码等。 2. 如何知道是否“被黑” (1) 分析系统日志、服务器日志,检查自己站点的页面数量、流量等是否有异常波动,是否存在异常访问或异常操作日志。 (2) 检查网站文件是否有不正常的修改,尤其是首页等重点页面。 (3) 网站页面是否引用了未知站点的资源(图片等),是否被放置了外站的异常链接。 (4) 检查网站是否有不正常增加的文件或目录。 (5) 检查网站目录中是否有非管理员打包的网站源码、未知txt文件等。 3. 如何处理“被黑” 步骤一: 避免问题扩大。 (1) 立即关停自己的网站以避免感染其他网站(如果有权访问自己的服务器,则最好将其配置为返回503状态代码)。 (2) 与自己的网络托管商联系,了解是否已经采取措施解决问题。 (3) 更改所有用户和所有账户的密码(如FTP访问密码、管理员账户密码、内容管理系统授权账户密码)。 (4) 删除所有被窜改或被恶意增加的页面,并在搜狗站长平台,通过死链提交告知搜索引擎删除搜索结果中的被黑数据。 步骤二: 评估损失。 (1) 使用最新的扫描程序扫描计算机,找出任何可能由黑客添加的恶意代码。请务必扫描所有内容,而不是仅扫描基于文本的文件,因为恶意内容往往会嵌入图片中。 (2) 删除被黑的网页或网址。这样可防止系统向用户提供被黑的网页。向搜索引擎报告网上诱骗网页。 (3) 查看 antiphishing.org中针对被黑的网站的处理方法。 (4) 如果网站管理者还有其他网站,请检查它们是否也已被黑。 步骤三: 如果有权访问自己的服务器,请继续以下步骤。 (1) 检查自己的网站中是否有已遭到攻击的开放重定向网址。 (2) 根据所用的网站平台,检查.htaccess文件(Apache)或其他访问控制机制,以找出恶意更改。 (3) 检查服务器日志,以查看文件被黑的时间(记住,黑客能更改日志)。查找是否有可疑的活动,如失败的登录尝试、命令(尤其是以根用户身份发出的命令)、历史记录或未知的用户账户。 步骤四: 清理自己的网站。 清理网站的内容,根据病毒扫描程序的识别结果删除黑客添加的所有网页、垃圾内容和可疑代码。如果网站备份了内容,则可考虑彻底删除自己的内容,然后替换为已知的最新的完好备份(已核实既无漏洞又不含被黑内容的一次备份)。 步骤五: 如果有权访问自己的服务器,请做以下工作。 (1) 将所有软件包都更新到最新版本。搜索引擎建议使用可靠的来源彻底重新安装操作系统,以确保删除黑客篡改的所有内容。另外,如果安装了博客平台、内容管理系统或任何其他类型的第三方软件,请务必将其重新安装或进行相应更新。 (2) 确信自己的网站不含漏洞后再改一次密码。 (3) 将系统设置为可公开访问。更改服务器配置,使其不再返回 503 状态代码,并且采取所有其他必要措施向公众开放自己的网站。 步骤六: 申请解除屏蔽。 当网站管理者按照以上提示仔细排除异常后,可以告知搜索引擎站点已经清理完毕被黑数据。申请解除对网站的屏蔽,在未完全排除全部异常的状态下提交申请,将无法通过搜索引擎的检查,进而无法解除屏蔽。 网站申诉处理周期一般为20~30个工作日,工作人员将会对站点内容进行检测,当确定完全排除全部异常状态之后,站点会被解除屏蔽。 4. 如何防止“被黑” (1) 通过定期检查服务器日志等方式发现问题,确定是否有可疑的针对非前台页面的访问。 (2) 经常检查网站文件是否有不正常的修改或者增加。 (3) 关注操作系统,以及所使用程序的官方网站;及时下载补丁,修补安全漏洞;必要时建议直接更新至最新版本。 (4) 修改开源程序关键文件的默认文件名(作弊者通常通过程序自动扫描某些特定的文件是否存在来判断是否使用了某套程序)。 (5) 修改默认管理员用户名,提高管理后台的密码强度,使用字母、数字及特殊符号多种组合的密码。 (6) 关闭不必要的服务及端口。 (7) 关闭或者限制不必要的上传功能。 (8) 设置防火墙等安全措施。 (9) 若问题反复出现,建议重新安装服务器操作系统,并重新上传备份的网站文件。 (10) 缺乏专业维护人员的网站时,建议向专业安全公司咨询。 练习 1. 请读者举例说明为什么要坚持SEO工作的3个基本导向。 2. 请读者举例说明SEO三要素之间是矛盾与统一的结合体。 3. 请从人工智能、VR技术、物联网设备的应用等角度,找出具体实例,然后分析SEO的发展趋势。 4. 请读者根据日常中遇到的网站作弊行为分析它属于哪一类。 第4章〓SEO的基本工具 本章目标  熟悉SEO的站长平台。  熟悉SEO的第三方平台。  熟悉SEO的查询工具。  熟悉SEO的其他常用工具。  熟悉淘宝SEO工具。 SEO工程师对网站进行优化操作是一项长期、复杂、涉及面广、技术性的工作。为了方便SEO工程师工作,很多搜索引擎平台或者第三方专业机构都提供了实用的工具。SEO工程师利用这些工具得到更多、更准确的参考数据,方便了SEO工作,这些工具也为SEO工作的推广提供了捷径,有利于整个互联网信息水平的提升。但是SEO工具提供的数据仅作为开展工作的参考,甚至不同工具对同一个指标的数据分析结果不同。实际工作中,SEO工程师要灵活运用这些工具,掌握系统的优化方法,从实践中总结经验,不断提高优化水平。 本章分为两部分介绍SEO的基本工具: 全文SEO工具,淘宝SEO工具。 4.1全文SEO工具 本节主要内容有SEO的站长平台、SEO的第三方平台、SEO的外链查询工具、SEO的关键字查询工具、SEO的数据统计工具、SEO的流量查询工具、SEO的网站检测工具、SEO的其他常用工具。 4.1.1SEO的站长平台 站长平台工具是搜索引擎平台自己开发的工具。用户可以使用平台工具提供的各项功能优化或查询自己的网站或需求的信息。常见的站长平台有百度搜索资源平台、搜狗站长平台、360站长平台、Google站长平台等。 1. 百度搜索资源平台 百度搜索资源平台是全球最大的面向中文互联网管理者、移动开发者、创业者的搜索流量管理的官方平台(见图41)。百度搜索资源平台提供的产品线完整、工具丰富,具有一定的权威性和通用性,聚集了国内的许多SEO优秀人才,是站长进行SEO工作的重要依据。 图41百度搜索资源平台部分界面 百度搜索资源平台提供了有助于搜索引擎抓取收录的提交和分析工具、SEO的优化建议等;提供了面向移动开发者的百度官方API(Application Programming Interface,应用程序编程接口),以及多端适配的能力和服务;及时发布百度权威数据、算法、工具等升级推新信息。具体来说,百度搜索资源平台提供了移动适配、链接提交、流量与关键字、官网保护等工具,还提供了站长学院、站长社区、VIP俱乐部等产品。 网站管理者在百度搜索资源平台验证网站后,网站的数据变化将更容易被百度接收,能够准确查询网站在百度的各种数据;能够使网站在百度搜索结果页获得个性化的展示,获取更多流量;可以快速向百度反馈网站问题,跟踪处理进度;移动端网站的开发者可以通过特定产品更容易将搜索用户转化为自身用户。 2. 搜狗站长平台 搜狗站长平台是搜狗搜索引擎与站长沟通的平台,为站长提供多种服务(见图42)。平台为站长提供了一系列工具,帮助站长有效提升网站搜索引擎的友好度,将优质的内容快速展示给用户,带来更多的流量。 第4章SEO的基本工具SEO搜索引擎优化实战搜狗站长平台提供了Sitemap(网站地图)提交、死链提交、URL提交、网站域名变更、抓取压力五大工具,可帮助站长诊断和优化网站,进一步改善搜索引擎对网站的抓取和收录效果。同时,站长还可以便利地查询网站索引量和收录量的走势,更加全面地掌握网站运营和发展态势。 图42搜狗站长平台部分界面 平台还提供了“提交中文站点名”和“网站favicon”两个实用工具。只要站长提交相对应的网站中文名称和网站icon之后,当网站首页、站点内URL出现搜狗搜索结果时,会同时显示网站icon,并将网站中文名和URL进行匹配,搜索结果更加友好,还可进一步扩大网站品牌和形象的曝光度。 搜狗平台有利于中小网站群体的成长,可进一步改善生存环境,形成搜索引擎、站长和用户多赢的局面。 3. 360站长平台 360站长平台是360搜索引擎提供的站长与站长之间、站长与搜索引擎之间交互的平台,是服务于用户、满足用户需求的平台,如图43所示。 图43360站长平台部分界面 360站长平台提供了数据提交、数据分析、官网认证、移动适配等工具,还有网站检测小工具、站长论坛、意见反馈等产品,帮助用户更好地了解和享受360站长产品的服务。