百度发布《移动搜索建站优化白皮书》:网站建设…

百度发布《移动搜索建站优化白皮书》:网站建设…,第1张

百度发布《移动搜索建站优化白皮书》:网站建设…

站长之家(Chinaz.com)注:在高调推出迅雷算法之后,百度悄然发布了《移动搜索网站优化白皮书》(以下简称白皮书)。在《白皮书》中,百度阐述了移动搜索引发的规则,为站长们提供了安全建站、优化网站的相关建议。

接下来:百度移动搜索网站优化白皮书的网站优化

以下是来自百度搜索资源平台的《百度移动搜索网站优化白皮书》中关于“网站建设”的内容:

1  前言

百度是6亿用户使用的手机搜索客户端,在获取中文用户信息方面发挥着不可替代的作用。移动搜索引擎每天向优质安全的网站分发上亿流量,满足用户的搜索需求;对于广大站长来说,一个优质安全的网站有助于在搜索引擎中获得良好的排名和呈现,从而吸引更多的用户,获得更多的流量。

移动搜索引擎优化是指从网站建设到吸引用户的全过程。为了让百度搜索的重要合作伙伴站长们充分了解百度搜索引擎规则,并根据规则合理安全地建设和优化网站,从而获得更好的搜索流量;百度搜索资源平台历时3个月,走访了搜索中的各个技术部门,将百度搜索的内部技术原理进行了分片剥离,编写了《百度移动搜索网站优化白皮书》,希望与站长们一起,为用户提供一个健康、安全、高效的搜索环境。

2 网站建设

2.1域名选择

网站域名的选择不仅可以让用户快速直观地了解网站定位和域名设置,还会影响搜索对网站的抓取。所以选择一个简单安全的域名是网站建设前期最重要的一步。

2.1.1域名选择注意事项

在网站建设之初,建议网站的域名要独立、简单、好记。独立移动台的域名选择也遵循这个规律。

移动站的域名应与PC站的域名分开,不建议移动站与PC站共用一个域名;比如PC网站的域名建议是www.test.com,对应移动站的域名是m.test.com,而不是www.test.com/m/.如果是自适应网站,就不要考虑这种情况。

2.1.2使用子域或目录

网站是否需要建立子域名或者划分多级目录,可以根据网站自身的定位和网站的内容级别来决定。一般来说,综合类网站或者内容量大的网站,可以根据不同的二次元域明确划分内容;但如果网站内容较少,不建议在网站上开太多子域。

比如博客网站,有的网站给每个博主一个单独的三级域名,但是如果作者发布频率低,整个三级域名就处于更新频率低的状态,发布频率太低对搜索引擎不友好。

2.2内容发布系统

内容发布系统,无论是网站自建还是使用第三方网站系统,百度都支持;所有的发布系统,除了有条不紊有逻辑的建设网站,还应该注意网站建设的安全问题,避免网站的安全隐患,从而更好的提升网站的价值。

2.2.1自建内容发布系统

自建网站内容发布系统,注意事项包括:

√主要内容明确,能够很好地识别和区分;

√不要自己在后台设置发布时间,遵循发布时间与显示时间一致;

√内容发布系统中各表单设置合理,如设置过多标签、列出关键词等;

√分类明确,有分类主题的文章在相应分类下对应发布;

√题字一致,不要挂羊头卖狗肉,欺骗搜索引擎流量,损害用户体验;

√段落清晰合理,字体大小适中,字体颜色不应与背景色相近;

√发布内容目录划分明确。详见第二节网站结构设置。3.

2.2.2第三方发布系统

使用第三方发布系统搭建网站时,站长需要注意以下注意事项:

√模板主题不建议经常更换;

√类似wordpress等系统,不建议使用太多插件,会影响网页打开速度;

√URL伪静态处理,命名规范,层次清晰;

√开源网站系统存在很多安全隐患,在使用过程中必须做一些安全设置和优化;

2.2.3页面生成规范

无论是网站自建发布系统,还是网站使用第三方建站系统,网站页面的生成都需要注意以下几点:

网页结构清晰,各类别名称设置突出;

导航和面包屑导航设置合理,机读突出,用户可以知道被访问页面在网站中的位置;

没有遮挡主要内容的广告元素;

三俗图文音频元素;

重视网站建设系统的安全问题,杜绝网站安全隐患。

需要根据相应的类型正确设置访问请求中的内容类型,如下所示:

另外,关于页面规范的标准,建议参考搜索研究院发布的《百度搜索移动友好标准V1.0》。

2.3网站结构

设置合理的网站结构是网站快速被抓取并获得搜索流量的基础;由于网站结构设置不合理,在百度日常反馈中经常看到网站无法被快速识别和抓取,更改网站域名也会给网站造成一定损失。所以希望站长们从建站之初就注意网站结构设置,避免不必要的损失。

2.3.1URL结构设置

网址建设有严格要求吗?请注意以下几点:

在搭建网站结构和制作URL时,尽量避免非主流设计,追求简洁美观。越简单越普通越好。比如URL中出现不常用的字符,比如不常用的“II”,会造成搜索引擎识别错误。

不建议网址包含汉字,容易出现编码转换问题,导致识别错误。

url长度要求协议头http(s)://之后的URL长度不能超过256个字节。

小心使用#参数;有效参数不能放在#后面;可能会被截断,导致网页抓取异常。

2.3.2目录结构设置

网站目录结构是否合理,会影响搜索引擎对网站的抓取。这里需要提到的是,网站目录结构,无论是平面的还是树形的,一般都能被搜索引擎找到,但有以下几点需要注意:

建议将不同的内容放在不同的目录或子域中,域名划分在2.1章中有详细提及。2网站域名划分。

不要使用孤岛链接,很难被搜索引擎快速找到;如果网站上已经存在大量孤立链接,建议使用搜索资源平台的链接提交工具向百度提交数据。

重要内容不建议放在深度目录。如果内容没有大量的内部链接,搜索引擎很难判断页面的重要性。

下面是一张图的例子:

2.4服务提供商/自建服务器

选择服务商或者自建服务器是网站建设中非常重要的一环;服务器的安全性和稳定性将直接影响百度搜索引擎对网站的整体判断。

2.4.1域名服务

2.4.1.1域和服务及部署域名

关于域名服务和域名部署,有以下注意事项:

√站长,请注意域名部署的各个环节,域名部署不要出错。

√不建议网站泛解析。如果影响不好的网站出现大规模泛解析,就会被搜索策略压制。

√尽量选择优质域名服务商。

2.4.2服务器

网站还有一个很重要的部分,就是服务器的选择。在选择服务器时,无论是虚拟主机、云主机还是独立服务器,您都需要注意以下四点:

√中文网站不推荐国外服务器

√服务器的稳定性很重要。保持通路畅通是必要的。无论服务器是否稳定,都可以使用百度搜索资源平台(原百度站长平台)抓取异常,抓取诊断工具进行检测和维护。(服务器经常无法访问或者崩溃,这对爬虫来说是致命的)

√服务器的选择除了自身的稳定性之外,其实还要考虑网站的业务量,比如带宽、内存、CPU能否承受访问量,以及在流量突然变大的情况下能否正常访问。

√服务器主机设置,需要注意是否有禁止爬虫抓取的设置或者404错误信息设置,会造成搜索引擎不必要的异常抓取判断,给网站带来不必要的损失。

虚拟主机

一般来说,建议在购买虚拟主机时要特别注意:

√主机公司是否限制搜索引擎的访问;

√主办公司资质是否符合要求;

√主机公司的技术沉淀是否足够,建议选择品牌较大的主机公司;

√主机公司托管的机房物理条件和网络条件是否足够优秀;

√主机公司的技术和客服支持是否足够好;

√主机厂商是否会出现产能过剩;

√主机公司是否存在非法访问高风险网站的问题或者同一IP下是否会存在高风险网站。

√国内站点建议购买国产云主机建站;

2.4.2.2独立主机

独立主机给网站带来了更加宽松的环境和个性化的软件安装,所以独立主机要求站长要有一定的技术力量来保证网站的正常运行和安全。

我们对站长购买和托管独立主机的建议是:

√注意虚拟主机是否将爬虫IP列入黑名单。百度UA请参考3.1.2节。1百度蜘蛛;

√推荐有独立IP地址的主机;

√建议使用较大机构的主机,在安全配置和稳定性方面相对更好;

√需要考虑IDC服务商的建设标准,如防火、防盗、UPS保障、室内温控、消防等。

IDC服务商的服务质量和技术是否达标,是否24小时有人值班,是否能协助排除部分故障,免费重启重装系统等。

IDC机房资质是否齐全,存储场所是否有高风险场所或服务器。

2.4.3安全服务

2.4.3.1HTTPS

目前,百度已经实现了全站HTTPS安全加密服务,该服务已经覆盖主流浏览器,旨在为用户打造更加私密的互联网空,加速国内互联网的HTTPS。同时,我希望更多的网站加入HTTPS团队,为网络安全做出贡献。

  • HTTPS安全原则分析

  • HTTPS主要由两部分组成:HTTP+SSL/TLS,即在HTTP上增加了另一层处理加密信息的模块。服务器和客户端之间的信息传输会被TLS加密,所以传输的数据都是加密数据。从下图中可以看出HTTPS和HTTP之间的主要区别:

    HTTPS复杂的加密机制有效增加了网站的安全性,加密机制和认证机制可以降低网站劫持和假冒的风险。建议站长们可以通过做HTTPS变换来加强网站的安全性。

    为了更好地捕捉和识别HTTPS网站,百度搜索资源平台还于2017年推出了HTTPS认证工具。完成HTTPS改造的网站可以在搜索资源平台-网站支持-HTTPS认证工具中提交网站的HTTPS数据,方便百度更好的抓取和识别网站。关于HTTPS认证工具的详细解释,请参考5.3.2节HTTPS认证工具。

    2.4.3.2防止网站被黑的对策

    网站被黑通常表现为网站中出现大量非本网站发布的类似赌博内容,或者网站页面直接跳转到赌博页面;以下是网站被黑后发表的内容:

    内容不在网站上发布,内容包含大量赌博网站,指向:

    网站直接跳转到博彩网站:

    被黑网站代表网站安全存在严重问题或漏洞。关于如何防止网站被黑,请参考以下内容:

    首先检查一下是否被黑了

    √被黑网站在数据上有一个特点,就是短时间内来自搜索引擎的索引量和流量异常。所以站长可以使用百度搜索资源平台(原百度站长平台)的索引工具,观察站点的索引是否异常;如果数据异常,通过流量和关键词工具检查获取流量的关键词是否与网站、赌博、色情相关。

    √通过站点语法查询站点,结合一些常见的色情、赌博关键词效果更好。有可能找到不属于该网站的非法页面。

    √由于百度的巨大流量,一些被黑行为只跳转到百度带来的流量,站长很难发现。所以,在检查自己的站点是否被黑的时候,一定要从百度搜索结果中点击站点页面,看看自己是否跳转到了其他站点。

    √网站内容在百度搜索结果中提示有风险。

    √后续可以请网站技术人员通过后台数据和程序进一步确认网站是否被黑。

    其次,被黑后怎么办

    √确认网站被黑后,SEO人员除了推送技术人员快速修复外,还需要做一些善后和防范工作。

    √如果网站有页面变化,建议使用链接提交工具向百度提交数据。

    √立即停止网站服务,以免用户受到影响,其他网站也受到影响。

    √如果同一主机提供商的多个站点在同一时期被黑,可以联系主机提供商,督促对方响应。

    √清理发现的被黑内容,将被黑页面设置为404死链,通过百度搜索资源平台(原百度站长平台)的死链提交工具提交。(我们发现有些网站采取了将被黑的页面跳转到首页的做法,非常不可取。)

    √查看可能的黑客攻击时间,与服务器上的文件修改时间进行比对,对黑客上传修改的文件进行处置;检查服务器中的用户管理设置,确认是否有异常变化;更改服务器的用户访问密码。注意:可能的黑客攻击时间可以从访问日志中确定。然而,黑客也可能修改服务器的访问日志。

    √做好安全工作,检查网站漏洞,防止再次被黑。

    网站自我保护注意事项:

    √多重安全防护同时进行:适用于中小型资讯网站。

  • 网站频繁打补丁:现在很多资讯网站都使用内容管理系统(CMS)。作为一个新闻发布系统,功能还算不错。但是作为常见的CMS,还有一个问题,就是漏洞比较流行。由于源代码是开放的,很容易发现漏洞,需要及时修复网站程序的漏洞。

  • √对服务器进行日常安全防护。

  • 下班后,在服务器上设置网站权限,禁止文件修改,将后台文件隐藏或迁移到根目录之外。

  • 参考一些网站的安全设置。无法将无限制的IP写入数据库。

    √不要使用开源程序默认的robots文件。

  • 下图是某地级市某资讯网站的robots文件。从robots文件中可以看出,网站使用的是织梦后台,因此黑客可以通过各种旨在织梦的软件进行 *** 作,或者对织梦网站常见的漏洞进行扫描攻击。

  • 网络服务

    2.4.4.1CDN

    从搜索和抓取机制来说:百度蜘蛛抓取站点的方式和普通用户一样。只要普通用户可以访问的内容,百度蜘蛛都可以抓取。不管用什么技术,只要用户能顺利访问网站,对搜索引擎没有影响。但是有站长反映,使用CDN后出现了一些问题,比如网站抓取异常,甚至流量异常,主要是两个因素造成的:

    有的CDN服务商硬件投入不够,往往导致不稳定,会导致大量蜘蛛抓取失败,从而影响网站抓取效果,有的甚至影响索引数据;所以,选择一个有实力的CDN服务商很重要;

    二是缓存机制在网站出现死链、打不开、被黑等情况时起到了推波助澜的作用。短时间内产生了一些不利的快照,影响了排名。这种情况不用担心。可以通过及时清理源文件和CDN缓存,在百度搜索资源平台(原站长平台)提交相关死链数据来恢复。

    欢迎分享,转载请注明来源:内存溢出

    原文地址: https://outofmemory.cn/zz/763413.html

    (0)
    打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
    上一篇 2022-05-01
    下一篇 2022-05-01

    发表评论

    登录后才能评论

    评论列表(0条)

    保存