为什么要做SEO?
什么是seo?
全称:SEO是英文搜索引擎优化的缩写,其中文意译是“搜索引擎优化”的定义:
SEO就是在了解搜索引擎自然排名机制的基础上,从内部和外部对网站进行调整和优化,提高关键词在搜索引擎中的自然排名,获得更多的流量,从而达到网站销售和品牌建设的目的。
一般来说就是优化网站的技术和过程,提高搜索引擎的相关搜索排名,从而获得更多的流量。
为什么要做seo?
搜索流量质量高:主动搜索的用户基本都有相关需求。这些流量留存率高,转化率高,是非常优质的流量来源,性价比很高。相比其他宣传方式,付出的成本低很多,可扩展性高很多。网站可以不断增加关键词和相关流量,长期有效。排名一旦提升,有效期会更长,提高网站的可用性,改善用户体验。seo对页面的要求往往与这两种seo分类是相通的。
Seo分为白帽、黑帽、灰帽。在搜索引擎优化行业,一些不符合搜索引擎质量标准的优化技术,也就是作弊SEO技术被称为黑帽,英文名为blackhat。符合搜索引擎网站质量标准的正规的叫Whitehat。由于搜索引擎发布的质量规范和准则比较笼统,所以往往会有空的解释。那些无法明确归类为黑帽或白帽的优化方法,被称为灰帽SEO(Greyhat)。seo的主要作弊手段
搜索引擎
搜索引擎简史
你为什么想了解搜索引擎?
SEO网站优化就是尽可能的降低搜索引擎的工作量和难度,让搜索引擎更容易更快捷的收集网站页面,更准确的提取页面内容。
搜索引擎相关性
真正的搜索引擎是指一个蜘蛛程序,沿着链接爬取和抓取大量的在线页面,并存储在数据库中。经过预处理,用户在搜索框中输入关键词后,搜索引擎排序程序从数据库中选择符合搜索关键词要求的页面。蜘蛛抓取、页面收录和排序都是自动处理的。
(与门户网站的区别)发展方向
抓取页面需要快速全面的海量数据存储。索引处理快速有效,并且可扩展。查询处理可以快速准确地判断用户意图,以及人工智能搜索引擎的工作原理。
搜索引擎的工作过程大致可以分为三个阶段:抓取和抓取、预处理和排序。
爬行和抓取
完整的数据收集。
蜘蛛一个栗子淘宝机器人防君子防小人。搜索引擎用来抓取和访问页面的程序叫做蜘蛛。服务器发出页面访问请求后,服务器返回HTML代码,蜘蛛程序将接收到的代码存储在原页面数据库中。为了提高抓取和爬行速度,搜索引擎使用多个蜘蛛并发抓取。蜘蛛访问任何一个网站,都会先访问网站根目录下的robots.txt文件。如果robots.txt文件禁止搜索引擎抓取某些文件或目录,蜘蛛会遵守协议,不会抓取被禁止的网站跟踪链接。为了爬尽可能多的页面,蜘蛛会顺着页面上的链接,从一个页面爬到下一个页面。爬行策略:深度优先和广度优先相结合。蜘蛛爬取页面后,手动输入地址库中的种子网站(门户网站),为了避免重复爬取和爬取,搜索引擎会建立一个地址数据库,记录未爬取和已爬取的网页的url来源。大多数主流搜索引擎都为站长提供了提交URL的表格。但是这些提交的URL只存储在地址库中,是否被收录取决于页面的重要性。搜索引擎收录的大部分页面都是蜘蛛自己跟随链接获取的。可以说提交页面基本没用,搜索引擎更喜欢自己沿着链接寻找新的页面。文件被存储,捕获的网页被放入原始数据库,每个url都有一个相应的文件号。爬行时,复制内容检测蜘蛛会进行一定程度的复制检测。如果权重低的网站有大量转载和抄袭的内容,网页就不会被收录进行预处理(索引)。
蜘蛛获得的原始页面不能直接用于查询排名,需要进行预处理,为最终的查询排名做准备。
提取文本:从html中的title、p、h1、span标签中提取文本。除了文本,meta标签中的文本、图片的替换文本、Flash文件的替换文本和链接锚文本也将被提取。中文分词中文搜索引擎去停用词有两种方法:词典匹配和基于统计的方法。啊,的消除噪音。页面是根据HTML标签,以及页眉、导航、文本、页脚、广告等区域来划分的。是杰出的。网站上大量重复的区块往往属于噪音。将同一篇博文重新发布到两篇不同的博文上计算指纹,也就是说,从页面的主要内容中选取关键词中最有代表性的部分(往往是出现频率最高的关键词),然后计算这些关键词的数字指纹正向指数。
将页面转换成一组关键词,并记录频率、频次、格式(如title标签、bold、H标签、锚文本等。)以及页面上每个关键词的位置(比如页面第一段的倒排索引)。
将正向索引的关系转换为链接关系的计算。搜索引擎抓取页面内容后,必须事先计算好页面上哪些链接指向哪些其他页面,每个页面上哪些导入链接,链接用了哪些锚词。这些复杂的链接指向关系形成了网站和页面的链接权重。特殊文件处理除了HTML文件之外,搜索引擎通常还可以抓取和索引基于Word的多种文件类型,如PDF、Word、WPS、XLS、PPT、TXT文件等
在用户搜索框中填入关键字后,排名程序调用索引数据库数据,计算排名并显示给用户。排名过程直接与用户交互。
处理中文分词到停用词指令处理:所有搜索结果是否满足条件、拼写纠错和集成搜索触发:倒排索引数据库中匹配视频、音频和咨询文件,找到满足多个关键词的文件初始子集。搜索结果往往是几万甚至几十万。当有这么多文件时,不可能计算所有文件的相关性。所有的初始子集将根据网页的权重进行选择,首先选择1000个左右的文件。计算关键词相关性:越常用的关键词在计算相关性时影响越小,停用词是常用词的极端,几乎不影响页面相关性的词频和密度:关键词在页面出现的次数越多,相关性越大;但是因为这个点太容易被钻空,所以这个点的重要性越来越低。关键词的位置和形式:标题、黑体、h1标签中的关键词具有较高的相关性。关键词距离:多个关键词之间的距离越近,相关性越强。链接分析和页面权重:还有其他页面用关键词作为锚词来描述这个页面。对页面本身的权重和导入到这个页面的链接的页面权重排名进行过滤和调整。对于涉嫌作弊的页面,有-11,-6,-30等。处罚广告排在最前面。所有排名确定后,排名程序调用原页面的标题标签、描述标签、快照日期等数据显示在页面上进行搜索和缓存。在搜索领域,缓存是指在高速内存硬件设备上为搜索引擎开辟一个存储区域,用于存储常见的用户查询及其结果,并采用当搜索引擎再次接收到用户的查询请求时,先在缓存系统中进行搜索,如果在缓存中可以找到,则直接返回搜索结果;否则,采取正常的搜索过程返回搜索结果。目前所有的搜索引擎都采用缓存技术。2/8定律查询点击日志搜索用户的IP地址、搜索关键词、搜索时间、点击了哪些结果页面,搜索引擎都记录下来形成日志。这些日志文件中的数据对于搜索引擎判断搜索结果的质量、调整搜索算法和预测搜索趋势具有重要意义。如果有用户登录,这些日志也会影响用户后续的排名。主要优化点
和物理链路结构
扁平化的网站结构:蜘蛛在抓取页面时会采用深度优先和广度优先相结合的方式,所以如果层级过多,蜘蛛可能无法抓取到你的页面。网站首页在整个网站中的权重最高,与首页的点击距离越小,被蜘蛛抓取的概率和权重越大。这就是为什么我们需要保持内页首页(也就是具体文章页面)的点击距离尽可能的小。清晰导航
清晰的导航系统是网站设计的重要目标。毕竟你肯定不希望你的用户进入你的网站首页,面对混乱的导航,找到他们想到的页面。搜索引擎的蜘蛛也是一样,混乱的导航会降低蜘蛛爬行的概率。设置网站导航时应注意以下几点:
文本导航。尽量使用静态HTML文本作为导航,而不是JavaScript生成的动态导航。这样爬行的阻力对蜘蛛来说是最小的。导航链接是整个网站包含的最重要的点击距离和内部链接的扁平化。导航的一个目标是让所有页面从主页点击尽可能短。像一般权重的网站,内页在首页的点击量不要超过4、5次。所以尽量把链接结构扁平化。锚文本包含关键字。关键词导航尽量使用目标关键词。面包屑导航。对于中大型网站来说,面包屑必不可少。它是帮助用户和搜索引擎建立页面在网站整体结构中的位置的最佳方式。避免页脚堆积。近年来,在页脚中堆叠关键词的做法似乎不受搜索引擎的欢迎。尽量避免这种做法。禁止机制
元机器人
还可以设置标签来禁止搜索引擎索引该页面的内容并跟踪该页面上的链接。内容的参数是:
Noindex:不要索引此页面的内容。不要点击这个页面上的链接。nosnippet:不要在搜索结果中显示说明文字。noarchive:不显示快照。noodp:不要在opendirectory项目中使用标题和描述。
每个参数的中间需要用逗号隔开。无跟随标签
nofollow
Nofollow标签是Google首创的“反垃圾链接”标签,并得到市场上其他主流搜索引擎的广泛支持。Nofollow是A标签的属性值。用来告诉搜索引擎不要跟随这个链接,因为这个链接不被作者信任。这里的nofollow和上面提到的meta标签上的nofollow的区别在于,标签上的nofollow指的是单个链接,而meta上的nofollow指的是整个页面上的所有链接。Nofollow通常用于博客评论、论坛帖子、社交网站、留言板等地方。因为这些地方的内容都是用户可以自由留下链接,站长不知道这些链接是否可信。经过测试发现,当你在segmentfault或者掘金发布文章时,会在文章的外部链接中添加rel="nofollow"。同时可以对一些内容重复的页面或者不需要收录到网站中的链接进行标注,这样可以避免网站权重的浪费。例如,联系我们、隐私政策等页面。,可以使用nofollow标签。
内部链接和重量分布
一个网站的第一页权重最高,其次是二级分类页面,和我们前面提到的链接结构一样,也是树形结构。内部权限分配有几个原则:
重要的内页可以直接链接到首页,增加不必要页面的权重。设置nofollow非分散权重锚文本也是内部权限分配非常重要的手段。维基百科绝对是这方面的佼佼者。
找不到文件
当被访问的页面不存在时,需要一个特殊的404页面。404页的设计需要注意几点:
保持风格与网站一致。你应该在显眼的位置显示错误信息,明确提醒用户你访问的页面不存在。错误还可以提供几个跳转:例如,返回到你引导用户访问的主页和其他链接。404页和外部链接的一个诀窍是,搜索引擎不会因为一些不存在的原因而抓取。这些地址一定有外部链接,比如别人博客页面的引用,你可能已经删除或者替换了原来的网址。所以我们可以通过Google站长工具找到自己网站中的错误链接,跳转到地址错误为301的正确页面,或者直接在不存在的URL上新建一个页面,接收这些外部链接的权重。
标签的合理使用
语义学
语义、简洁、结构化的代码更有利于突出重点,适合搜索引擎抓取。
唯一的H1头衔
每个页面都应该有一个唯一的h1标题,但不是每个页面的h1标题都是站点名称。(但是,html5中的h1标题可以出现多次,每个具有结构轮廓的标签都可以有自己独立的h1标题,如页眉、页脚、节、侧、文章)
首页的h1标题是站点名称,内页的h1标题是每个内页的标题。例如,分类页面使用分类名称,详细页面使用详细页面标题作为h1标题。
<!-主页->;<h1class="佩奇-tt">腾讯课堂:<h1class="佩奇-tt">开发前端在线培训视频教程
设置imgalt属性
蜘蛛不会爬图。
必须为img设置alt属性。如果宽度和高度固定,请同时设置一个固定值。
<imgsrc=""alt="seo优化实战"width="200"height="100"/><Img=""alt="实际SEO优化"width="200"height="100"/>;
TDK优化
TDK,即标题、描述、关键词。
标题
在SEO中,标题优化起着重要的作用。无论从用户体验还是搜索引擎的排名效果来看,标题都是页面优化最重要的因素。Titlseo三人行训练:E的次高密度seo分隔符一般有、、_、-和空。其中,_对百度友好,而-对谷歌友好。空网格可以在英文网站中使用,但很少在中文网站中使用。
推荐做法:
每个网页应该有一个独特的标题。禁止所有页面使用相同的默认标题。标题要清晰,包含本网页最重要的内容,简明扼要,不要列出与网页内容无关的信息。如果你的文章标题不是很长,也可以加上一些关键词,比如文章标题_关键词_网站名称。用户通常从左向右浏览,重要的内容要放在标题前面,用用户熟悉的语言描述。如果你有中英文网站名称,尽量使用用户熟悉的一个作为标题描述的例子:
<title>1688.com-全球领先的采购和批发平台,批发网
描述
描述不是计算重量的参考因素。这个标签存在与否并不影响网页权重,它只会作为搜索结果汇总的选择目标。很有可能用户会通过网站的摘要来决定是否浏览网站。
推荐做法:
首页、渠道页、产品参数页等。,没有可以用作摘要的大段文字,最适合用准确的描述来描述网页。不要堆砌关键词为每个网页创建不同的描述,避免所有网页使用相同的描述长度。合理,但不要太长(最好100-150个字,对应50-75个汉字)。示例:
<metaname="description"content=="阿里巴巴(1688.com)批发网是全球著名的B2B电子商务品牌。它为数千万网商提供海量商机信息和便捷安全的网上交易市场,也是商人与商会友互动的社区平台。目前,1688.com已覆盖原材料、工业品、服装服饰、家居百货、小商品等12大行业,提供从原材料-生产-加工-现场的一系列产品和服务。”/>;<Metaname="描述"content=="JD。COMJD。COM-专业的综合性网上商城,销售家电、数码通讯、电脑、家居百货、服装、母婴、图书、食品等数万种名牌精品。便捷诚信的服务为您提供愉快的网购体验!”/>;
关键词
关键词在搜索排名中的权重不高,但是合理的设置可以提高关键词的密度,优化搜索结果页面的体验。增加关键词的密度来提高关键词在搜索引擎中的排名是SEO优化的常用手段。SEO的核心思想是在每个页面上抓住几个关键词(一般不超过五个)进行核心优化,所以设置一到三个与这个页面内容相关的主要关键词就足够了。在英语中,关键字应该用逗号分隔。不要再滥用关键词了,会给搜索引擎留下不好的印象。示例:
&Olseo三人行训练:T;Metaname="keywords"content=="阿里巴巴,批发网,1688,批发市场,批发,代购,微信商家,微店,货源"/>;
链接URL
统一URL
Http://www.domainname.com,http://domainname.com,http://www.domainname.com/index.html,http://domainname.com/index.html,以上四个其实是主页。虽然不会对访问者造成任何困扰,但对于搜索引擎来说只是四个网址,内容相同,可能会被误认为是作弊。而且这四页的权重会分散。
301重定向
当URL改变时,您必须将旧地址301指向新地址,否则一些先前的包含权重将被浪费。
seo工具
百度搜索风云榜百度索引百度站长平台metaseoinspector,检查标签,Google插件seo在中国,百度收集的各种数据,Google插件检查我的链接,检查链接,Google插件seo雷神之锤,统计各种数据,Google插件。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)