搜索引擎优化也要与时俱进

admin2022年04月30日 09:59:00了解搜索引擎395
搜索引擎优化有它不会轻易改变的宗旨,也就是你的网站要符合搜索引擎的根本目的,给用户提供有用相关的信息。我想不管搜索引擎索引和排名技术怎么变化,这个宗旨在一段历史时期内不会有什么大的变化。如果哪个搜索引擎脱离了这个根本目的,它也就离失败不远了。所以对网站运行者来说,你就必须提供大量对用户有用,与网站主题相关,最好是独创的大量内容。SEO也有它与时俱进的地方。随着搜索引擎爬行索引和排名算法的改进,搜索引擎变得越来越聪明了。搜索引擎能够检测更多的作弊手法,能够通过多种途径决定一个文件对关键词的相关性,

搜索引擎怎样判断文章或网页的原始出处?

admin2022年04月30日 09:52:42搜索引擎工作原理479
复制内容网页有的时候会影响网页排名。比如说原本是你写的文章,本来应该排名很好,但是其他人抄袭或转载你的文章,而且搜索引擎不幸的判断那篇被抄袭或转载的网页是原始出处的话,你应有的排名就会被那个网页夺走。那么搜索引擎怎样才能从多个网页中挑出哪一个是原始出处呢?可能有以下几个考虑:1)网页PR值。网页PR值越高,被认为是原始版本的可能性就越大。2)网页第一次被收录的时间。网页被搜索引擎收录的时候越早,相比后发现的相同内容的网页来说,被当作原始出处的可能性就越大。3)域名注册时间。越老的域名上面的网页被

Sogou Rank与网页排名关系研究

admin2022年04月29日 13:24:17链接原理469
最近对网站和域名的综合权威度或重要性感受比较多,所以robin一告诉我Sogou Rank推出的消息就很感兴趣。今天来做个简单的研究比较,看看Sogou Rank和真正的网页排名之间的关系。我随机挑一个关键词在Sogou,百度,Google做搜索,看排在前十名的网页Sogou Rank是多少。为排除大型门户或知名服务商网站传递给二级域名及分目录的重要性,将这些结果删除,只看独立的专门的网站。关键词:游戏Sogou前10名及Sogou Rank:www.17173.com – 72www.pcga

最新Google排名算法专利

admin2022年04月29日 13:11:35链接原理368
8月22号,美国专利局刚刚批准了一份有关Google排名算法的专利,标题是”搜索结果排名中引入支持性编辑意见的系统和方法(System and method for supporting editorial opinion in the ranking of search results)”。简单的说,这个专利提出了用人工编辑修正搜索结果的方法,大致程序是:把搜索词按不同的话题分组,分组方法有可能类似于开放目录等目录结构。编辑在不同搜索词分组下进行搜索,找出好的网站和坏的网站,编辑所做的评级被量

Matt Cutts谈PR和PR更新

admin2022年04月29日 13:00:52链接原理400
大家都注意到前两天Toolbar(工具条)PR已经更新了。Matt Cutts发了一个帖子,回答一些关于PR和PR更新的问题。问:我很好奇PR值在内部是怎样存储的?是小数,就像人们猜测的,还是整数?答:把它想为小数更准确。当然目前我们内部的PR计算比toolbar显示的0-10要长的多。问:我需要知道这个吗?我知道PR能告诉我什么,我为什么要在乎?也就是说对普通网站来说,PR有什么目的?答:我想这是一个很健康的态度。如果你不在乎PR,并且你的网站运行的很好,这很好啊。问:那些使用老一点的基础架构

Google链接分析专利

admin2022年04月29日 13:00:10链接原理377
商业周刊今天发表一篇文章谈搜索引擎市场的竞争情况。Matt Cutts很快发了个贴子评论了下。搜索引擎各自的商业模式,关注点和优缺点就不多说了。引起我兴趣的是Matt Cutts特意提到一个Google链接分析的专利。这个专利是Google在2001年申请,2003年2月批准的,美国专利号号6526440。Google和其他搜索引擎公司都有大把的专利,但拿出来谈的很少,哪些已经用在排名算法里外人就更不知道了。所以是否在用,自己判断吧。SEO业界一般把这个专利称为LocalRank。大概过程是这样

搜索引擎排名的人工干预

admin2022年04月29日 12:51:33搜索引擎工作原理433
虽然搜索引擎排名技术和算法一直在提高,但我相信所有搜索引擎都或多或少有人工干预,就算最标榜一切以算法和自动化为目标的Google,也肯定有人工因素。去年就曾经有人报道(http://www.searchbistro.com/index.php?/archives/19-Google-Secret-Lab,-Prelude.html),Google在很多国家的大学招募学生,进行搜索引擎结果的评价工作。一位教授从他的学生那里得到了这份资料,里面包含Google发给这些学生的评价标准,还有一段评价系统

Google PR劫持

admin2022年04月29日 11:44:38链接原理403
一直不太想说Google PR劫持这个话题,因为怕造成一些人刻意利用来骗其他的站长。不过前几天在点石有几个帖子都涉及到了这个问题。而且我再想想,如果有人就想欺骗,还是可以找到这个方法的。不如在这里公开讨论一下,让大家都知道,反而可以减少上当的可能性。大家都知道,Google PR是站长们都在追逐的东西,虽然不一定对排名有多大用,但是光那一段工具条上的绿色,越长就越让人兴奋。今天要谈的就是PR劫持,也就是用欺骗手段获得工具条上比较高的PR值显示。方法是利用跳转。以前说过,一般搜索引擎在处理301和

搜索引擎有多聪明?

admin2022年04月29日 10:36:08了解搜索引擎384
使用黑帽SEO的人,心里或多或少都存在一个假设,那就是搜索引擎没自己聪明。在前几天的搜索引擎怎样判断垃圾留言这个帖子里,就有读者认为我把搜索引擎快说成神了。我想很多人都会抱有这种想法,理由也很简单,搜索结果中含有大把大把的作弊网站,垃圾网站。如果搜索引擎真的那么聪明的话,这些网站怎么还会排名不错呢?对搜索引擎到底有多聪明,今天谈谈自己的想法。首先从常理上来说,主要搜索引擎内部的工程师,大多都是博士硕士,名牌学校的毕业生应该也是非常多。我当年上高中和大学时,数理化也算学的不错的。但我自问,能轻松考

搜索引擎怎样抓到你?

admin2022年04月28日 11:37:14搜索引擎工作原理407
用户行为方式怎样影响搜索引擎排名结果,是很多SEO一直关心探讨的问题。前一阵在点石论坛上就看到关于在百度大量点击搜索结果中自己的网站,从而进一步提高排名的讨论。其逻辑是,搜索结果中的某个网站被点击次数越多,说明越有用,用户越喜欢,搜索引擎会更进一步提高这个网站的排名。不过这种用户行为方式是噪声很大的数据,极容易作弊。搜索引擎要在这些数据中提炼出精华非常困难。前几天Google员工JohnMu就在Google帮助论坛里明确说,诸如点击某个网站,然后立即点返回按钮,这种操作并不会影响你网站的抓取、索

Google专利:怎样鉴别和处理垃圾链接

admin2022年04月28日 11:29:00链接原理347
在自己网站上使用SEO作弊手法,诸如隐藏文字,隐藏链接,关键词堆积,隐藏页面,JS转向等,是比较传统的作弊方式,也更加危险。因为证据确凿,被抓住没什么好狡辩的,证据全在自己网站上摆着呢。而靠垃圾链接提高排名,就有点说不清道不明的感觉。在博客或论坛群发,就算被检测到,搜索引擎在处理时也会比较谨慎,因为很难断定群发是谁干的。虽然大部分情况下是站长自己干的,但鉴于现在很多人为了排名能变成黑客,也不排除有些人为了陷害竞争对手,给竞争对手群发一下。所以怎样鉴别和处理垃圾链接是个头疼的问题。搜索引擎头痛,老

怎样减少无效URL的爬行和索引 – 无完美解

admin2022年04月28日 11:11:45搜索引擎工作原理389
少年老成的云晨守望同学(题外话:少年老成是好事哈。我20多岁时人家说我像40岁,我40多岁时好多人说我像30多,男人20到50岁可以做到基本一个样子)在网络营销实战密码网站贴了个帖子:透过京东商城看国内一线B2C网站SEO通病。建议先看那个帖子再回来看本帖,不然不容易明白下面在说什么。简单说,帖子指出一个严重而且现实的SEO问题:很多网站,尤其是B2C,产品条件过滤系统(如选择产品的品牌、价格、尺寸、性能、参数等)会产生大量无效URL,之所以称为无效只是从SEO角度看的,这些URL并不能产生SE

搜索引擎蜘蛛抓取份额是什么?

admin2022年04月28日 10:31:40搜索引擎工作原理413
一月份时,Google新的SEO代言人Gary Illyes在Google官方博客上发了一篇帖子:What Crawl Budget Means for Googlebot,讨论了搜索引擎蜘蛛抓取份额相关问题。对大中型网站来说,这是个颇为重要的SEO问题,有时候会成为网站自然流量的瓶颈。今天的帖子总结一下Gary Illyes帖子里的以及后续跟进的很多博客、论坛帖子的主要内容,以及我自己的一些案例和理解。强调一下,以下这些概念对百度同样适用。什么是搜索引擎蜘蛛抓取份额?顾名思义,抓取份额是搜索引

爬行、抓取、索引、收录,指的都是什么?

admin2022年04月28日 10:29:59搜索引擎工作原理416
一位读者在蜘蛛抓取配额是什么这篇帖子留言:不对呀,这个index标签,是指告诉蜘蛛可以抓取该页面,那么noindex不就是不允许抓取该页面吗?!那么为什么文章最后的几个说明里有“noindex标签不能节省抓取份额。搜索引擎要知道页面上有noindex标签,就得先抓取这个页面,所以并不节省抓取份额。”留言说明,这位读者并没有太明白什么是抓取,什么是索引,index和noindex标签的意义又是什么。noindex标签不是不允许抓取该页面,是不允许索引该页面,这两者是不同的意思,有不同的功能。看SE

Google Medic全面核心算法更新

admin2022年04月28日 09:58:34链接原理393
随着Google可能回归中国,Google SEO技巧和动态也许会重新回到国内SEO行业的视野。今天的帖子就聊一下这两个星期Google搜索和SEO领域最热闹的话题:Google的Medic核心算法更新。Google Medic核心算法更新上线时间8月1号,SEO相关论坛里开始有人反应网站排名和流量大幅下降。当然,有降的就必然有升的,但通常有算法变化时,排名降的会出来吵吵,排名升的只是窃喜。所以看网上讨论排名变化经常会给人造成错觉:大家的排名和流量都降低了。其实怎么可能,有一个降下来,就有一个补

Google新PR:以链接距离为基础的页面级别

admin2022年04月28日 09:48:01链接原理411
Google PR是Google诞生以来最具知名度的概念,以至于很多人认为Google PR的意义更多在于公关炒作,而不是排名算法。2016年4月,Google取消了工具条输出PR值的显示,站长们再也看不到最新的PR值了,也有很多SEO认为Google完全取消了PageRank算法。现在的Google排名算法中还有PageRank吗?众说纷纭。Google从2006年就不再使用PageRank了前天,一位自称的前 Google软件工程师在Hacker News的一个讨论Google替代品的帖子中

Google的BERT算法更新

admin2022年04月28日 09:43:13链接原理418
这篇帖子是去年(2019年)10月28号打的草稿,今天补充完成发出来。过去一年,关于搜索算法和SEO思维最大的新闻依然是这件事。2019年10月,Google公布上线BERT算法。什么是BERTBERT是Bidirectional Encoder Representations from Transformers的缩写,中文意思大概是“双向transformer编码器表达”,“transformer”实在不知道怎么翻译了,应该是一种神经网络的深层模型。Google在2018年已经把BERT开源了

搜索引擎免费登录网址收录

admin2022年04月27日 13:59:28了解搜索引擎372
Google搜索  http://www.google.com/intl/zh-CN/add_url.htmlGoogle网页目录  http://directory.google.com/Top/World/Chinese_Simplified/百度搜索  http://www.baidu.com/search/url_submit.html百度网址站  http://post.baidu.com/f?kw=百度sitehao123网址之家  http://post.baidu.com/f?k

PageRank的计算方法以及影响因素

admin2022年04月27日 13:58:15链接原理420
Google搜索引擎采用的核心软件称为 PageRank,这是由Google创始人开发出的一套用于网页评级的系统,是Google搜索排名算法中的一个组成部分,级别从1到10级,10级为满分,PR值越高说明该网页在搜索排名中的地位越重要,也就是说,在其他条件相同的情况下,PR值高的网站在Google搜索结果的排名中有优先权。网页级别由此成为Google所有网络搜索工具的基础。网页级别概述Google对网页级别的描述作为组织管理工具,网页级别利用了互联网独特的民主特性及其巨大的链接结构。实质上,当从

抢先式多线程网络蜘蛛

admin2022年04月27日 13:42:27Spider342
Win32 API 支持抢先式多线程网络,这是编写MFC网络蜘蛛非常有用的地方。SPIDER工程(程序)是一个如何用抢先式多线程技术实现在网上用网络蜘蛛/机器人聚集信息的程序。该工程产生一个象蜘蛛一样行动的程序,该程序为断开的URL链接检查WEB站点。链接验证仅在href指定的链接上进行。它在一列表视图CListView中显示不断更新的URL列表,以反映超链接的状态。本工程能用作收集、索引信息的模板,该模板将这些信息存入到可以用于查询的数据库文件中。搜索引擎在WEB上使用叫作Robots(也叫爬

如何快速提升新网站的PR值和外链

admin2022年04月27日 11:01:03链接原理397
最近新建了一个网站,值所以对怎么快速提升网站PR的方法比较关注对于我们新手来说:在网站没PR值、没有自己的资源的情况下要想和其他PR值相对比较高的网站互换链接是不大可能的,所以还有一个渠道就是买链接;算是最简便的渠道吧那如果没有花钱买链呢?下面我们就这个问题探讨一下!以下是对一些站长经验的总结:希望能对想快速提升PR的新站长有所帮助。其实提供新站PR值的方法很多,但个人总结觉得必须遵从以下几大步骤。第一步:网站收录。网站刚开通第一步就是想办法让搜索引擎收录。一个比较简单的方法就是利用网站收藏夹功

如何和搜索引擎爬虫对话

admin2022年04月27日 10:56:05Spider342
抓取策略:那些网页是我们需要去下载的,那些是无需下载的,那些网页是我们优先下载的,定义清楚之后,能节省很多无谓的爬取。更新策略:监控列表页来发现新的页面;定期check 页面是否过期等等。抽取策略:我们应该如何的从网页中抽取我们想要的内容,不仅仅包含最终的目标内容,还有下一步要抓取的url.抓取频率:我们需要合理的去下载一个网站,却又不失效率。让我对“如何和爬虫对话 ”这个课题有了一些思考,下面归纳的主要用于迎合上面提到的爬虫“抓取策略”。1、通过 robots.txt 和爬虫对话:搜索引擎发现

了解搜索引擎来进行SEO

admin2022年04月27日 10:05:38搜索引擎工作原理967
搜索引擎的工作的过程非常复杂,而简单的讲搜索引擎的工过程大体可以分成三个阶段。爬行和抓取:搜索引擎蜘蛛通过跟踪链接访问页面,获取页面HTML代码存入数据库。预处理:搜索赢球对抓取来的页面数据文字进行文字提取、中文分词、索引等处理,以备排名程序调用。排名:用户输入关键字后,排名调用索引库数据,计算相关性,然后按一定格式生成搜索结果页面。爬行和抓取爬行和抓取是搜索引擎工作的第一步,完成数据收集任务。蜘蛛搜索引擎用来爬行和访问页面的程序被称为蜘蛛(spider),也称为机器人(bot)。蜘蛛代理名称:

Google PageRank(网页级别)介绍

admin2022年04月27日 09:39:32链接原理438
Google的核心软件称为 PageRank(网页级别),这是由Google创始人 Larry Page 和 Sergey Brin 在斯坦福大学开发出的一套用于网页评级的系统,网页级别是所有Google网络搜索工具的基础。作为组织管理工具,网页级别利用了互联网独特的民主特性及其巨大的链接结构。实质上,当从网页 A 链接到网页 B 时,Google 就认为"网页 A 投了网页 B 一票"。Google 根据网页的得票数评定其重要性。然而,除了考虑网页得票数(即链接)的纯数量之

如何提高网站的Google PR值

admin2022年04月27日 09:39:01链接原理433
原著:David Callan 编译:Karen 参考:Google的原罪--网页序列等级 内容摘要: 无论是对普通网络冲浪者还是网站管理员来说,Google都是目前世界范围内最受欢迎的搜索引擎。它每天处理的搜索请求高达1.5亿次,几乎占全球所有搜索量的1/3。网络冲浪者对Google情有独钟,是由于Google所提供的快速搜索速度及高命中率搜索结果。这些都是基于Google的复杂文本匹配运算法则及其搜索程序所使用的Pagerank系统(网页级别技术)。下面我们将向大家介绍Google的Page