当前位置:首页 > SEO优化 > 正文内容

Google爬虫:不仅索引链接,还可以运行js代码

admin16年前 (2010-06-26)SEO优化672
一直以来Google的搜索爬虫就具有阅读JavaScript代码的功能,但是多年以来我们一直都不清楚Google的爬虫是否真正理解了其正在抓取的东西或者说它仅仅只是在易于理解的数据结构中对各种链接进行呆板的检索。本周五,一位Google的发言人向《福布斯》确认Google所作的远远超过对js代码的简单分析。这位发言人表示:“Google能够分析并理解某些JavaScript”。         Google的表述让我们意识到其爬虫所作的工作也许不仅仅只是获得对页面的相关链接,还能够像人一样与各类程序发生互动——发现Bing这类搜索引擎所不能发现的网络世界。而这意味着,Google重新定义了搜索引擎。在Google的搜索结果里面只有很少的js代码,而且Google也将这种js代码的解释功能做了很多保留。比如在Google站点搜索(Google's Site Search)的文档显示其不能够索引带有js代码的内容。一本关于索引的入门教材这样写道:它(Google爬虫)“不能够处理带有富媒体的内容或者是动态网页”。仔细检查服务器日志中的记录我们便可以发现Google现在索引那些并不是直接包含在js代码里面的链接,Google的爬虫只有确定自己能够运行部分代码的时候才能明白整段代码到底是什么意思。         Mark Drummond,一家独立搜索引擎公司Wowd的首席执行官(我们在今年之前的杂志中采访过他)在一封邮件中告诉我们理解js代码“是一个非常深刻、难度极大和一场经典的计算科学难题。”他解释道Google的努力在于它能够发现js代码在网页中是否存在停止运行的情况。他表示“停止运行的问题是无法判定的”,他说迄今为止还没有已知的算法能够在任何程序的任何时间点告诉我们该程序是否陷入了死循环,而且数学上已经证明了这一点。Drummond自己的公司通过人工的方式检索其索引并标明是否有可能简化这个复杂的问题,同时判断一个网络程序是否向另外的程序发起了数据请求。也许,这正是Google现在在做的事情。         另一位同Google接近的搜索引擎人士也认同Drummond关于理解js代码复杂性的看法。他认为用一个程序去分析另一个程序是很困难的事情,执行js代码几乎是现阶段能够做到的极限了。         而Google在六月发布的改进版搜索算法(即Caffeine)似乎开始能够理解部分js代码了。如果这是真的,那么Google的工程师已经教会了其爬虫如何执行部分js代码。这真是一大突破!

扫描二维码推送至手机访问。

版权声明:本文由博赚恋吧资源站发布,如需转载请注明出处。

本文链接:https://www.432l.com/post/3034.html

标签: SEO优化
分享给朋友:

相关文章

博赚恋吧---搜索引擎优化的七个注意要点

 做一个网站其实很简单,但难的是在于那些搜索引擎如(google,yahoo,msn等)如何找到你,并提高排名!最近,我总结了7条最新、最重要的注意事项1.网站优化是为了访问者,而不是针对搜索引擎。   这一点是做网站的终极目标,请牢记这一点。搜索引擎优化要考虑用户体验,用户体验这个东西最重要的了,我们做站就是为了客户所以用户体验是非常重要是第一位的。其次在用户体验的...

推荐----一个成功的站长需记住的10个关键词

有个个人网站容易,但如何管理和运营是难题,下面跟大家分享一下做一个成功的站长需要记住的10个关键词:  第一个关键词:发现,就是说要善于寻找和发现机会。机不可失,失不再来,机会在哪里?中国有句俗语,叫“缺什么,补什么”,也就是看互联网上还需要什么,今天需要什么,将来需要什么。  第二个关键词:量力,就是要根据自己的实力对自己的网站进行准确的定位。限于资金、技术、人员等诸多因...

网站优化的七大技巧

网站速度,笔者总结了一些切实可行的方法,制作主页时,以下的方法可以令你的网页速度大大提高。  一.记得帮页面减肥  我们浏览网页实际上是将虚拟主机中的网页内容下载到本地硬盘,再用浏览器解释查看的。下载网页的快慢在显示速度上占了很大比重,所以,网页本身所占的空间越小,那么浏览速度就会越快。这就要求在做网页的时候遵循一切从简的原则,如:不要使用太大的Flash动画、图片等资源。干净、简洁的页面会给人一...

恋吧教你如何向DMOZ提交网站

DMOZ(ODP)是人工编辑目录索引类搜索引擎。DMOZ除独立提供搜索服务外,还为包括AOL Search、 Netscape Search、 google、 Lycos、 DirectHit、 HotBot等在内的许多门户网站和搜索引擎提供主要的目录搜索服务。google的目录检索来自DMOZ人工编辑目录,但经过了自己的运算法则的重新排序后按照网页级别显示这些结果。  DMOZ是百分百免费的搜索...

如何使用新浪微博进行博客推广

     新浪微博最近可是很红啊!作为Twitter的copy品(姑且可以这样说吧),说起twitter恐怕没有人不知道吧,由于Twitter的影响力和使用者逐步扩大,通过Twitter来推广自己的博客是一件很容易的事,可是由于人人都知道的原因,Twitter‘、叽歪等类似的微博客系统都集体的歇菜了,想想新浪这么大的背景,“围脖”的...

三大博客程序比较:WordPress, b2evolution和MovableType

现在架设博客网站可以使用的程序太多了,以至于要做一个全面的比较几乎都是个不可能的任务了。不过使用最多的三个博客程序大家可能都知道,那就是WordPress、b2evolution以及MovableType。其中的WordPress由于其开源的性质以及众多插件、主题的支持,在国内现在已经是一个炙手可热的博客建站程序了。  现在WordPress可以说是业界的领导者了,而b2evolution则是既可...

评论列表

刘晔
16年前 (2010-06-29)

学习一下了。。。

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。