企业网站建设

建站知识

今日已发布信息: 321875
累计注册用户: 75477716

"打错一个字母,瘫痪半个互联网" 是如何的感触

半个互联网 字母造成 这名程序

概述: 欧洲宇航局的的火星探测器因为传感器失灵了仅仅一秒钟,就造成探测器在火星表面坠毁,历时数年的探测计划功亏一篑。   所以,当你身边的程序员为了一点点小事较真的时候,你一定要理解:魔鬼都藏在细节里啊!   当S 3 宕机时,你才明白AWS多么强大   几年前,Google.com曾有一次宕机了一个小时。在那一个小时的时间里,整个互联网的流量减少了40%。当时有人感慨:Google一家就是半个互联网。如今,“半壁江山”的江湖地位似乎要归属于亚马逊了。

  2 月 28 号,号称「亚马逊AWS最稳定」的云存储服务S 3 出现“超高错误率”的宕机事件。

  接着,半个互联网都跟着瘫痪了。

  一个字母造成的血案

  AWS在昨天给出了确切的解释:一名程序员在调试系统的时候,运行了一条原本打算删除少量服务器的脚本,结果输错了一个字母,导致大量服务器被删。为了修复这个错误,亚马逊不得不重启整个系统(在此之前已经几年都没有重启过了),最终导致了震惊全球的Amazon S 3 宕机 4 个小时事件。

  

 

  我想这名程序猿当时的表情应该是这样的

  曾经有人计算过,AWS每宕机一分钟,对亚马逊造成的损失是$66, 240 美元...而这还不包括那些依靠AWS来运行自家服务的公司们的损失。所以这次接近 4 小时的宕机造成多大的损失,只能请大家自行脑补了。

  

 

  程序员的世界就是这样的不近人情,一丁点儿错误就足以酿成大错。在这次“一个字母造成的血案”之前,刚刚发生了Gitlab程序猿用错一条命令误删了整个数据库的悲剧。再久一点以前,欧洲宇航局的的火星探测器因为传感器失灵了仅仅一秒钟,就造成探测器在火星表面坠毁,历时数年的探测计划功亏一篑。

  所以,当你身边的程序员为了一点点小事较真的时候,你一定要理解:魔鬼都藏在细节里啊!

  当S 3 宕机时,你才明白AWS多么强大

  几年前,Google.com曾有一次宕机了一个小时。在那一个小时的时间里,整个互联网的流量减少了40%。当时有人感慨:Google一家就是半个互联网。如今,“半壁江山”的江湖地位似乎要归属于亚马逊了。

 

  无锡模板建站  玉林婚纱照   今日推荐免费建站   分类信息   宣城网站建设公司

 

  AWS是云计算领域全球的领导者,而S 3 又是AWS历史最久的服务,可以说是AWS的基石。很多AWS提供的其他服务都依赖于S 3 云存储,比如EC2,Lambda 和 EBS 等,所以这次宕机影响巨大。据最近的统计显示,全球共有 148213 个网站和 121761 个独立域名在使用AWS S 3 服务。

  

 

  就拿这次事故来说,很多人一觉起来发现手机里的歌听不了,电影看不了,股票不能交易,App也没法下载,就连家里的智能电器都纷纷罢工(主页君家里的电子门锁都失灵了!)云计算听上去离生活很远,其实离我们很近。

  这次S 3 宕机影响到无数家公司和服务

  在这里罗列了几个著名的:

  Apple App Store & icloud

  Airbnb

  Expedia

  Netflix

  Quora

  Amazon Echo

  Amazon.com

  Nasdaq

  

 

  就连AWS自己用来公布服务状态的 AWS Dashboard 都受到了影响,在一段时间内只能通过Twitter账户来发布更新状态。这次S 3 宕机事件的影响范围之广,可见一斑。

  “打错一个字母瘫痪半个互联网”是怎样的感受?

  在今天亚马逊披露了这起事故背后的原因后,很多人心里都会有一个疑问:

  这个倒霉的程序员会被开除吗?

  关于这一点,虽然主页君肯定没法做出准确的判断,但还是愿意给出我们的猜测:不会。

  首先,这名程序猿打错命令有没有责任?肯定有。但是,在处理高度可靠的云服务时,每一次操作都应该按照严格的程序,每一个命令都要经过足够的审核。除非这名程序员在操作过程中因为偷懒省略了一些必要的步骤,否则,这次事故更多是系统的责任,因为系统没有足够的机制来防止错误的发生。人,都是会犯错的,只有机器不会。

  其次,oncall(值班)的程序员一边操作着影响巨大的的系统,一边还需要争分夺秒的解决问题,肩上的压力之大难以想象。虽然这次事故确实是由于一个打错的字母造成的,但如果事故发生后,作为云服务领航者的亚马逊不是勇敢的承担这笔学费,而是把锅甩给某一个程序员身上,那就太让人寒心了。

  我甚至敢断言:如果亚马逊真的做出这样的决定,那么他们在日后的招聘过程中会遇到很大的困难——每个程序员都会三思:我会不会成为下一个背锅的人?

  

 

  当然,如果这哥们(也可能是姐们)

  真的因此被解雇了,想想看——我打错了一个字母,就瘫痪了半个互联网

  这牛逼也够吹一辈子了!

  最后,主页君想说:程序员这行真的不容易,做云服务的尤其如此,大家且行且珍惜。对受到这次事故影响而心惊胆战了好几几天的程序员们说一句:加油,你们挺住!

 

大学生进入互联网做站两年的收获收获4

  上一篇我讲到网站备案之后又向各大搜索引擎提交了收录,搜索引擎提交收录之后我就开始了对网站的全面优化,今天我主要讲一讲我自己运营网站的这个过程,应该对初入互联网的站长朋友们有一些帮助吧。

  网站在搜索引擎收录之后,我第一件事情就是尽量的对网站充实内容,当时的我没有多少钱,就连生活费都拿起买主机去了,于是自己动手也就成为了我每天做的事情,每天早上我8点就按时起床了,同寝室的要睡到11点多,我起床之后就在百度中搜索一些与我网站相关的知识,我做的是一个与减肥有关的网站,于是我每天都会在百度新闻里面搜索减肥两个字,通过这样的方式我主要是想了解当天减肥界又发生了什么事情,然后才能够根据这些事情写出一些文章。我写文章的过程是这样的,1通过搜索引擎搜索关键词,2发现有价值的新闻或者信息,3根据新闻和信息进行辨别,4最后根据辨别之后的新闻和信息写出文章。这就是我写文章的全过程,相信很多站长有跟我一样的经历,没有钱请人写文章就最好自己动手吧,自己写的文章至少质量还算可以吧。

  提示:写文章这个过程有点需要耐心,我在大学期间前一个月写文章的时候还有耐心,写久了就越来越感觉到无聊,不想写,但是不写也不行,这就造成了心理压力。特别是近期的百度持续调整更是为写文章带来了挑战,我觉得不管百度怎么调整只要我们写出的文章是自己原创的,文章条理清晰的,那么我们的文章就是合格的内容,前不久百度不是说可以申请反馈吗?如果你做到了自己每天原创写作,我坚信即使站点被错误K掉,百度也会还你公正。

  写文章这件事情做了之后,每天还要做一件事情,那就是在新浪博客与一些论坛中发布外链,我选择新浪博客的根据主要是我在建立网站之前有两个新浪博客,我发现新浪博客的排名有点高,比其他博客要好,而论坛我主要选择的也是一些高权重、高PR的论坛,每天构建外链也是一件痛苦的事情,当时我看网上到处都是请人构建外链的信息,我不是没有钱吗?于是又只有自己动手了,我先是在自己的新浪博客上面写了300多个字的小短文,然后末尾加上了我自己的网址,没有想到半个小时内就收录了,这也是我新网站的第一个外链,而论坛我是在一些群里面了解到的,比如站长界的a5、seowhy、chinaz,生活中的80、90等等,这些论坛我都去过,我发现这些论坛都有一个共同点:只要不是为了外链而外链的内容都不会被删除的,说直接点就是要我们提供具备价值意义的内容才能够留外链。

  提示:不知道你们亲自为自己的网站构建过外链没有,构建外链这个过程非常复杂,特别是对于论坛外链来说一定要保证自己所发的内容不是纯粹的广告,还有留下的网址要正规合法,做不到这两点我建议你还是不要去论坛了,那样你的论坛ID不是被封就是被删。而在利用博客构建外链的时候就要注意关键词的选择了,特别对一些发展得比较好的博客,我们也不要随意构建外链,我们利用博客构建外链每构建一个就要一个的效果,这才是发展的王道。

  作为一名学生,没有技术可以学,但是没有资金就是最大的烦恼,我建立的第二个网站就是处于没有资金的状态之下,那个时候的文章、外链都是自己亲自动手,但是大家不要认为这个辛苦没有成果,其实不是这样的,自己动手虽然辛苦了一点但是效果非常好,你想一想假如你请人帮你写文章、请人帮你发外链能够像自己那样尽心尽力吗?他们是为了钱而来,而我们自己却是为了网站的真正发展,所以有时候自己动手也不是一件坏事。

关于Baidu收录的一点小发现

  本人做站长不久,常常为百度收录而苦恼。自己的站(www.592down.com.cn)虽然已被百度收录但是最近几日收录不光没有增加反而在逐渐减少,很多人可能会说这是很正常的事啊!

  但是在最近不断的site我的站(www.592down.com.cn)的时候发现我的收录情况,每次site的收录结果都不一样,有时可以显示被百度收录了上万条记录,呵呵也不知道是百度出的问题,还是本人的小站确实已被收录而没有被公布出来。

  也请大家试试自己的站的收录是不是和本人的站点一样的情况如果情况一样大家交流一下啊!

  本人的小站是www.592down.com.cn不信你可以试一试很好玩的!大家不要用这种方法骗人啊!!

透析站内优化关键因子:“以何为贵”

  业内人士都知道SEO其实是各式各样的策略实践的整合,并且各种方法的重要性也不尽相同。就相似我们在酒席中也分宾客主次一般,SEO工作中的不同因子的重要性的差别还是有目共睹的。由于SEO是一个时兴的事物,所以对于广大SEO工作者来说,拎清重点,直命优化要素就成了不可或缺的素养--即是我们所说的弄清楚“以何为贵”。

  当谈及站内和站外优化时,我还是保留那个观点--目前站内优化的重要性没有得到应有的重视。大体上因为在需要紧急排名飙升的时刻,站内优化虽耗时少,但从短期的效果上远远不如链接的建设。但是其实站内优化只要牢牢把握关键因子,就能对网站排名起到魔法般的提升。由此对于SEO工作者来说,分清这些因子孰轻孰重,他们个子承受多大的权重就显得尤为重要。下面我们将展开谈谈这些关键因子。

  首先我们解析一下如何为网站排名打下坚实的基础

  任何建筑的动工的基础都是有了比较坚实的地基,同样网站内容建设必须要有优秀的网站框架做支撑。如何制作一个对搜索引擎来说是“A”等的框架一直是业内人士苦苦寻求的问题。换句话说,就是搜索引擎应当认为你的网站是容易爬取而且简明清晰的。说的永远比做的容易。下面我会例举在SEO站内优化过程中重要的因子。他们是我按照重要性高低排列的,最重要的最靠前。请大家根据我以上的概述仔细掂量接下来我要谈及的因素。

  1.http响应是否正常。

  一个可靠的服务器提供商是对你网站建设成功的先决条件。如果你的服务器常常不可用或者反应时间过长,那么搜索引擎不可能对你有深入了解的兴趣,从而不会抓取你网站太多的内容。更重要的是,一般你的服务器不稳定,用户不能进入你的网站读取想要的内容,对你的“回头率”自然大打折扣。所以我认为这个是最重要的因子。

  2.响应速度快慢。

  网站响应速度一直是用户体验的成绩单,不仅如此,如今SE也对网页的响应速度十分挑剔。一年前,谷歌就亲口承认,网页加载速度将影响网站的排名。

  3。网站内链指向优化。

  当我们的网站搭建了不俗的内联,无论对用户还是搜索引起的操作都是有益的。正所谓合作共赢,你为搜索引擎抓取提供了方便,那么搜索引擎就会在你的网站“流连忘返”。内链中穿插合适的锚文本更是在搜索引擎结果页显示中暗藏玄机。比如钱行石材的关键字公园栏板,公墓批发目前已经做到了百度第一,那么网站首页的一个同名的锚文本就已经足够维持这个局面。接着这个网站就可以用大理石,自然石等指数比较高的关键词取代前面的。同时,我不得不提醒大家的还是一个“度”的问题,内链建设还需显得浑然天成(至少对SE来说)

  4.别贪心,一心瞄准一个URL。

  规范的URL标记对你网站建设的作用不可小觑。虽然你的网站有不同的方式进入,如浙江石材可以通过多个输入而打开,但是SE将无法辨别这个网站所主打的域名。要是你在建设中心猿意马,那么网站的权重就被这几个不同的URL所分摊,导致搜索结果难以上升,所以URL标准化很重要。

  5.减少错误链接。

  SE爬虫不仅抓取了他们到达的页面,他们同时会抓取该页面上的链接或者锚文本。一旦其中任何链接是不可用的,那么整个网页在SE的地位就会打折扣。同时对一个专业的站长来说,检查页面链接指向结果不是很难。因此,从某种程度来说,这个因子虽然重要,但是你做的好并不能在搜索排名中去很大的作用。所以,常常检测错误和失败链接是上上之举。

  6.拥有“优美质朴”的HTML代码。

  尽管装饰的质量未必是排名的至关重要的因素,然而正确简短的html代码为你排名的提升加重了筹码。我们最好保证在代码和CSS效果中的每一个字眼都符合W3C标准。至于这个你可以百度搜索“W3C”,然后用输入你的网址即可检测并根据提示修改代码。此外,利用website auditor等SEO优化工具也能起到较好的效果。

  7.稳固的CSS。

  和完美的HTML代码一样,稳固的CSS不一定是必需品,但是是SEO成功的额外并举足轻重的一步。当你为移动设备优化网站的时候则应把CSS的修正看成重中之重。同样的“W3C”为你提供CSS代码的检错和提醒功能,操作如上。

  现在说说内容

  一旦网站内容的基本构架被我们重视以后,就以为着优化内容的契机已经悄然而至。利用相关度的判定,网页的内容恰似发给SE的暧昧短信,吸引爬虫贪婪的抓取你网站的页面。发送的信息越多越频繁,SE就认为相关性越强,然而物极必反,相信你们都知道信息太强就显得可疑,结果就不用我点破而不言而喻了。所以,好好记住这几条规则。谈到内容,那么内容中的那些信息对网站排名尤显重要呢?下面为大家一一揭晓。#p#副标题#e#

  第一大类是关于关键字的因子

  1.在URL中的关键字。

  每个在SEO领域中摸爬的人都知道和关键字匹配的域名在搜索引擎结果页显示起着相当的作用,当然这一点在google外文域名中效果更加明显一点。既然是这样,聪明的你为何不挑选一个和你网站关键字一样的域名从而一举登上谷歌之巅呢?原因很简单,第一这么好的域名早就被别人注册了。第二,为了产品的品牌效应,我们可能会倾向一个和产品名称相关的域名。第三,我们开始坚信以后和关键字匹配的域名的作用在以后排名中的作用必将减小。

  2.在页面标题中的关键字。

  和域名不一样,在页面标题中我们能更容易的紧抓关键字。但是要保证你的标题自然易懂,因为现实中的人会在结果中查看你的关键字。比如在以下:石材|浙江石材|浙江钱行石材和浙江钱行石材—浙江石材网—石材工艺品专卖,显然第二个显得更加吸引人。

  3.页面内锚文本的关键字。

  按我前面所说,网站内链对网站排名十分重要。然而,从你某个网页单纯的链接到网站另一个网页并不能起多大的实际意义。想要获得有效的作用,就要在锚文本中加入你的关键字,不仅如此,你要有计划的建设不同的关键字,因为要是你单纯的用一个关键字做锚文本对SE来说是不自然的,所以也会得到SE的忽略。

  4.在网页描述中的关键字。

  如果你在网页描述中的关键字与你的网站没有半毛钱的关系,那么这种描述对你网站排名的提高是没有任何意义的,相反SE可能在显示结果页的时候刻意绕过你的网站。但要是你的网页描述和你的关键字紧密结合,这会给你网站排名一个强烈的推动。

  第二大类是关于网站内容质量的因子

  1.内容的唯一性。

  你有没有发现当你随便从别的地方抄袭一篇文章到你的网站,这篇文章很可能不会在SE中显示。所以想要权重比较高的内容,你最好还是选择原创吧。

  2.内容更新的频率。

  总的来说,你更新的越是勤快,对你的网站越是有利。新鲜的内容对Web 2.0站点尤为重要,如果文章能够成为新闻源的话就更好了。除此之外,现在SEO业内很多专家开始热烈的讨论内容新鲜度的在谷歌算法中的权重改变,由此内容的新鲜越发重要。

  3.直接可见的内容量。

  从谷歌新算法的角度看,有大量的直接可见的内容和以前比起来作用翻倍了。直接可见指的是用户达到你的网页是不许拖动拖动框,点击和任何操作,直接能够在你页面上面看到的内容。所以,保证在直接可见也填充足够量的内容。

  4.内容密度--保持精简。

  网站总的内容密度同样重要。谷歌熊猫升级版锁定了内容精简的网站,对此,“懒惰”的站长可以有所思考了。

  5.使用可视化内容。

  搜索引擎现在同样会考察你是否采用了可视化内容帮助抓取和阅读,比如说图片或者视频。这些不是十分重要的因素,但是做好这些仍然能获得SE的小小青睐,因为这个细节体现出你的网站有很好的用户体验。

  总结

  如果站内SEO做的不那么到位,的确会成为网站冲击SE首页的拦路虎。所以SEO工作者应该像重视外链建设一样研究站内优化。同时,在做站内优化的时候,抓住以上的重点就可以花费最少的力气登上搜素引擎之巅。

网站的内页怎样进行优化

  经常在论坛见到大部分站长分享的都是网站整站优化或者首页优化,但是这些页面优化的词毕竟是有限的,一个网站涉及到优化的词估计几百上千个,所以我们在做最终内页时候也得考虑怎么优化的这个问题,那么网站的内页是如何进行优化?

  我以前试验了几个页面,都取得了不错的效果,这里和大家分享一下网站的内页是如何进行优化?

  一:网站内页的标题(title)

  我们平时认识一个陌生人的时候非常注重第一感觉,这个内页的标题就是类似这种情况,当你搜索一个词的时候,出现了10个搜索结果,那么用户凭什么就点击第一个或者前几个呢,他们一般会先大概的扫描一遍所有的标题,然后点击他们感兴趣的.所以我们内页标题的写法应该是:内页的title-栏目名称(频道名称)- 网站名称。这样的话搜索者一看标题就一目了然了,而且对网站的结果页非常了解了,第一时间就对这个页面有了大概的了解!

  二:网站内页的描述

  不知道大家有没有注意到好多网站的内页没有描述的,这个也许不是网站管理员的疏忽吧,我觉得应该是网站的程序在静态化的时候没有注意到这个问题。如果说内页的标题是给人的第一印象,那么描述就像是一个人的简历,浏览者通过这个进一步的了解这个页面,从而判断是否需要点击这个页面。

  三.网站内页的内容标题和内容

  1.内页的标题

  A.标题最好用H标签来写

  B.标题要非常好的概括页面的内容

  C.标题要有非常好的吸引力(这个可以借鉴一下以前写的一篇文章--王卡卡:怎么样才能写出好的软文标题)

  2.内页的内容

  A.减少搜索引擎过滤或者没有意义的词

  B.文章需要进行合理的分段落

  C.内容中突出主要的关键词(加粗,描红都可以,但是适当不能过量,一般1--2个就可以了)

  D.非常自然性的链接(包括站内和站外的链接)

  E.尽量的添加图片,做到图文并茂

  F.内页有相关页面和新闻

  G.文章的内容也不能过长,一般以不超过5000字为宜。

  H.文章页最好有可以评论的地方,一是增加和阅读者的互动,二是保持页面的更新便于搜索引擎的更新抓取!

由浅到深再谈网站原始访问日志剖析

  近期笔者对大约50多位刚从事或已经从事1-2年的seoer做了个小调查,其中包括很多面试者,真正在工作中能分析到日志的seoer比例非常非常的少,在问到访问日志在seo所起到的作用,很多seoer都直摇头,或者仅仅知道一些皮毛并未亲手操作过,其主要原因还是在公司平台中并未有机会去实践,下面笔者分享下自己对网站原始访问日志的认识:

  什么是访问日志

  网站访问日志是记录web服务器接收处理请求以及运行时错误等各种原始信息的以.log结尾的文件,确切的讲,应该是服务器日志。它的作用是让我们seoer可以清楚的得知用户在什么IP、什么时间、用什么操作系统、什么浏览器、什么分辨率显示器的情况下访问了你网站的哪个页面,是否访问成功。

  什么时候我们需要去分析日志及日志特征

  我们会天天都去分析日志吗?不会的,因为日志分析比较枯燥,一般都是每月或者半月分析一次。这种分析属于日常分析,如果您的网站一直都比较正常那可以每月分析一次,或者可以简单的分析一次。

  其实日志更多是在网站出现异常的时候,会观察半个月日志,集中分析蜘蛛的动向。比如会分析是不是网站404,robots设置异常或者挂马等问题造成蜘蛛消失,逐儿去查找解决问题。

  下面是从笔者日常分析的日志中取的一条访问记录:

  119.254.22.200 - - [10/Apr/2012:00:04:54 +0800] "GET /bbjk/index.html HTTP/1.0" 200 25269 "-" "Sogou web spider/4.0(+http://www.sogou.com/docs/help/webmasters.htm#07)"

  119.254.22.200 为用户访问ip

  10/Apr/2012:00:04:54 +0800 为访问日期 -时区

  GET /bbjk/index.html HTTP/1.0 根据HTTP/1.1 协议 抓取(域名下)/bbjk/index.html 这个页面(GET表示服务器动作)

  200 服务器响应状态码

  25269 为页面字节数。

  Sogou web spider/4.0(+http://www.sogou.com/docs/help/webmasters.htm#07) 为搜狗蜘蛛特征。

  注意:任何蜘蛛都仅仅为网站的普通用户。不要以为蜘蛛非常的强大,很多人还认为网站若禁止登录查看内容,蜘蛛都能爬取登陆后的页面内容,这是不可能的。除非网站做了蜘蛛专属手段。

  怎么去分析网站访问日志

  曾记得在几年前,笔者刚接触seo的时候,工具稀少的年代,笔记一直都喜欢手工

  去分析访问日志,当然手工分析很费时费力,再这里只讲解下笔者最喜欢手工分析日志中的几点。

  笔者现在手工分析一般都集中在研究每日蜘蛛在网站上爬行规律与网站更新数据之间的关系。当然每个网站需根据自己来观察,最后会有一个非常完美的规律。

  笔者会把每日的蜘蛛访问时间按时间段排序统计成报表,

  比如:2012-4-18 1-2点爬行5次

  2-3点爬行3次

  3-4点爬行10次

  如果你细心的话可以做个走势图就非常直观。这种统计一般都是在网站刚建立后和网站出异常后加强分析日志,日常运营中,更多注重的是分析出蜘蛛每日的爬行规律然后定时的放出充量文章,增加收录。

  手工分析日志都是比较枯燥的,有时会影响心情,不过现在工具繁盛的年代,我们也借助工具来达到事半功倍。

  笔者比较推荐的是光年日志分析工具。该工具非常简单,笔者不在此演示,有兴趣的自己百度,它的优点在于能在生成的报告中清晰的告诉我们蜘蛛爬行异常,与页面抓取痕迹。比如404. 唯一遗憾的是目前笔者还未找到一款工具带有分析蜘蛛爬行规律生成走势图的工具。

  注意:在日志分析中,很多时候我们都是想从日志中寻找到问题,以便改进我们的自身的问题,所以需要特别关注404,301等状态码。

  真假蜘蛛辨别

  为什么会出现真假蜘蛛,主要是因为现在信息繁盛,很多采集工具为不让对方发现自己的痕迹都模拟蜘蛛的痕迹来下载数据源。所以会造成很多seoer误认为蜘蛛大量的抓取页面却发现收录并未增加的现象。下面笔者告诉大家比较容易辨认真假蜘蛛和一些特别注意的地方。

  1, 真蜘蛛

  220.181.108.96 - - [07/Apr/2012:01:22:21 +0800] "GET /site/sex/index.php HTTP/1.1" 302 20 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)"

  这是笔者某网站的日志片段,我拿出ip,在win系统下cmd登录dos框下输入nslookup 220.181.108.96 查看回显:

  

 

  如上图,若是百度蜘蛛,他会直接回显百度的域名。

  2, 假蜘蛛

  假蜘蛛比较经典的就是chinaz的查询工具了,他就是模拟百度蜘蛛的,他的ip为125.90.88.96 我们反查后并未出现百度域名。有兴趣的可以nslookup 125.90.88.96下,笔者就不截图了。

  一般假蜘蛛的存在形式为:XXX.XXX.XXX.XXX - - [07/Apr/2012:01:22:21 +0800] "GET /site/sex/index.php HTTP/1.1" 302 20 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)"

  看着跟真的一样,唯独ip就是猫腻!

  3, 特殊情况的蜘蛛

  1) cdn加速后,造成ip混乱。

  此类情况出现一般是网站在做了cdn加速后,再去查看apache服务器的访问日志的时候发现很多蜘蛛的痕迹ip都非常的类似,如果按照百度官方出的辨别手法nslookup ip 后肯定为匿名,因为这些ip都是cdn节点ip,所以会造成误解。若开启cdn后,蜘蛛实际访问次数一般都<=日志中蜘蛛总数值。

  2) 百度匿名蜘蛛的存在性讨论。

  匿名蜘蛛?百度工程师lee一直强调百度蜘蛛是不会匿名去访问网站的,但笔者从网上查阅资料,加上笔者某个站的数据推测,笔者认为会有两种情况:

  第一种:假如真的存在匿名蜘蛛,这很明显与lee的话有悖。所以这点我们可以去辩证的去理解,假如存在,匿名蜘蛛会做什么,很多seoer包括笔者都猜测可能会存在用此类蜘蛛去验证网站是否对蜘蛛与用户做了不同的待遇。所以此种情况,做贼就不要心虚嘛,老老实实做站吧。

  第二种:可能是百度的上班族们在公司访问了你的网站,百度员工也是人,他们也有七情六欲,或许你的网站被他们某人发现了,访问了你的网站后,从而留下了百度ip,造成了误解。(其实百度很多部门都是一直在做收集客户资料的,比如网盟部门)

  注意:对于真假蜘蛛的辨别一定要多方面考虑,切勿只拿ip来判断就断定真伪。

http://www.kvov.com.cn/jzxx24810.html

今日推荐知识库
解梦
梦见打死蜗牛,能降服敌人。
经典语录
人,活在自己的悲哀里还比较容易,活在别人的同情里才更艰难。
语录
三年前你如“洪水猛兽”般地闯进了我的生活,从此我的生活充满了“痛苦”,多少个日日夜夜过去了,然而,我的真情的流露还是挽留不住你的永随,那么我放你走,只是千万别回头,我怕你温柔的心回经不住我的“心雨”而破碎。 愿幸运的你永远幸运!
标语口号
弘扬现代教育思想 全面实施素质教育。
解梦
梦见损坏的四轮马车,象征自己将会有苦恼与失败。