最近互联网圈可是炸开了锅,携程网竟然瘫痪了整整12个小时!这可不是闹着玩的,要知道,这可是国内互联网公司系统瘫痪的新纪录呢!咱们就来聊聊这场“携程瘫痪”的大戏,看看背后到底发生了什么。
5月28日上午11点09分,携程官网和APP突然间“人间蒸发”,页面无法打开,链接无法点击,这下可把广大用户急坏了。大家纷纷猜测,这到底是怎么回事呢?
携程方面先是表示,这次瘫痪是由于部分服务器遭到不明攻击所致。但随后,又有消息传出,这次事故其实是内部人员错误操作导致的。这可真是让人摸不着头脑,到底是外部攻击还是内部失误呢?
一份疑似携程内部邮件的截图在网络上流传,邮件中提到:“Croller中保留了上次编译后的版本,fat到prd环境所有Windows环境编译后的源代码被删除。”这可真是让人心头一紧,难道是业务代码被删除导致系统瘫痪?
业内某专业人士分析认为,携程数据库至少隔天多次备份,被删除的可能性不大。而由于代码每天都会上线并且有代码库,所以可能没有做备份。但如果只是线上代码被删除,那不太可能瘫痪这么长时间。那么,这次故障的持续时间这么长,是不是因为携程没有备份或者备份被删除了呢?
这次瘫痪事件对携程的影响可谓是巨大的。据估算,携程在这次事件中损失了超过1200万美元。要知道,携程一季度营收才3.37亿美元,这次瘫痪事件几乎相当于一个季度的收入啊!
这次携程瘫痪事件,再次引发了人们对运维安全和管控流程的关注。上海当地一知名软件企业高管表示,生产服务器代码属于核心服务器之一,只有权限较高的管理人员可以操作。一般网络公司会对这类代码备份,恢复系统并不会需要太长时间。但从携程宕机12个小时来看,携程很有可能没有备份或备份遭删除。
此外,携程估计因为漏洞被“黑客”设计,导致内部人员误操作删除了生产服务器的执行代码。这也暴露出携程在运维管理环境上的不足,技术操作不严格和管控流程不细,或许也是导致这次事故的原因之一。
携程瘫痪事件给我们带来了很多启示。首先,企业要重视运维安全和管控流程,确保系统稳定运行。其次,要加强内部人员培训,提高安全意识。要建立健全的应急响应机制,一旦发生故障,能够迅速恢复。
这次携程瘫痪事件虽然让人心疼,但也让我们看到了互联网公司在运维安全方面还有很长的路要走。希望这次事件能够成为一次教训,让更多的企业重视起来,共同推动互联网行业的健康发展。