云主机的故障率(三)

 有人会说,我买我自己的物理机可以做上面的优化,效果比主机好。这是真的吗?现实是:绝大多数公司治理服务器的数目不多,不足以确立响应的团队;同时由于服务器的数目(如不低于百万单元)、硬件和软件的优化环境不理想。

云主机的故障率(三)插图 下面就上述要点睁开。   虚拟化层和宿主机内核的故障率若何降低?   这主要通过自主掌控虚拟化层和宿主机内核,这整套内核来实现。   1. 自主维护Linux内核   商业 Linux 刊行版(如 RHEL6.X)的内核实在有不少 BUG,由于内核太重大、太庞大,BUG 修之不尽而且不停涌现,只要 内核有人在改动,更多的 BUG 就还在路上。   但我们自己维护的 Linux 内核,我们可以迅速修复并应用进现实环境,不像商业 Linux 要守候较长的宣布周期。   我们还可以预先研究别人犯过的错误,把更新补丁打入现在的内核;还可以屏障不需要的特征和改动阻止 BUG 的引入。   简朴讲,自主维护内核很天真,最终质量不低于商业 Linux 刊行版。海内有海量服务器的公司如腾讯和阿里都运行自主维 护的 Linux 内核。   2. 免重启热补丁手艺   这是指通过二进制指令修改的方式修改 Linux 内核到达修复的目的。   连系自主维护 Linux 内核,若是发现了 BUG 并制作修复补丁后,可以免重启应用到生产环境的 Linux 内核里。   这点现在主流 Linux 厂商不提供。但云平台厂商可以自己做。   3. 热迁徙手艺   特殊情形下的热迁徙,可规避尚未完全定位的内核问题。   这三点的综合效果,使得某些云厂商,由于内核缘故原由造成的宕机低到可以忽略。几万台服务器半年可以削减到一两次。   可能有些早期用户应该对照有感受,几年软件宕机不少,给客户推送的故障讲述不时就和内核有关,但经由一年半载的事情 后,现在险些没有了。  

云服务器空间

Tags: