下载安卓APP箭头
箭头给我发消息

客服QQ:3315713922

容错计算概念的认识

作者:课课家教育     来源: http://www.kokojia.com点击数:1601发布时间: 2019-02-27 09:09:31

标签: 容错计算容错技术系统计算机可靠性技术信息系统安全

软考,您想通过吗?一次通过才是硬道理

  容错技术是一种计算机的可靠性技术,计算机的可靠性工作一般都会采用容错系统来实现。那么这个容错究竟是什么呢?该怎么去解析它的概念呢?接下来我们就来认识一下吧。

  容错计算是一个很古老的命题了,恐怕自打计算机和火车/地铁控制系统结合以来,甚至更早些,追溯到军事领域的火箭/导弹控制,就有如何容错的问题,毕竟我们不能因为一点点问题就让正在飞行的导弹停下来,也不能让全国的火车都停下直到错误排除。

  容错是指一个系统在运行中其任何一个子系统发生故障时,系统仍然能够继续操作的能力。简单来说,就是发生灾难性故障时(例如用户使用错误,电源故障等),容错系统能够诊断出问题所在,并给用户提示问题的性质,保护用户的数据能够继续操作,如果需要的话,还可提供足够的时间来适当地保存文件。

  容错技术是在一定程度上容忍故障的技术,也称为故障掩盖技术。容错系统采用的是容错技术的系统。

  容错主要依靠冗余设计来实现,以增加资源换取可靠性。由于资源的不同,冗余技术分为硬件冗余、软件冗余、时间元余和信息冗余。可以是元器件级、部件级的、系统级的冗余设计。容错是在可靠性与资源消耗之间折衷、权衡。

  容错包含下面两个目标:

  ·数据的完整性:数据保护。

  ·数据的可用性:尽管发生故障,仍能读取数据。

  随着PC数量的不断增多和越来越多的商业机构缩小,而把其主要应用程序从大型机或小型机上转到PC上(尤其是网络系统)的事实,对PC机有某种形式的容错能力的要求,越来越强烈了。

  一个真正的容错PC必须能够预知井防止PC运行期间可能出现的故障,因而容错系统的实现应该遵守下列3个设计策略:

  1.冗余性:提供备份子系统,即在大型机和小型机中已经使用了多年的传统容错策略。

  2.预防性:加强一些子系统或者是具故障发生功能的子系统,以避免那些故障发生。

  3.恢复性:保持对系统的运行进行记录,当发生故障时,能够尽快地恢复系统。

  容错计算的定义其实很简单:避免在系统存在错误的时候影响到系统的服务。但做起来并不容易,好在其总的原则并不复杂:引进冗余, 针对不同的系统,不同的系统服务,可以有硬件冗余、软件冗余、时间冗余、信息冗余大体四种方式,或者他们的结合运用,但同时很清楚的一点是,我们要为无论那种冗余付出资源上的代价。

  值得一体的是另一个类似的概念:错误预防,错误预防的目的是阻止或者降低错误的发生概率,它采取的一些手段诸如采用建壮性设计,更大的测试力度,formal验证等都是作用于错误发生前;而容错计算则主要着眼于错误发生时的系统表现,所以它就更以来于各类错误处理机制,如错误监测,系统回复或者重生设计。

  一些已经采用了容错计算或者说“应该”采纳容错计算的计算机系统如:

  类一:商业系统;网络服务器云计算;商业系统;电子商务或者一些要求高稳定性的文件存储等;

  类二:嵌入式系统:如drive-by-wire系统,fly-by-wire系统,医用系统,工厂自动控制等;

  类三:cyber-physical系统,诸如网格计算,分布式传感器网络,未来智能交通系统(自动驾驶)等。

  一个很著名的关于容错计算的图形如下:

容错计算概念的认识_容错计算_容错技术系统_计算机可靠性技术_信息系统安全_课课家 

  以上的就是小编对于容错计算概念的理解以及应用,不知道对各位小伙伴是否有所帮助呢?如果大家觉得有什么内容想要补充的欢迎与小编互动哦,我们大家一起来交流学习会更好地对知识进一步理解哦。另外,如果想要学习其他内容可以关注我们课课家教育哟。

赞(26)
踩(0)
分享到:
推荐查看
华为认证网络工程师 HCIE直播课视频教程