从ERAM的两次事故看项目风险的处理-艾威培训

从ERAM的两次事故看项目风险的处理

分类:

  发布时间:2019年9月23日

本文来自于艾威培训

艾威(AVTECH)总部 设在美国NEW JERSEY,是北美排行第一的专业培训机构,设有4大分校,数十个培训点遍布北美、西欧和东亚;2000年进入中国,以培养国际化的中高端信息人才为己任,专注于国际前沿的新技术研发与信息科技新兴行业的开拓教育。目前培训的主要产品有:项目管理培训IT管理培训IT技术培训云计算大数据培训产品管理培训信息安全类AI人工智能等....近十类上几百门的课程的培训与咨询服务。

本文字数约2500字,阅读时长5~10分钟

首先要明确的是,无论在什么情况下,项目风险都是不可避免的,只能尽可能地进行管理。在一些特殊类型的项目中(如软件工程),项目风险基本可以分为两类,一类是技术风险,另一类则是项目风险。技术风险是项目完成后因涉及不当而可能出现的问题,而项目风险则是项目生命周期中可能遇到的任何风险。区分这两种风险是保证软件设计良好和保证最后软件功能正常的必要条件之一。

从ERAM的两次事故看项目风险的处理 -- 第1张

航线自主优化系统 (ERAM) 软件故障

2014年4月,由于洛克希德·马丁公司设计的En Route Automation Modernization(ERAM)软件发生故障,直接导致了巨量的航班延误和取消。一般来说,ERAM软件会限制每个飞机的数据量。所以在大多数情况下,每架飞机传输的数据都很少,总数据量不大。

2014年4月,由于洛克希德·马丁公司设计的En Route Automation Modernization(ERAM)软件发生故障,直接导致了巨量的航班延误和取消。一般来说,ERAM软件会限制每个飞机的数据量。所以在大多数情况下,每架飞机传输的数据都很少,总数据量不大。

从ERAM的两次事故看项目风险的处理 -- 第2张

但是偏巧了,这天刚好有一架飞行计划设计得特别复杂的U-2准备起飞,直接就让ERAM系统承载能力超出了极限。造成这一现象的一个主要原因是这架U-2飞机的所需的飞行高度不能用于ERAM,因此系统开始输入每个可能的选项,这导致它循环多次重启并显示错误消息,最后ERAM系统因内存溢出而崩溃。

从ERAM的两次事故看项目风险的处理 -- 第3张

由于内存过载,系统无法处理其他功能,因此在美国西南部至少数百个航班被取消或延迟。这就是一个无法容忍的技术风险的例子,无疑在洛克希德·马丁公司的风险管理规划中都没有考虑到这一点。

次年8月,经过软件升级的ERAM还是没有逃过类似的命运。这次软件升级旨在为控制器提供自定义界面,以便于访问和控制,允许使用者查看需要经常引用的数据。如果控制器调整了设置,系统将保留信息,而不是按预期从系统中删除已删除的信息。

从ERAM的两次事故看项目风险的处理 -- 第4张

慢慢的,存储的数据量越来越大,直到超过限制。内存再一次过载。后来虽然美国联邦航空管理局(FAA)与洛克希德马丁公司合作,确定为什么在测试过程中没有发现这个漏洞,但这个漏洞已经造成了美国东海岸的1,000多个航班被迫取消或延误。

ERAM和技术风险

ERAM软件问题发生在项目完成和升级推出之后,这些问题在风险管理规划期间可能被识别为技术风险。如果提前知道这两次故障的后果包括降低收益和客户满意度降低的话,这些问题肯定在风险管理规划期间就被评估为风险规划期间无法容忍的技术风险。

然而洛克希德·马丁公司和美国联邦航空局在进行软件升级测试时并没有特别清楚地认识到这些影响系统内存的数据问题的存在,特别是因为这是原始软件故障的原因。

从ERAM的两次事故看项目风险的处理 -- 第5张

ERAM软件项目是一个特别复杂而昂贵的项目,估计耗资24亿美元。在这种规模的项目中,必须实施一个用于解决项目和技术风险的风险管理计划。风险可能被归类为可能的未来失败或来自当前决策或行动的不良后果

软件项目的风险因素包括威胁成功完成或实施软件项目的任何风险,如果不识别和理解这些风险,可能会导致项目很快失败。为了降低风险,必须精心制定详细相关计划和处理流程。该过程应首先确定并评估风险,然后制定详细的优先行动计划,以应对可能出现的风险。

虽然一般来说对软件项目风险管理的系统化过程的回顾是有限的,但鉴于软件项目的复杂性,这仍然是一个具有巨大改进潜力的领域

从ERAM的两次事故看项目风险的处理 -- 第6张

管理软件项目的风险

在第一次ERAM软件故障后,FAA调整了系统,确保所有飞行计划都在可用高度内,并且他们还为系统增加了更多内存。在第二次失败后,他们暂停了自定义界面功能,并调查了为什么洛克希德·马丁在测试阶段没有发现这个故障。

从ERAM的两次事故看项目风险的处理 -- 第7张

虽然我们没有深入了解洛克希德马丁公司和美国联邦航空局可能创建的风险管理计划,但我们可以假设一项用于一个价值24亿美元项目的风险管理计划该怎么做。当涉及新技术或复杂技术时,项目复杂性风险是不可避免的。在这种情况下可用于解决技术风险的行动包括彻底的研究,严格的质量保证流程,最初有限的部署或分阶段实施,以及应急计划。


管理软件项目风险有三种比较常用的方法:

1.第一种方法是清单法,可能会包括技术,组织和项目风险。检查表也可能基于以前的项目风险。这些风险类型通常不会被单独分离出来,而是按概率划分优先级。

2.第二种方法是分类法,通常用于通过某种框架对检查表进行分类。由于清单是通用且详细的,因此分类可以按类别帮助确定风险的优先级。

3.第三种方法是流程建模,通过正式流程管理指定风险管理活动,该流程提供上下文,识别,分析和评估风险,并缓解,沟通和解决问题。

从ERAM的两次事故看项目风险的处理 -- 第8张

尽管将项目风险与技术风险分开足以确保技术风险不会被忽视,但所有这三种方法的组合对ERAM软件项目都是有益且必须的。ERAM软件的技术风险应该在项目启动和设计时考虑,并且应该在整个项目生命周期内对其进行监控,特别是在软件框架开始成型的时候。

对于洛克希德马丁公司来说,考虑项目管理协会概述的软件项目特有的技术风险清单也会有所帮助,其中一些包括缺陷,容量规模问题,性能要求,软件使用的简易性,变更方案, 和更多。项目经理应该使用专家判断,并尽可能利用业务分析师的洞察力,集体讨论潜在风险并确定每种风险发生的可能性,以便他们可以优先考虑这些风险并实施缓解计划。

当洛克希德·马丁公司开始建立ERAM软件时,几乎可以肯定他们已经确定了所涉及的风险。那么,他们是否忽视了不完整或大量数据输入时会出现相关的内存短缺问题的可能性?

从ERAM的两次事故看项目风险的处理 -- 第9张

一般来说项目经理应该遵守以下流程,以确保全面的风险管理:

1.识别不可容忍的风险

2.确定可容忍的风险

3.制定不可容忍风险的治疗计划

4.进行成本效益分析以降低可容忍的风险

5.制定风险登记册

6.定期更新风险登记册,并在每个项目阶段结束时更新

如果能够在项目中做到这些,上面发生的数据和内存问题就有可能提前定位为不可容忍的技术风险,并且通过更新设计要求而变成可容忍的风险。

从ERAM的两次事故看项目风险的处理 -- 第10张

还有其他更详细的分析方法,例如统计模型和数据挖掘模型,它们也可以用于这种规模的软件项目。无论选择哪种方法,基本前提都是一样的,那就是定期评估和重新评估风险,因为它允许项目经理和其他利益相关者评估不断变化的条件和需求。

总之,项目风险是不可避免的,特别是对于复杂的软件项目。但是使用适合的方法可以尽可能减少风险引起的损失。

【艾威(中国)】大事记:

艾威培训(Avtech Institute of Technology),源于美国,始于1998;是北美著名的培训机构,公司总部位于美国新泽西州,2000年进入中国,以培养国际化的中高端信息人才为己任,专注于国际前沿的新技术研发新兴行业的开拓教育,艾威主要的服务为培训与咨询两大类,目前培训的主要产品有:项目管理培训IT管理培训IT技术培训云计算大数据培训产品管理培训信息安全类AI人工智能等....近十类上730门的课程的培训。 艾威进入中国这十八年来已经服务了超过5000多家客户,获得了良好的口碑!也成为了众多500强企业指定的培训服务供应商.
  • 艾威培训(Avtech Institute of Technology),源于美国,始于1998.
  • 艾威培训(Avtech Institute of Technology)是Prometric,PAN,NHA,CASTLE,KRYTERION,VUE,Certoprt等众多国际认证中心授权的考点
  • 1999年成为美国计算机行业协会授权的培训学院
  • 2000年成为微软培训合作伙伴
  • 2002年成为思科授权培训中心
  • 2003年成为Oracle授权培训中心
  • 2003年成为国际项目管理协会PMI授权的全球(PMP,PGMP,ACP,PBA)教育机构
  • 2005年成为国际需求管理协会IIBA授权的全球(ECBA,CCBA,CBAP)教育机构
  • 2006年成为新泽西州政府护士管理局授权实习护士培训学院
  • 2012年成为EXIN授权的EXIN ASM,LeanIT,DevOps,VerISM教育机构
  • 2016年成为国际信息审计协会ISACA授权的CISA,CISM,CRISC,CGEIT,COBIT教育机构
  • 2017年成为The Open Group授权的TOGAF企业架构的官方培训机构。
  • 2017年成为EPI授权的数据中心培训机构,CDCP培训、CDCS、CDCE培训。
  • 2017年成为APMG外包治理国际认证SGF(Sourcing Governance Foundation)。
  • 2017年成为业务关系管理协会(BRMI)国际认证 BRM,CBRM。
  • 2018年成为PeopleCert授权ITIL、Prince2、MSP培训及考试机构
  • 2018年成为DRI授权CBCP培训及考试机构
  • 2019年成为亚马逊培训合作伙伴
  • 2019年成为国际云安全联盟CCSK授权培训合作伙伴
考试说明FAQ
你想了解哪项考试呢?
热门培训课程

This site is protected by wp-copyrightpro.com