John Edwards
预测未来正变得越来越容易。虽然它们仍然无法准确预测明天的彩票中奖号码,但是它们已经可以让所有的网络管理者都能够对各种类型的破坏性网络问题进行预测,并将其扼杀在萌芽状态。
预测分析工具正在从大数据、数据挖掘和统计建模等各种不同的技术和方法中汲取力量。例如,预测分析工具可以被训练使用模式识别(自动识别数据中的模式和规则)以便在发展成为重大问题或导致部分或全部网络故障之前识别出问题隐患。
专业的网络性能企业Accedian的首席战略官Richard Piasentin说:“凭借多个干净数据源,以及内置的冗余来提供准确信息,网络中的可见性可以提前防止问题发生,而不仅仅是在问题发生后作出反应。”他指出,分析甚至可以集成到闭环编排系统中,为许多常见问题提供网络自校正。“最终,预测分析……有助于公司节约运营成本,防止问题被忽视,而这些问题往往会导致完全停机。”
数据科学培训机构Data Science Dojo的助理数据科学家Rahim Rasool说,如果设计和部署得当,预测分析可以深入了解一系列常见和特殊的网络问题,帮助运营商处理策略设置、网络控制、安全等所有问题。例如,为了解决安全问题,预测分析可以使用异常检测算法来发现可疑活动,并识别可能的数据泄露。“这些算法能够扫描网络在数据传输中的行为,并将合法活动与其他活动区分开来。有了预测分析系统,管理者可以抢在黑客小组之前发现网络中的漏洞,然后制订出相应的防御机制。”
预测分析帮助企业的另一种方式是将趋势与基础设施能力和警报阈值进行比较。运营基于云的性能监控平台的LogicMonitor公司技术传播副总裁Gadi Oren称:“几乎所有信号都有一个上限和一个下限,這代表着基础设施的能力范围。”例如,某个设备接口在饱和之前,单位时间只能传输这么多容量。此外,有些信号是与警报阈值相关联的。利用暴露出来的趋势及其方差,我们可以预测某个物理系统何时将达到其最大容量,或者预测趋势何时将达到阈值并引发警报。”
尽管几乎所有类型的企业网络都可以从预测分析产生的洞察力中受益,但是在医疗、应急响应和航空交通管理等人命关天的部门中传输关键数据的网络将从这项技术中获得最大收益。
电力公司尤为重视确保网络的可靠性,因为即使是一次小小的停电事故也会造成重大的人身和经济损失。通用电气电力业务部门(GE Power)负责电网分析的首席数字产品经理Farnaz Amin说:“我们利用机器学习模型,根据即将到来的天气事件预测到了未来可能会影响客户网络的停电事故。此外,机器学习还能够通过检测和纠正客户网络模型中的错误,帮助改善数据完整性。”
GE Power表示,他们在180多个国家开展业务,生产了全球1/3的电力,为全球90%的输电设施提供设备,开发了管理着全球40%以上能源的软件。由于可再生能源技术的到来,输电网络变得越来越复杂,由于风力或太阳能的发电量会出现不可预见的下降从而导致发电量弹性出现降低。输电系统管理不力可能导致停电,并对公用事业造成重大财务和声誉损失。为了解决这一问题,GE Power开始转向人工智能,以促进发电量弹性的测量和预测,从而实现电网更稳定。
该公司还利用分析技术来解决另一个长期存在的、可能导致服务瘫痪的问题,即数据错误。这些错误通常是由服务提供商层面的手动输入信息导致的。看似简单的错误也会影响应急和故障响应团队,导致总体客户服务体验差和满意度低。为了解决这一问题,GE Power正在通过开发整合了地理信息系统(GIS)和其他操作系统数据的算法,以检测、推荐和纠正普遍存在的错误。有了更高质量的数据,电力公司可以更有效地派遣人员,缩短停电恢复时间,避免向客户发出不正确的停电通知。
Amin指出,公用事业公司的资产每天都会产生大量数据,但是需要在硬件和软件方面具有非常专业的知识才能发挥这些数据的潜力,带来具有可操作性的洞察力。目前解决这些问题的方法,如网络模型数据完整性、中断预测和人工优化,都是人工的劳动密集型的工作,而且结果还往往不准确。高级分析方法能够学习历史数据并做出预测,从而为网络资产提供更好的可见性,帮助企业做出更经济的决策。
尽管人们对预测分析越来越感兴趣,但是它们仍然是一项新兴技术,充满了陷阱和使用上的挑战。Oren警告称:“主要的问题是,这些预测分析方法在规模缓慢扩张的环境中工作得很好,但是在变化非常迅速的环境中往往工作不佳。”快速变化的环境会造成信号变化过快,在分析系统检测到缓慢变化的趋势之前就已经发生了变化。“这反过来又会导致在预测何时会发生某些事情时出现不准确的结果。”
获得和使用高质量的数据对于准确预测是必不可少的。Amin指出,平均而言,能源部门只使用了其汇总数据的一小部分。她解释道:“这些数据包括传感器、工厂经理的建议,以及大量资产和网络的动态信息。”这些数据明显是可用的,但是许多公用事业企业正淹没在这些海量数据当中,对于如何利用这些数据没有一个清晰的规划,这意味着这些数据无法被充分利用到预测分析当中。”
除了数据收集之外,为了获得最大的预测能力,还需要建立一个系统来收集和记录各种警报以及企业网络操作团队提供的报告。这些细节可以用来增强预测分析工具检测潜在网络异常的能力。Rasool称:“团队必须要专注于数据处理和洞察分析。这一步需要一支具有领域专业知识的团队来处理整个设置。”
一个企业的网络团队还应该能够为预测分析系统提供适当的正反馈和负反馈过程,因为这些信息将有助于提升模型的学习能力。Rasool 说:“凭借适当的分析,通过开发可以处理异常情况的方案,就像网络管理者目前所做的那样,这些数据可以创造更多的价值。不过,自我学习并不意味着预测分析将消除对人类网络管理者的需求。事实上,这样一个系统将能够帮助管理者更好地做出决策和作出反应。”
另一个挑战是说服网络团队接受并经常使用预测分析工具。Amin说:“IT和数据科学团队可以提出解决方案,但是如果运营团队不采用这些方案,那么这项投资就不会产生良好的回报。因为了解当前流程并将高级分析嵌入到这些流程中是成功的关键。”
对于刚刚开始采用网络预测分析的企业来说,他们必须仔细考虑应该获取哪些类型的数据,以及需要解决什么类型的网络问题。Amin指出,“只有对用例有了清晰的认识,才会为你的企业带来价值。”
还需要记住的一点是,向预测分析工具提供过多的信息和提供过少的数据几乎是一样糟糕的。网络性能技术提供商LiveAction的联合创始人兼首席技术官John Smith警告称:“如果一个企业不降低其所分析数据的维度,那么这将导致大量不实用的网络遥测信息被发向云端。”
考虑数据管理的实际方面也很重要。具体来说,就是如何以及在何处存储相关数据。Amin说:“对容器化及其在各种用例中的功能和适用性是值得探索的,因为它们提供了更多的可選择性。技术的发展速度是很快的,推迟这种探索可能会使企业在竞争中处于落后的局面。”
本文作者John Edwards 为资深商业技术记者,曾在《纽约时报》《华盛顿邮报》以及CIO、Computerworld、Network World、CFO Magazine、IBM Data Management Magazine、RFID Journal和Electronic Design等众多商业和技术刊物上发表过大量文章。
原文网址
https://www.networkworld.com/article/3434518/using-predictive-analytics-to-troubleshoot-network-issues-fact-or-fiction.html