dev2dev 首页 > 资源中心 > 专家Blog > 专家Blog文章
企业应用程序故障诊断
本文将讨论生产和类生产环境下的企业应用程序故障诊断。我认为这是一个值得研究的 IT 领域,因为它需要用到架构师、开发人员、系统管理人员等的专业知识,而且它使我可以不用将所有的时间都花在庞杂的 BEA/Java/J2EE 技术中。我希望其他人也能够认识到故障诊断技术的价值,并能够与我分享这方面的经验。我在 newgroups 中的用户名是 hoos 。
本文我想谈谈我对故障诊断(也有人称之为服务保证)的一些看法。故障诊断性能测试和性能调优与生产中问题的处理具有同样的挑战性。在生产环境中,容量和性能调优环境即使不完全一样,也非常类似。判别问题及其根源通常不是一项简单的任务,要在一个可接受的时限内做到更是需要具备丰富的经验、直觉和系统化的方法。我从事这种工作已经几年了,我的看法是,要做好这种工作,需要知道客户所使用的整套技术(从防火墙到数据库)。我知道在 IT 业流行技能分工,但是,对于故障诊断,这可不是一个好办法。
我想有些人可能参加过研究解决严重影响服务交付的灾难性故障的紧急会议,并听到为什么问题不是出在数据库或应用程序方面的言之凿凿的理由。如果您对该数据库或应用程序一无所知,那么就只好相信每个人的话,从而推出根本就没有问题的结论!您可以在网上求助或求助于数据库管理员 (DBA) ,但是我以我的经验告诉您,不能完全依赖于这些来源,因为他们可能帮不了您,或者不愿意帮忙。
关于诊断流程,可参考 Steve Litt 的 Universal Troubleshooting Process 。对他的方法,我还没有定论,但是其中有一些很有趣。
原文出处: http://dev2dev.bea.com/blog/hoos/archive/2005/07/troubleshooting.html
作者其它文章
|