建立两个独立的光纤通道网络,实现冗余
SAN需要一周七天、一天二十四小时都在运行。SAN支持的服务器数量越多,故障引起的后果越严重。为了保证SAN不发生故障,服务器和存储的连接需要两条路径。
如果一条路径——采用HBA、交换机、电缆、端口等——发生故障,另一条路径就能让程序继续与其存储通信。这么做还有一个好处,SAN在运行时就能实现升级。
“光纤通道这项技术可能引起破坏。” Staimer说,“无论你改变或者添加了任何东西,或者对系统完成了任何工作,都可能破坏当时正在使用系统的应用程序。因此,最好是在一个网络中实现变更,在另一个网络运行程序。具有两个网络时,损失最小。”
管理:技术方面
安装路径管理软件,当一条路径失效时,自动将I/O请求切换到另一条路径。
一些操作系统环境能提供基本性能。Passmore说,一些存储供应商拥有自己的路径管理软件,费用相对较高,但由于还能实现其它功能,因此还是物有所值。
设置、调整并监测硬件和性能警告。
惠普公司的Iacono记得有一家大型的咨询公司,每天接到6000条警告,却置之不理。而一家交换机供应商在SAN遭遇0 MBps时,采用缺省警告加以终止。这样可能会导致每天收到上千封邮件。
他说:“你需要关闭缺省警告。”
但是,即使是少量的硬件位级错误也应该引起重视,因为这可能是错误发生的前兆。“大约95%的SAN错误,我们都能事先得到警告,但是没有解决警告。” Iacono说,“如果你得到的警告太多,可能就需要调整警告环境,去除错误的设置,或者可能真的存在急需解决的问题。”
将SAN的设置信息备份到硬盘中,而不是SAN中。
SAN一般不会发生错误,但是一旦发生错误,问题就严重了。如果将SAN文档备份到与网络驱动相连的服务器中,而驱动又在SAN中,那么存储团队就会丢失恢复系统所需的信息。
Iacono说:“我可以告诉你,《财富》50强公司也这么做,真是令人吃惊。”
许多公司甚至没有更新SAN文档。他们通常从Excel线程开始工作,出发点很好,但是几乎从不更新,因为面临着更加紧迫的任务。
“如果让他们检查故障,他们甚至不知道哪些信息与哪些端口相连。” Iacono说,“每个人都会涉及此类文档,但是50%到70%的文档都没有及时更新。”