關於數據中心的托管提供商,主要提供數據中心的空間、電源、冷卻和物理安全,但托管服務在數據中心停機期間也面臨著響應緩慢的潛在缺點。托管服務的組織必須仔細規劃重要數據的存儲位置,並遵循服務水平協議,以最大限度地減少托管數據中心服務中斷的影響。所以在設備上架後,數據中心的運維是至關重要的。
當然,組織可以部署自己的數據中心,擁有、建設和維護基礎設施和設備,雇傭員工,實施政策和操作應用程序,並設置任何中斷所需的優先級。當出現問題時,組織領導知道誰要處理,員工可以專注於組織的利益。
作為托管服務提供商客戶的組織,這些控制權交給托管服務提供商,負責排除故障,與客戶保持聯繫。但托管服務提供商通常是為自身商業利益經營的企業,有時不能滿足托管客戶的需求。
導致托管數據中心停機的原因是甚麼?
托管服務提供商以遠程管理的數據中心為核心,通常可以追溯到許多可能影響內部部署數據中心面臨的同樣問題。停機的原因一般分為四類:電源、人員、災難和連接。
(1)電源。
在備用電源系統等數據中心,托管服務提供商通常會實現更大的彈性。其備用電源包括為服務器和機架設備供電的不間斷電源(UPS),工業級備用發電機可在市電中斷時為數據中心設施供電。但是,UPS故障、發電機啓動或維護不足以及備用電源系統的其他問題可能導致托管客戶的業務中斷。
(2)人員。
人為錯誤是數據中心關閉的主要原因。例如,配置錯誤的路由器、服務器、身份驗證系統和其他硬件和軟件基礎設施錯誤可能會導致客戶無法訪問系統。內部和外部攻擊或其他惡意活動(如拒絕服務攻擊)也會干擾或破壞客戶托管的工作負荷。
(3)災難。
客戶希望托管數據中心設施具有更強的彈性和更高的可靠性,因此他們通常希望遠離自然災害(颶風、洪水、地震等)和人為災害(火災、車禍和戰爭)。雖然謹慎的托管措施應該降低風險,但不可能完全避免和消除,不可預見的災難會使托管數據中心設施癱瘓或損壞。
(4)連接。
托管服務本質上是遠程實施的,WAN或者互聯網連接對托管服務提供商至關重要。大多數托管服務提供商允許客戶使用一個或多個可用電信提供商的服務。電信基礎設施不完善,也不是100%可靠,這可能會導致使用某些電信服務的客戶連接中斷。在這種情況下,電信提供商(而不是托管服務提供商)必須恢復服務,但對這些托管客戶的影響可能與火災或洪水一樣嚴重。
消除內外部地方的故障。作為托管數據中心客戶的組織,解決托管數據中心的故障尤為具有挑戰性,因為解決問題的過程首先取決於識別/確定問題,然後確定托管數據中心提供商(或客戶)是否對故障和糾正措施負責。
傳統的托管數據中心。例如,假設客戶的工作負荷在傳統的托管數據心設施中運行,托管服務提供商只提供空間、電源、制冷等服務。如果數據中心設施出現故障(如電源故障),客戶將依賴托管提供商提供的電力服務,托管服務提供商將根據當前的服務水平達成協議(SLA)該條款負責查找和糾正電源問題。而根據問題的嚴重程度,修復過程可能需要數小時甚至數天的時間。
但客戶仍將負責部署托管服務提供商的所有服務器、存儲、網絡等業務設備。可能導致服務器、存儲子系統、網絡交換機故障,甚至應用程序故障(軟件錯誤)。客戶將使用系統管理工具來監控和報告硬件和軟件的狀態,他們有責任通過重新啓動服務器、更換服務器或使用其他潛在的維修方法來發現和解決問題。
如果客戶真的負責維修,他們將面臨完成工作的挑戰。維修和排除故障應用程序可能需要實際操作,這可能需要幾個小時來部署人員和執行維修所涉及的實際工作。在某些情況下,托管服務提供商的員工將提供幫助,但客戶需要額外付費。
托管或托管主機。在托管數據中心或托管方案中,托管服務提供商將提供數據中心空間、服務器、存儲設備、網絡等基礎設施,客戶可以從托管服務提供商那裡租用。然而,托管服務提供商對整個基礎設施負全部責任,客戶不需要聯繫或關注托管服務提供商的基礎設施。如果托管數據中心設施或計算資源出現故障,托管服務提供商必須按照服務等級協議處理併發出停機通知(SLA)故障排除行排除和補救。在這種情況下,客戶通常會通過已建立的支持渠道(如電子郵件、電話或門戶網站)通知托管服務提供商故障。
如果問題實際上是客戶的應用程序,而不是托管服務提供商的基礎設施(即托管數據中心設施正常運行,但客戶的應用程序崩潰或其他異常),那麼托管服務提供商就沒有義務確定客戶的應用程序是否正常工作。客戶必須有適當的監控來跟蹤應用程序的運行狀態或瞭解應用程序的性能。當應用程序出現問題時,客戶IT團隊可選擇遠程操作重新啓動應用程序,或要求托管服務提供商採取糾正措施。
托管數據中心支持的類型
當出現問題時,組織必須找到快速、經濟、高效的方法來解決問題,同時保持行業標準或法規要求的數據完整性和工作負荷安全。客戶可以使用四種類型的支持:
(1) 員工。當客戶在托管設施中部署自己的設備時,他可能會雇傭自己IT員工管理和維護,而不是托管服務提供商。這有助於確保IT任務的執行符合客戶的最佳利益,但其員工在遠程托管數據中心工作可能需要時間和成本。
(2) 遠程控制。客戶可聘請託管服務提供商的員工協助開展各種工作IT任務。這些任務可能包括物理設備故障排除、更換和配置。通常根據緊急情況或請求進行遠程操作,費用將添加到客戶的月度賬單中。
(3) 遠程管理。現代IT系統管理工具擅長通過網絡訪問硬件設備來執行常見的管理任務。這些工具通常可以重新啓動服務器,重新啓動應用程序,遷移虛擬機,備份和恢複數據。遠程管理在管理日常任務時非常有效,客戶無需派遣員工在托管數據中心工作。
(4) 托管服務。托管服務提供商通常提供客戶可以參與的一系列服務,如托管電子郵件。一些服務費可能會增加到每月的托管費中,而一些服務(如備份)可能會帶來額外的費用。然而,托管服務提供商通常可以參與增加新服務、改變現有服務或減少或取消不必要的服務。
減少數據中心托管設置中的不確定性
托管服務提供商可能會給客戶帶來更多的不確定性和複雜性。在偏遠地區運行的托管數據中心設施可能受到地緣政治不確定性和安全性的影響。托管服務提供商管理成本的願望可能會減少支持者的數量,從而降低其響應能力。托管服務提供商的合併和請求可能會影響其日常運營。
客戶可以通過謹慎的應急計劃和大量的監控措施來緩解這些托管問題。常見步驟包括:
(1)工作負荷的適用性。
托管數據中心必須評估每個應用程序的適用性。並非所有的應用程序都適合托管,因為法規遵從性、安全性、性能或其他問題。有些工作負載應該保留在內部部署數據中心。
(2)遣返。
如果托管服務失敗或證明托管不適合應用程序,則應採取遣返措施將每個工作負荷遷移到托管數據中心,並可在組織內部署數據中心恢復應用程序。
(3)備份和災難恢復。
托管工作負荷不能保證可用性。重要的工作負荷可能需要額外的托管服務投資,以建立備份和災難恢復框架,以確保托管服務中應用程序的可用性。默認情況下,托管服務提供商不提供此類服務。
(4)詳細監控。
使用監控工具(如應用程序性能監控)和用於重要工作負程序的運行狀態和性能,以及托管服務提供商及其資源的可用性。瞭解托管服務提供商的服務等級協議(SLA),並使用監控結果來驗證托管服務提供商是否遵守服務等級協議(SLA)。
(5)尋求幫助。
托管服務提供商將為尋求支持提供各種幫助。客戶應清楚瞭解可用的幫助,如何求助,必要時如何採取行動,及時採取糾正措施。
歸根結底,托管服務提供商是客戶的業務合作夥伴(而不是員工),托管服務提供商提供的資源和服務不能被視為理所當然。客戶有責任管理托管數據中心環境中運行的工作負荷,並需要能夠與托管服務提供商合作,以保持每個工作負荷的可用性和性能。
(本文來源網絡整理,如有侵權請聯繫刪除)
數據中心,數據中心託管,託管提供商