咨詢QQ:
      雜志訂閱

      編輯

      網管

      培訓班

      市場部

      發行部

電話服務:
 010-82024984
 010-82024981
歡迎, 客人   會員中心   幫助   合訂本   發布信息
設為首頁 | 收藏本頁
數據中心動力機房的隱形殺手
  • 從當前的新型冠狀病毒肺炎疫情的特殊情況下給人們帶來的危害談到數據中心機房也存在的隱形殺手。筆者就幾種常見的機房裝修材料詳細分析了其造成危害的原因,從而提醒大家對數據中心動力機房的一些“隱形殺手”有一個比較直觀的認識。也希望通過這些分享,讓大家能提前識別風險源和規避這些風險,使其成為真正無害的綠色機房。
  • 當前在新型冠狀病毒肺炎疫情的特殊情況下,大家都通過各種方式來貢獻自己的力量抵御疫情的擴散,也通過對病毒傳播方式的了解從而改變了自己的生活習慣。其實生活中各種有害細菌、病毒是一直存在的,只有對這些看不見的“隱形殺手”有正確認識,養成良好的衛生習慣來防御,并且貫徹“早發現、早隔離”,能夠“對癥治療”,我們可以做到避免或者降低傷害,所以大可不必過度驚慌。
      
      其實在數據中心,特別是電力相關的動力機房,也存在一些看不見的“隱形殺手”,對數據中心的安全運行有著嚴重的安全隱患,也需要我們去正確認識,采取措施來避免或者降低對數據中心安全運行的影響。下面我們分別來看看常見的幾種隱患:
      
      一、碳纖維
      
      碳纖維是什么,怎么能在數據中心變隱形殺手?一般人可能常見的認識就是碳纖維材質的裝飾面,碳纖維材質的車身/車架等這些生活中常見的應用,可能有人還不是很清楚碳纖維跟數據中心有什么關系,那我們先來了解下碳纖維以及它跟數據中心的關聯。
      
      【碳纖維簡介】
      
      碳纖維是一種纖維狀碳材料,如圖1所示。它是一種強度比鋼的大、密度比鋁的小、比不銹鋼還耐腐蝕、比耐熱鋼還耐高溫、又能像銅那樣導電,具有許多寶貴的電學、熱學和力學性能的新型材料。用碳纖維與塑料制成的復合材料所做的飛機不但輕巧,而且消耗動力少,推力大,噪音小;用碳纖維制電子計算機的磁盤,能提高計算機的儲存量和運算速度;用碳纖維增強塑料來制造衛星和火箭等宇宙飛行器,機械強度高,質量小,可節約大量的燃料。1999年發生在南聯盟科索沃的戰爭中,北約使用石墨炸彈破壞了南聯盟大部分電力供應,其原理就是產生了覆蓋大范圍地區的碳纖維云,這些導電性纖維使供電系統短路。
      
      那我們先來對碳纖維的特性劃重點:強度高(抗拉伸),輕,導電。所以在建筑物中需要加強地板承重時,碳纖維就是一個可以考慮使用的很好的材料,跟鋼梁加固相比,更容易實施,提升效果也很明顯。而數據中心的功率密度逐年在上升,并且因為設備集中,也存在很多非常重的設備,所以對地板的承重要求很高。新建的機房在設計建造時會考慮到較高的承重要求,而一些舊機房在升級擴容時就會遇到需要加固地板提升承重量的問題。
      
      機房加固施工使用的是碳纖維材料編織的碳纖維布。施工方式一般都是把地面或天花板鑿開一定深度,把裁剪好的碳纖維布鋪設粘貼,最后再補上水泥,如圖2、圖3所示。
      


      上面看到的都是好處,那碳纖維的加固方式對數據中心,特別是動力機房會有什么影響呢?關鍵就是這個材料的良好導電特性帶來的。因為在施工過程,會涉及到整卷材料的裁剪會產生碎屑,在后期運行階段,不規范的打孔等操作也會帶來碎屑。這些碎屑的碳纖維絲比頭發絲細得多,加上良好的導電特性,形成了漂浮在機房空氣中的不定時隱形炸彈,隨時可能破壞電氣絕緣形成拉弧短路等嚴重故障。
      
      從圖4中可以看碳纖維絲直徑在10um的級別,這種碎屑肉眼看不見,并且質量很輕隨氣流可以漂浮在空氣中。
      
      因為碳纖維材料加固導致的事故,有一例我印象特別深刻,跟大家分享下:
      
      某客戶機房,建設部門堅持要使用碳纖維材料進行動力機房地板的承重加固。施工過程中,發生了一例電源拉弧故障,雖然供應商馬上完成了修復和分析,但建設部門堅持認為是設備自身故障導致。隨之而來的是另外一臺電源的拉弧故障,此時維護部門已經相信了之前的故障分析但建設部門還是不認可??上攵氖堑谌_電源的拉弧故障不可避免的到來了,此時所有人都相信了,立刻停止了相關施工,然后問了一個問題:類似故障還會發生嗎?當時現場沒人能夠確認。
      
      當前大家對“帶口罩,勤洗手,多通風”應該有很深的認識了,當時在處理這個機房的問題時,實際也是類似思路??蛻舨少徚撕芏酂o紡布,對所有的電源設備進風口進行了全面包裹,加強了機房環境清理,加強了機房的通風和空氣循環及空調的濾網更換。
      
      不過好的消息是,碳纖維材料的加固方式在國內數據中心的應用大概從2008年開始逐漸增多,發生的事故也比較頻繁,而在2013年以后就比較少見了,應該跟設計人員和客戶對這個材料的認識加深有關。知道了風險源就有助于規避風險,從而提升運行可靠性。
      
      二、硫化物
      
      機房常見的另一類“隱形殺手”就是硫化物。不同場地,硫化物的來源跟存在形式都有差異(不過一般都是肉眼不可見),對機房安全運行的損害表現也不盡相同,我們只能根據外在表現去推斷、分析和檢測來定位,這一點跟當前我們去查找和定位新冠狀病毒的過程有些相似。
      
      機房的硫化物對安全運行來講主要有兩大類的損害,一是硫酸根離子的存在會降低空氣的絕緣引發短路拉弧故障,二是會對一些金屬產生反應形成另外的傷害。我們可以通過一些實例來增進更顯性的認識。
      
      2.1拉弧
      
      某新建機房內多臺電源設備都發生過故障。但奇怪的是,有時一些電源設備正常工作,但檢查內部發現有些銅排之間有輕微打火跡象,如圖5所示。甚至有一次工作人員在打開機柜門巡視時看到過輕微打火。
      
      我們知道,這種銅排間的打火都是空氣被擊穿的表象。在絕緣距離足夠,也不存在尖端放電的情況,電源及后端負載還在正常工作說明也沒有過電壓的存在,那只有一種可能就是空氣絕緣被破壞了。
      
      該新建機房投入運行后,機房環境保持得很好,檢查沒有發現明顯異常的情況。因為空氣成分的檢測對樣本采樣要求很高,并且檢測成本也很高,我們后面優先對機房內各處的灰塵進行了取樣和檢測,進行了離子色譜檢測分析,其結果見表1。
      
      離子色譜分析是將樣品溶于水后使用DX500分析儀進行檢測。檢測結果表明:電源設備周圍環境中含有大量可溶于水的硫酸根。通過進一步的分析我們把根源定位到了機房的天花板材質不合格,含有較多硫的成分。后面用戶更換了天花板后類似故障不再出現,如圖6所示。
      
      2.2腐蝕
      
      在數據中心的各種設備和器件內部,會有一些鍍銀或含銀的表面,銀很容易跟空氣中含有的硫成分作用,長期會生成疏松粉末狀的硫化銀。對于一些器件,可能會造成參數的偏移,或者存在損壞的隱患。另外因為硫化銀的導電性,疏松的硫化銀的延伸可能造成局部絕緣距離的縮小,如圖7所示。
      
      從電鏡分析來看,銀表面有針狀或拉絲狀物質時,基本就是形成了硫化銀,如圖8所示。而這些硫化物來自何處呢?除了上面案例提到的不合格的裝修材料(如天花板),還有很多其他的可能來源需要去排查:
      
      有的機房內部的硫化物并不是來自機房內部,可能來自室外。比如室外存在嚴重空氣污染,而這些污染空氣被新風系統引入機房。這需要我們了解數據中心周邊的外圍環境。
      
      有的動力機房的沒有單獨的鉛酸蓄電池間,而是跟電源設備共處一室并且沒有良好的定期換氣?,F在的免維護鉛酸蓄電池雖然說是密封電池,但在大電流充放電時還是會有少量含硫的酸性氣體逸出的。這需要我們對數據中心有良好的設計和運維管理。
      
      說到此處,有一個遇到多次的案例跟大家分享下:
      
      某動力機房巡檢時也是發現鍍銀表面存在硫化現象,后面經過多方排查最終定位到了動力機房地面鋪設的絕緣膠墊,如圖9所示。
      
      此絕緣膠墊為早期機電施工方免費贈送,機房人員一直反饋有很大的刺鼻味道。后面我們取樣量一小塊做了初步的電鏡成分分析,結果見圖10。
      
      對絕緣墊進行了電鏡分析,發現絕緣墊含有硫成分達1.78%。為了進一步確認絕緣墊是否有揮發性硫化物釋放,送到專業機構依據JY/T020-1996離子色譜分析通則,對樣品進行了檢測,測試結果摘要如表2,說明確實存在揮發性硫化物的釋放:
      
      橡膠我們知道為了增強特性都會經過硫化的過程,但現在材料和工藝的發展并不會大量使用硫磺來進行硫化的過程。所以對于絕緣膠墊的采購還是需要通過正規的渠道獲得合格的產品,一般來說長期存在非常刺鼻性味道的絕緣膠墊需要引起大家的重視。
      
      三、水汽(的凝結)
      
      水汽到處都存在,可以認為不凝結的水汽對設備并沒有明顯的影響,一般的電源設備可以接受高達99%的相對濕度(注意:會注明無凝露條件)??墒?我們能夠做到完全避免水汽的凝結嗎?通過下面的一些示例可能會讓我們有所警示:
      
      3.1沒有濕度控制
      
      一些非專業的機房,比較常見的是沒有濕度的控制。某個客戶的多個站點,到了5月份梅雨季節,外面一下雨機房內的設備故障隨之而來。到機房現場調查,發現凝露非常嚴重,如圖11所示。電氣設備內部累積的粉塵,加上嚴重的濕氣,對內部電氣絕緣有著絕大的破壞作用。
      
      3.2不合理的分區使用
      
      現在有些較大規模的新建數據中心,因為業務量暫時不飽和,會存在電源設備負載率過低的情況。為了節能,有時客戶會考慮分區關閉一些電源設備和附近的空調,這樣容易導致不同區域的溫度、濕度存在較大的差異。運行中的設備會有發熱損耗,一般即使遇到高濕空氣也不容易形成凝露,而停機的設備內部遇到高濕空氣則產生凝露的可能較大。電氣設備的內部凝露,會嚴重影響電路板和器件長期工作的可靠性。
      
      下面就是某機房在春季停機2個月后再次上電發生故障的一臺設備內部拆解狀況。經過拆解,發現電路板下部的托盤上面有較明顯的水漬跡象,說明前期有過濕度過高產生凝露的情況,如圖12所示。
      
      3.3機房各個環節配合的影響
      
      這是一個電氣和暖通方面設計等級很高的機房,但在一個溫暖潮濕的日子里,卻局部發生了水災。
      
      可以看到,因為室外的暖濕空氣從外面進入排煙管內部,而排煙管外部處于溫度相對較低的機房環境中,導致了排煙管內部水汽凝結并從拼接處往下滴漏。該機房的消防系統的排煙管起碼有兩個明顯問題:一是外部沒有包裹保溫材料,二是管道使用拼接沒有密封,如圖13所示。
      
      這種小的細節缺陷,在一年大部分的時間內并不會表現出異常,容易讓人忽視。所以機房運維無小事,并且要求對“風火水電”各個系統都有足夠的了解。
      
      小結
      
      上面我們通過一些案例的介紹,讓大家對數據中心動力機房的一些“隱形殺手”有了比較直觀的認識。也希望通過這些分享,讓大家能提前識別風險源和規避風險,有了問題也能及時發現和整改,一起為數據中心的安全穩定運行貢獻自己的力量。
      
      作者簡介
      
      羅維華,維諦技術有限公司技術支持部專家,超過二十年UPS開發和全生命周期服務經驗。
      
      編輯:Harris
      
      

  •  
  • 24小时日本在线观看视频