訂閱
糾錯
加入自媒體

人工智能如何創(chuàng)建自動駕駛數(shù)據(jù)中心?

2020-08-17 14:42
千家網(wǎng)
關注

人工智能驅(qū)動的健康監(jiān)控、配置管理監(jiān)督

數(shù)據(jù)中心充滿了需要定期維護的物理設備。人工智能系統(tǒng)可以超越定期維護,幫助收集和分析遙測數(shù)據(jù),從而確定需要立即關注的特定區(qū)域!比斯ぶ悄芄ぞ呖梢孕岢鏊羞@些數(shù)據(jù)和斑點模式,以及異常點,”Schulz說。

Bizo補充說:“健康監(jiān)測從檢查設備配置是否正確以及性能是否符合預期開始。”由于有成百上千個IT機柜和數(shù)萬個組件,這些平凡的任務可能是勞動密集型的,因此并不總是能夠及時徹底地執(zhí)行!

他指出,基于大量感官數(shù)據(jù)日志的預測性設備故障模型可以“發(fā)現(xiàn)一個即將出現(xiàn)的組件或設備故障,并評估其是否需要立即維護,以避免任何可能導致服務中斷的容量損失!

JuniperNetworks負責企業(yè)和云營銷的副總裁MichaelBushong認為,企業(yè)數(shù)據(jù)中心運營商應該忽略一些與人工智能相關的過度宣傳和炒作,而專注于他所說的“無聊的創(chuàng)新”

是的,人工智能系統(tǒng)可能有一天會“告訴我問題出在哪里,并加以解決”,但是到了這一點,許多數(shù)據(jù)中心運營商會接受“如果出了問題,請告訴我要去哪里看”,Bushong說

依賴關系映射也是AI有用的一個重要但不是特別令人興奮的領域。如果數(shù)據(jù)中心經(jīng)理正在對防火墻或其他設備進行策略更改,可能會產(chǎn)生什么意外后果?”如果我提出一個改變,知道爆炸半徑范圍內(nèi)可能有什么是很有用的。

保持設備平穩(wěn)、安全運行的另一個重要方面是控制所謂的配置漂移(configurationdrift),這是一個數(shù)據(jù)中心術語,指的是隨著時間的推移,臨時配置的變化會導致問題的產(chǎn)生。Bushong說,人工智能可以作為“額外的安全檢查”來識別即將發(fā)生的基于配置的數(shù)據(jù)中心問題。

人工智能與安全

Bizo認為,人工智能和機器學習“可以通過對事件進行快速分類和聚類來簡化事件處理(事件響應),從而識別出重要事件并將其與噪聲分離開來。更快的根本原因分析有助于操作員做出明智的決定并采取行動!

人工智能在實時入侵檢測中特別有用,Schulz補充道;谌斯ぶ悄艿南到y(tǒng)可以檢測、阻止和隔離威脅,然后可以回去進行法醫(yī)調(diào)查,以確定到底發(fā)生了什么,黑客能夠利用哪些漏洞。

在安全操作中心(SOC)工作的安全專業(yè)人員經(jīng)常會收到過多的警報,但基于人工智能的系統(tǒng)可以掃描大量的遙測數(shù)據(jù)和日志信息,從而清除日常任務,從而使安全專家能夠騰出時間來處理更深層次的調(diào)查。

基于人工智能的工作負載優(yōu)化

在應用程序?qū),AI有可能自動將工作負載移動到適當?shù)闹扅c,無論是在內(nèi)部部署還是在云端!盇I/ML將來應該根據(jù)性能、成本、治理、安全、風險和可持續(xù)性的眾多規(guī)范,實時決定在哪里放置工作負載。

例如,工作負載可以自動移動到最省電的服務器,同時確保服務器以最高效率運行,即70-80%的利用率。Bizo說,人工智能系統(tǒng)可以將性能數(shù)據(jù)整合到等式中,因此對時間敏感的應用程序在高效服務器上運行,同時確保不需要快速執(zhí)行的應用程序不會消耗過多的能量。

基于人工智能的工作負載優(yōu)化引起了麻省理工學院研究人員的注意,他們?nèi)ツ晷妓麄冮_發(fā)了一個人工智能系統(tǒng),可以自動學習如何在數(shù)千臺服務器上調(diào)度數(shù)據(jù)處理操作。

但是,正如Bushong所指出的,現(xiàn)實情況是,如今的工作負載優(yōu)化是像亞馬遜、谷歌和Azure這樣的超大規(guī)模公司的專利,而不是一般的企業(yè)數(shù)據(jù)中心。原因有很多。

實施人工智能的挑戰(zhàn)

優(yōu)化和自動化數(shù)據(jù)中心是正在進行的數(shù)字化改造計劃的一個組成部分。戴爾的Tabet補充道,“借助COVID-19,許多公司現(xiàn)在都在尋求進一步的自動化,推動人工智能驅(qū)動、能夠自我修復的‘數(shù)字數(shù)據(jù)中心’的理念!

谷歌在2018年宣布,已將其數(shù)個超規(guī)模數(shù)據(jù)中心的冷卻系統(tǒng)控制權轉(zhuǎn)為人工智能程序,該公司報告稱,人工智能算法提供的建議使能源使用量減少了40%。

但是,Bizo說,對于那些名字不是谷歌的公司來說,在數(shù)據(jù)中心使用人工智能“在很大程度上是一種理想”。一些AI/ML特性在事件處理、基礎設施運行狀況和冷卻優(yōu)化中可用。但是,AI/ML模型要取得比目前標準數(shù)據(jù)中心基礎設施管理(DCIM)更明顯的突破還需要更多年的時間。與自主汽車開發(fā)非常相似,早期階段可能很有趣,但與它最終承諾的突破性經(jīng)濟/商業(yè)案例相去甚遠!

Tabet認為,一些障礙是“需要雇傭或培訓合適的人員來管理系統(tǒng)。另一個需要注意的問題是數(shù)據(jù)標準和相關體系結(jié)構的需要!

Gartner這樣說:“AIOps平臺成熟度、it技能和運營成熟度是主要的阻礙因素。高級部署面臨的其他新挑戰(zhàn)包括數(shù)據(jù)質(zhì)量和“IT基礎設施和運營團隊”缺乏數(shù)據(jù)科學技能。

Bushong補充說,最大的障礙一直是人。他指出,外雇數(shù)據(jù)科學家對許多企業(yè)來說是一個挑戰(zhàn),對現(xiàn)有員工的培訓也是一個障礙。

另外,Bushong說,員工抵制技術的歷史由來已久。他指出,軟件定義網(wǎng)絡(SDN)已經(jīng)存在了十年,但仍有四分之三以上的IT運營仍由CLI驅(qū)動。

“我們必須相信,各種基礎設施的運營商準備把控制權讓給人工智能,”Bushong表示。“如果一群人還不相信空管員能做出決定,那么你怎么訓練、教育和安慰一群人,讓他們做出如此重大的轉(zhuǎn)變呢?業(yè)內(nèi)普遍的態(tài)度是,如果我這么做,我就會失業(yè)!

這就是為什么Bushong建議企業(yè)在人工智能方面采取那些小而乏味的步驟,而不是陷入經(jīng)常圍繞一項新技術的炒作中。


<上一頁  1  2  
聲明: 本文系OFweek根據(jù)授權轉(zhuǎn)載自其它媒體或授權刊載,目的在于信息傳遞,并不代表本站贊同其觀點和對其真實性負責,如有新聞稿件和圖片作品的內(nèi)容、版權以及其它問題的,請聯(lián)系我們。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號