地址:北京市密雲區高嶺鎮政府辦公樓
王經理 13393261468
Q Q:514468705/1049705527
郵箱:jhcxkj@163.com
數據中心 的軟件智能化已成為共識,但背後的IT運維到底要進化到何種程度?現實情況是,一方麵隨著企業所麵臨的運維數據在時間、空間、架構、規模等方麵越來越複雜,另一方麵新舊業務之間的平滑對接對傳統IT流程也是不小的考驗,如果運維的AI化落後於數據中心的AI,無疑會拖累數字化的進程。
如果按照字麵意思,AIOps即Artificial Intelligence for IT Operations,不過Gartner對它的解釋是AlgorithmicIT Operations,也就是基於AI算法去解決IT運維流程中的問題,例如性能監控、可用性分析、關聯事件、自動化,以及日誌、應用狀態等運維數據信息。這一過程中,並不涉及人為的幹擾因素。
調查顯示,全球有超過3000名CIO將數字化業務列為工作重點,預計AIOps的全球部署率會從2017年的10%升至2020年的50%,所覆蓋的行業將涉及金融、電力、醫療、航天、通信、HPC等領域。其背後的挑戰可以從幾個方麵來看,首先是規模倍增,設備端可能有數十萬台主機需要監控至少數千個運行狀態,所處理的數據量日均也是T4B級,而且還是實時的。
其次,IT運維對連續性的高要求使得持續的交付、集成、調度成為首選,再加上海量的數據,對已有的運維成本存在較大挑戰,例如當前IT業務中充斥著公私混的雲環境,以及第三方的SaaS類應用,傳統的管理辦法再彈性環境中難以適應,而借助人工去監督、統計、追蹤、分析是很大的工作量,情況隻會越來越糟。
此外,更多的感知行為正在向網絡邊緣移動,使得雲基礎架構成為了IT解決方案部署的首選平台,從而讓開發人員獲得了較以往更大的權力,IT人員還要在IT Ops的層麵承擔更多責任,例如了解業務是如何在服務和底層架構之間進行交互的。
從腳本運維到工具運維,再到智能運維,特點可以體現以下方麵:數據源搜集、大數據分析、規則及模式識別、域算法、AI算法、自動化。需要注意的是,AIOps並沒有改變AI應用本身,而是強調對流程、規則的AI化。例如,AIOps可以從無到有先對單點進行擊破,然後形成局部方案以此類推到麵,由多個單點模塊組成完整的AIOps流程。其優勢是,可知悉、可重用、可升級。
與此同時,運維團隊的角色也在轉變,要加入數據工程師、開發工程師甚至是AI工程師,除了繼續承擔質量、成本、效率方麵的工作,還要在AIOps的實施過程中變身為需求的發起方和結果收驗方。其中,運維AI工程師也要學會利用機器學習對運維產生的數據、經驗進行整理和分析,最終讓數據發揮應用的價值。
當然要想具備運維AI的技能並不容易,對TensorFlow、Caffe、CUDA這些框架要有基礎,還要對交叉驗證、驗證曲線等模型評估有基本的判斷。要知道在基礎運維平台中,除了在運維時要提供標準化的運維數據和操作,在AIOps時的一些接口仍需要同時支持人工和自動數據獲取和運維操作。
無論多麽智能,AIOps的核心還是Ops,這就決定了其會是跨領域的技術理念,因此在企業內部開發者智能運維的時候,要結合業務特點來製定AI機製,不排除做二次開發的可能。如果運維不能AI化,那數據中心再怎麽智能也隻會停留在表層。
來源:小宝探花视频在线观看 http://www.ywyd5.com