久久精见国产亚洲av高清热-国产经典a区久久久一区二区三区-又色又爽又高潮的免费视频国产-亚洲精品福利视频你懂的

logo

您的位置:

新聞中心

行業(yè)應用軟件的AI運維系統方案 ——中科軟研發(fā)實踐技術交流會
時間:2024-12-16 15:08:25

       隨著行業(yè)數字化轉型的深入、人工智能的快速發(fā)展,傳統運維框架正在逐漸被顛覆,運維難度指數增長。客戶應用軟件系統群日益龐雜,急需完成系統群的集成運維,運維需求向更加專業(yè)化和規(guī)范化邁進。如何讓IT系統持續(xù)穩(wěn)定運行、如何讓運維更加智能化成為了很多客戶的痛點和難點。頭部ISV在當前復雜的運維需求中具備重要的機會點和發(fā)力點。
       中科軟科技股份有限公司作為提供行業(yè)應用軟件產品和解決方案的高新技術軟件企業(yè),行業(yè)應用軟件的運維是公司業(yè)務中的重要部分。在AI技術迅猛發(fā)展的當下,如何利用好頭部ISV的技術和資源優(yōu)勢,加快AI運維系統的開發(fā)和應用并及時落地推廣也是中科軟科技一直以來的努力方向。
       為推進公司行業(yè)應用軟件的AI運維系統的更好發(fā)展和落地,同時也為了通過和相關領域專家、客戶的指導交流,推動公司AI運維系統的技術開發(fā)及運維行業(yè)的技術發(fā)展和進步,中科軟科技于2024年11月29日及12月2日成功舉辦了為期兩天的研發(fā)實踐技術交流會,主題為“行業(yè)應用軟件的AI運維系統方案”。
       在軟件開發(fā)的過程中,運維和AI結合是一個比較典型的部分。目前AI的實踐大量用于分析非結構化數據中,產生的效益主要來自多模態(tài)數據、機采數據等方面,而運維正是機采數據的應用場景。
       從目前實踐看,將運維單純作為工具這一路徑還存在一定困難,在垂域大模型崛起后,新的硬件和模型基座廠家讓目前的運維領域出現了合作趨勢。其中的模型部分,需要通用和專用兩個層面的訓練?;鶑S家側重通用,而頭部ISV由于擅長領域知識,側重專用的關鍵部分。當前大模型訓練關注成本和準確精度,所以問題焦點在標準正確答案數據集,即半結構化標注數據集,也是“精準計算”模型訓練所需數據集。問題關鍵又從模型通用技術,轉回了領域知識數據的準備。在運維領域也分成系統軟件和應用軟件兩部分,特別是運維本身的知識庫/智能體的建設。只有大量工程實踐和積累的情況下,模型訓練精度才能提高,成本才會下降。故必須廣泛開展半結構化數據集應用軟件實踐,另外新興的小模型(SLM)也是運維系統發(fā)展的一個重要方向,因其具有準確和本地化安全部署的特點,在降低運維成本的同時,也更能契合目前運維市場更加專業(yè)化和精確化的需求。ISV和廠家在這方面需要緊密的合作,才能提供給客戶更優(yōu)質的產品和服務。
       在新需求產生的同時,運維領域的幾個特點也讓運維智能化變革成為可能:全周期,在做需求、設計、開發(fā)測試和使用手冊的整個周期過程中都涉及到了運維。全內容,運維的過程可以分為三個部分,三個部分中都可以有AI的助力。數據結構需要運維引入AI技術作為數據模型、數據做表的工具;在功能及運行模塊,即表示層部分,涉及到大量界面的統一管理,這也是人工智能的重要應用場景;最后在組件和腳本平臺部分,行業(yè)應用軟件的代碼生成也可以運用AI的能力。全環(huán)境,運維不僅涉及到應用軟件層面,也關系到系統軟件層面,運維監(jiān)控就是對操作系統、數據庫、網絡等多方面進行監(jiān)控,在這部分工作中AI也大有可為。
       本次交流會非常榮幸地邀請到來自人保科技、農銀人壽、恒安標準養(yǎng)老保險、現代財險、中意人壽、中華人壽、華泰人壽、邦邦汽車、中國疾病預防控制中心、民航科學技術研究院、攬秀科技、神舟靈云等各行業(yè)客戶及生態(tài)伙伴的技術專家,以及北京交通大學、北京工業(yè)大學、中國科學院軟件研究所、中國社會科學院、中國科學院大學等高校及科研機構的專家參與方案評審,共同探討AI運維系統在行業(yè)應用軟件領域的實踐和應用。
       中科軟科技各事業(yè)群在各領域行業(yè)應用軟件的AI運維系統研發(fā)實踐中,積累了豐富的經驗及解決方案,部分智能化運維方案已在客戶端開始落地和試點工作,在本次技術交流活動中相關團隊就已有的AI運維系統和具體解決方案進行了成果展示,其中財險團隊-財險數智化運維平臺、壽險團隊-知行AIOps平臺獲評本次技術交流活動的優(yōu)秀方案:
       ? 財險數智化運維平臺的01234體系
       隨著智能運維(AIOps)理念的不斷發(fā)展,這一領域正步入高速發(fā)展的全新階段。AIOps 作為一種極具創(chuàng)新性的技術手段,吸引著眾多行業(yè)頭部企業(yè)以及富有開拓精神的創(chuàng)業(yè)者紛紛投身其中。一時間,構建完善的 AIOps 體系和打造相關特色產品成為業(yè)內最為熱門的話題與發(fā)展趨向。
       為推動 AIOps 在保險行業(yè)垂直領域的眾多業(yè)務場景中有效落地,事業(yè)群在2017年研發(fā)的開發(fā)運維一體化平臺(DevOps平臺)基礎上,升級進化成財險數智化運維平臺,核心理念是0-1-2-3-4體系。        數字“0”代表財險數智化運維平臺的起點,即2017年推出的財險DevOps平臺,主要功能包含監(jiān)控平臺、CMDB、ITSM、作業(yè)平臺等。       數字“1”代表一個運維數據中心,負責整合多來源運維數據(指標、鏈路、日志、事件等),涵蓋數據采集、數據加工、數據存儲、運維數倉、數據服務和數據治理等環(huán)節(jié),確保運維數據能夠被高效利用,為后續(xù)智能檢測、智能分析、智能預測等場景提供全面支撐。
       數字“2”代表兩類算法模型,即小模型和大模型,小模型主要負責指標聚類、趨勢預測等算法,用于特定場景的異常檢測和故障診斷;大模型整合 MaaS平臺,算法能力、對話能力、生成能力,與小模型結合提升運維效果,滿足用戶日常運維管理的需求。
       數字“3”代表為三類運維場景賦能,具體涵蓋穩(wěn)定性保障、成本管理以及效率提升這三大關鍵領域。其中囊括了系統監(jiān)控、時序預測、日志監(jiān)控、容量規(guī)劃、智能規(guī)劃、成本管理、自動作業(yè)、智能變更、ChatOps 等多種復雜運維場景,全方位助力運維工作的高效開展。
       數字“4”代表四套完備的運維保障體系,分別為運維知識體系、運維管理體系、運維協作體系以及運維技術體系。運維知識體系著重于對運維知識與保險知識進行統籌整合;運維管理體系負責組織管理、制度管理以及流程管理;運維協作體系細分為內部協作與外部協作兩方面;而運維技術體系則涵蓋開源及三方組件,旨在為運維工作提供堅實的技術支持。
       在財險數智化運維平臺的基礎上,我們針對眾多保險公司運維的不同場景推出了多個解決方案,并在多個關鍵領域所取得顯著效果,例如在多維根因分析方面,以往需要耗費1至2小時,借助財險數智化運維平臺方案可將時間降低至10秒至20秒,效率提升了200倍。日志分析同樣成果突出,從異常問題被發(fā)現到完成修復,從過去的半個小時壓縮至現在的10分鐘左右,使得平均修復時間(MTTR)效率提升了約3倍,減少了因問題擱置而可能引發(fā)的業(yè)務風險。容量規(guī)劃也取得了重要突破,系統監(jiān)控點實現了極大的擴充,系統資源利用率提升了10%~50%。再看 ChatOps 方面,運維人員每天平均產生的運維問答達100多次,運維效率平均提高了12倍左右。
       ? 壽險-知行AIOps平臺
       關于AI大模型應用的探索已經到了具體場景、具體業(yè)務的賦能提質、提效的階段。整個運維領域的發(fā)展過程是從依賴人工、腳本的ITOps到橫向打通各個模塊的DEVOps到從海量運維數據中不斷地學習、提煉、總結,進行智能分析、決策的AIOps,在穩(wěn)定性保障、成本管理、效率提升三大價值領域持續(xù)發(fā)揮作用。AI賦能智能運維的過程是通過AI大模型融合小模型工具,構建具有感知、交互、情景記憶、判斷決策的智能體運維架構。
       對于行業(yè)應用運維更多的要考慮對于業(yè)務的關聯,在整個運維體系中,更聚焦在ITSM方面。經過對近5年超大規(guī)模保險核心系統運維經驗總結我們發(fā)現,系統答疑的運維處理量占據日常運維工作中的首位,系統答疑、數據維護、數據提取三項總占比高達86%,是成本投入的重點部分。性能問題、宕機問題雖然占比小,但是破壞力最強、排查難度最高。處理時效仍有較大進步空間。我們希望AI運維可以做到簡化運維處理流程,快速定位問題、事件秒級響應;有效實時預警,生成參考解決方案,提升運維效率;大幅減少系統人工答疑工作量。        壽險信息服務事業(yè)群團隊以多年大規(guī)模保險核心系統運維服務經驗為基礎,結合LLM大模型RAG、AI Agent能力,構建知行AIOps平臺,實現智能運維體系的完整建設。整個平臺架構分為四層,底層為CMDB、領域知識所構成的數據基礎;其上通過數據處理平臺、MaaS平臺兩大支撐,結合平臺組件工具,形成業(yè)務功能、AI能力兩大功能版塊。更廣范圍的結構化、半結構化數據的處理,與模型的產出、Agent構建兩者并重。IT服務管理的規(guī)范化和AI賦能的能力輸出也是相輔相成的,AI成為復雜事務過程中的操作入口和信息處理元件。
       AI能力的兩大核心是“智能分析”和“智能問詢”,智能分析通過AI來組織形成更貼近事實描述的運維事件信息,結合平臺分析組件,進行快速的問題定位。智能問詢根據標準化的知識圖譜內容進行針對性的問題答復和操作指引,自動完成問題改派,生成方案建議,代替一線運維工作。
       智能分析的流程是分析任務創(chuàng)建、構建分析路徑、定位異常點、根因分析。首先對系統預警進行有效的歸類,根據預警等級及業(yè)務場景來觸發(fā)分析任務。通過skywalking等工具提取服務拓撲圖、鏈路日志、響應參數、應用指標等半結構化數據。數據的規(guī)范化處理是構建分析路徑的關鍵步驟,將半結構化、結構化、非結構化數據借助領域知識、規(guī)則庫經過數據清洗、規(guī)范化再進行存儲。數據采集匯總完成之后需要組合串聯鏈路信息,形成事實描述長文本。運維分析信息來源于不同的設備、中間件,同時含有大量的業(yè)務標簽,通過大模型來實現理解和組織,形成分析路徑。同時運行過程中產生的這些描述信息又會形成豐富的數據資產提供給模型進行反復迭代訓練,使模型意圖識別的能力越來越強。
       智能問答處理是直接面向業(yè)務人員,業(yè)務人員發(fā)起咨詢事件建立工單進入服務過程。AI代替一線運維人員進行問題回復交流,充分引導業(yè)務補充關鍵信息,對問題進行分類并指派對應二線運維處理。答疑的處理中操作問題居多,因此我們將需求、操作手冊與操作過程的對應關系數據進行迭代訓練,以識別業(yè)務系統操作意圖,實現有效的問答及指引。在存在業(yè)務含義的運維工作中標準化過程是服務質量、服務效率提升的關鍵,業(yè)務需求有非常強的結構化要求,要有非常明確的頁面操作、業(yè)務流程的說明,將問題對應到需求再通過需求對應到相關代碼,制定知識標準化的規(guī)則通過約束運維管理平臺的錄入來積累良好的數據基礎。問題錄入明確分類,并且每次問題解決對應的提交代碼進行關聯,再結合標準需求、標準程序以及表結構實現信息錄入的約束和處理。
       在本次技術交流會上,與會專家評委們不僅充分肯定了中科軟科技通過技術交流的手段促進公司乃至整個行業(yè)技術水平的提升,同時一致認可中科軟科技在行業(yè)應用軟件的AI 運維系統領域展現出創(chuàng)新性,也肯定了中科軟科技在行業(yè)應用軟件的AI運維系統這一領域做出實踐落地的新成果。在本次比賽后,多位專家表達了進一步深化合作的期望,認為公司在AI運維系統方案方面的研究與實踐找到了行業(yè)痛點,提出的解決方案為行業(yè)發(fā)展注入了新的活力。客戶方面也對公司的AI運維系統方案表達了濃厚的興趣,對公司所展示的技術深度和前瞻性解決方案充滿期待,并期望能夠早日在實際業(yè)務中見到這些創(chuàng)新成果的應用。此外,專家們對此次技術交流活動給予了高度評價,認為這次活動不僅為公司內部員工搭建了一個技術交流的平臺,也促進了行業(yè)內外專業(yè)人士之間的思想碰撞、經驗分享和合作機會的探索。
       中科軟科技在未來的發(fā)展中也會一直堅持不斷探索行業(yè)軟件技術發(fā)展前沿及應用實踐,在吸收學習新知識、新技術,不斷加強業(yè)務骨干學習度的同時繼續(xù)傳承中科軟的開發(fā)精神和技術,給客戶提供更為智能、高效的行業(yè)應用軟件解決方案,引領行業(yè)發(fā)展的新趨勢。