運維工程師(shī)必備利器(qì)|一招實現運維智能化
發布時(shí)間(jiān):2023-05-04 閱讀: 分享

簡介

現如今,随着日益增速的業務環境,運維在企業中的角色越來(lái)越重要。如何在錯綜複雜的IT系統架構中降低(dī)現場(chǎng)故障處理(lǐ)時(shí)間(jiān)、提高(gāo)運維效率,是每個(gè)IT運維工程師(shī)都必不可(kě)少(shǎo)的技(jì)能。

為(wèi)解決上(shàng)述運維人(rén)員困境,2021年12月30日,雲智慧AIOps社區(qū)邀請(qǐng)雲智慧開(kāi)發運維工程師(shī)Larry Zhang在線分享了開(kāi)源運維管理(lǐ)平台OMP的功能特性、使用場(chǎng)景等關鍵內(nèi)容,更是通(tōng)過實踐操作(zuò)詳細地介紹了如何通(tōng)過OMP實現運維智能化。

什麽是OMP?

OMP是雲智慧自主設計(jì)研發,集輕量級、聚合型、智能運維為(wèi)一體(tǐ)的綜合運維管理(lǐ)平台,具備納管、部署、監控、巡檢、自愈、備份、恢複等功能。通(tōng)過減輕交付難度,提升運維自動化、智能化,進而提升運維整體(tǐ)效率,保障業務運行(xíng)的連續性和(hé)安全性。

OMP功能特性介紹

  • 主機納管

OMP支持頁面添加和(hé)批量添加兩種方式納管主機。添加過程中OMP會(huì)驗證主機SSH連接信息,驗證通(tōng)過後即可(kě)創建主機。此外,主機創建完成後OMP會(huì)自動安裝 Agent端,安裝完成後也會(huì)自動對主機進行(xíng)監控。點擊監控按鈕可(kě)以查看主機監控面闆,通(tōng)過主機詳情頁面也可(kě)以查看主機詳細信息及曆史記錄。


圖片


  • 服務發布

OMP支持頁面上(shàng)傳和(hé)後端掃描兩種方式發布服務包。使用者可(kě)以根據實際情況選擇适合的方式發布服務包,OMP會(huì)對服務包進行(xíng)驗證,驗證通(tōng)過後,即可(kě)成功發布。服務包發布成功後,會(huì)在應用商店(diàn)中展示所發布的服務列表,使用者可(kě)以點擊查看進入到服務詳情頁面,查看服務詳細信息。


圖片


  • 服務管理(lǐ)

在應用商店(diàn)點擊安裝,選擇服務版本後,進入安裝流程。涉及到依賴信息的服務,OMP會(huì)自動将依賴服務顯示出來(lái),保障服務安裝完後的可(kě)用性。此外,使用者可(kě)根據選擇的服務數(shù)量,進行(xíng)服務分布和(hé)服務配置修改。安裝過程中,OMP會(huì)優先安裝依賴服務,點擊“查看詳細安裝信息”後 可(kě)查看安裝腳本輸出內(nèi)容。安裝完成後OMP會(huì)自動對服務監控,在服務列表中可(kě)以對服務進行(xíng)停止、啓動、重啓、卸載等操作(zuò)。


圖片


  • 監控告警

異常清單中會(huì)展示正在處于告警狀态指标數(shù)據,幫助使用者了解當前異常主機、服務。通(tōng)過點擊監控按鈕,可(kě)以查看該服務的監控面闆。告警記錄可(kě)以幫助使用者查看曆史告警信息,通(tōng)過點擊監控按鈕,可(kě)以查看該服務的監控面闆。此外,監控設置中使用者可(kě)以根據實際情況,配置監控組件的地址信息,也可(kě)以開(kāi)啓郵件推送,選擇告警信息接受郵件。


圖片


  • 狀态巡檢

OMP中巡檢共分為(wèi)3個(gè)維度,分别是 深度分析、主機巡檢、組件巡檢,在巡檢記錄中選擇所需的巡檢內(nèi)容即可(kě)。巡檢執行(xíng)完成後,可(kě)以在線查看,或者導出巡檢報告,也可(kě)以通(tōng)過郵件推送報告到指定郵箱。


圖片


  • 默認指标

使用者可(kě)以在指标中心統一設置默認的告警指标,告警指标會(huì)對巡檢、監控同時(shí)生(shēng)效,當主機或服務資源使用超過阈值時(shí),觸發告警。


圖片


  • 系統設置

當納管主機或服務需要升級或維護時(shí),可(kě)以開(kāi)啓維護模式。維護模式下,OMP會(huì)抑制(zhì)所有(yǒu)告警通(tōng)知。通(tōng)過郵件設置,可(kě)以設置發件郵箱信息。


圖片


OMP使用場(chǎng)景分析

  • 多(duō)雲環境集成
  • 快速部署環境
  • 主機批量管理(lǐ)
  • 自動監控告警
  • 資産信息記錄

OMP實操答(dá)疑解惑

  1. OMP中巡檢的目的是什麽?

巡檢的目的主要是對主機和(hé)服務時(shí)間(jiān)做(zuò)狀态快照,以此可(kě)以查看該時(shí)間(jiān)段主機和(hé)服務的狀态。

  1. 巡檢和(hé)監控的區(qū)别是什麽?

巡檢的顆粒度更細一些(xiē),主要是對內(nèi)核等信息進行(xíng)監控;而監控隻會(huì)對主機CPU等級别信息的一個(gè)監控。

  1. OMP中監控是用什麽技(jì)術(shù)實現的?

目前是通(tōng)過prometheus操作(zuò)實現。

  1. OMP能采集到設備上(shàng)的日志(zhì)嗎?

目前OMP采集的是服務日志(zhì),可(kě)在安裝包中指明(míng)服務日志(zhì)路徑進行(xíng)日志(zhì)采集。

  1. OMP所有(yǒu)組件都開(kāi)源了嗎?

是的,目前OMP所有(yǒu)的組件均已開(kāi)源。歡迎大(dà)家(jiā)登陸Github或Gitee點贊支持~

OMP GitHub 地址: https://github.com/CloudWise-OpenSource/OMP

OMP 國內(nèi)鏡像地址: https://gitee.com/CloudWise/OMP


13905190502 南京市玄武區(qū)洪武北路188号長發數(shù)碼大(dà)廈11樓E座
友(yǒu)情鏈接
百度 網絡安全和(hé)信息化委員會(huì) FreeBuf網絡安全行(xíng)業門(mén)戶

分享:
Copyright © 2020-2022 南京斯萊克斯網絡科技有限公司 版權所有(yǒu)  
技(jì)術(shù)支持:飛酷網絡