国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

數據庫hang故障分析

IT那活兒 / 2843人閱讀
數據庫hang故障分析
點擊上方“IT那活兒”公眾號,關注后了解更多內容,不管IT什么活兒,干就完了?。。?/strong>

故障簡述

1.1 知識點描述

應用19.13PSU后,疑似觸發數據庫內存Bug 32940955以及BUG 33415279、BUG 33225584,導致數據庫hang住。
1.2 問題處理簡述
中午11:43收到告警,數據庫節點1出現斷連告警,立即登入系統進行檢查,發現數據庫整個hang住,兩個節點實例均無法執行查詢等操作。進一步檢查數據庫日志,發現頻繁報ORA-04031錯誤。
為了快速恢復業務,嘗試進行殺會話,情況沒有明顯好轉,12點15分經客戶同意后停掉節點1的實例,隨后實例2恢復正常,并重新拉起節點1實例。
12:23左右,節點1再次出現嚴重性能問題,內存資源不足,alert日志出現IO ERROR:無法打開磁盤,導致無法進行IO讀寫,節點1發生實例重啟,重啟后,性能問題未解決。

再次經客戶同意后,在12點33分對節點1實例進行停止,隨后節點2恢復正常,在12:45嘗試手動拉起節點1實例,所有節點均恢復正常狀態。在13:26手動拉起節點1監聽,至此所有節點均恢復正常訪問。


標準指導操作

2.1 故障過程回溯分析
1)等待事件分析
事后回溯分析,發現節點1 在11:33左右突然出現大量library cache相關等待事件:
2)主機資源使用情況分析
查看osw,確認故障前主機資源正常。
3)應用會話連接分析及相關時間點的等待事件記錄
11:33左右開始連到數據庫的應用會話數明顯突增:
查看等待事件發現主要是latch: shared pool等待事件:
4)后臺日志記錄分析
查看DB ALERT日志發現大量ORA-4031報錯。
繼續查看db alert日志發現11:43:33開始pmon進程獲取latch一直失敗,12:15:17由于pmon進程掛死導致實例宕掉。
5)Trace日志分析
查看pmon trace日志發現pmon一直在等待內存分配。
6)IO性能分析
檢查12:23 alert日志出現IO ERROR:無法打開磁盤。
12點33分左右,有嚴重的IO性能問題,經分析為內存資源耗盡導致IO性能嚴重下降。
2.2 故障總結
查詢資料文檔發現,應用19.13PSU后,疑似觸發數據庫內存Bug 32940955以及BUG 33415279、BUG 33225584。
2.3 后續處理措施
1)打patch 32940955,讓"so private sga"分布到各個Sub Pool里去。
2)打patch 33415279,避免"pga accounting"的內存泄漏。
3)patch 33225584,解決了共享池內存釋放的調用kghfrunp時超過1秒的 latch: shared pool 等待的問題。

4)需設置如下2個隱含參數

  • "_dlm_stats_collect"=0 :關閉DLM Statistics Collection功能以減少KJSC rnb slots內存組件對shared pool空間的占用。
  • "_shared_pool_reserved_pct"=15 : 建議設置10%~15%之間,增大reserve pool的size,對于超過4.4KB的內存請求是有益處的。




本文作者:胡周盼(上海新炬王翦團隊)

本文來源:“IT那活兒”公眾號


文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。

轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/129263.html

相關文章

  • 阿里云出現大規模故障 “多云”部署或成趨勢

    摘要:昨天凌晨,阿里云出現大規模故障,導致部分互聯網公司和運行不暢,甚至癱瘓。阿里云表示,針對此次故障,將根據協議,盡快處理賠償事宜,但并未公開詳細的賠償細節。事實上,這并非阿里云首次出現故障。由此可見,阿里云此次宕機事件影響程度著實不小。昨天凌晨,阿里云出現大規模故障,導致部分互聯網公司和App運行不暢,甚至癱瘓。一時之間,阿里云官微下幾乎被反饋宕機問題的留言攻陷,有網友調侃稱,程序員、運營和運...

    xiaodao 評論0 收藏0
  • 阿里云宕機啟示錄:多云戰略成趨勢,云服務技術是決勝關鍵

    摘要:對此,阿里云官方回應稱,宕機原因為,華北地域可用區部分服務器等實例出現,后經緊急排查處理后逐步恢復。這也意味著,在未來的云服務競爭中,云服務供應商的技術能力仍將是決勝關鍵。在多云戰略時代,帶領企業走出恐慌區,擴大學習區是關鍵。隨著上云企業的越來越多,云服務宕機帶來了潛在風險也越來越大。 昨天(3月3日)凌晨,沒有任何征兆,阿里云出現大規模宕機故障,華北地區很多互聯網公司都受波及,一大波...

    Ilikewhite 評論0 收藏0
  • RustCon Asia 講師和議程公布!

    摘要:還有從歐洲飛來的不同國籍的講師和長期在社區活躍貢獻的開發者將與大家在北京相聚。將是一次亞洲社區的大聚會,也因為此次大會,亞洲本土的社區連接到了全球其它地區的社區。大會現場將有同傳支持,所以不必擔心語言障礙。 RustCon Asia 上線 CFP(Call For Proposals)接受議題提交的兩周時間里,我們共計收到了中英文議題 50 份!內容非常豐富并且比我們預期的更加多元,在...

    MrZONT 評論0 收藏0

發表評論

0條評論

IT那活兒

|高級講師

TA的文章

閱讀更多
最新活動
閱讀需要支付1元查看
<