摘要:第一次遭遇云服務器完全崩潰突然控制臺無法重啟控制臺無法強制關機。到目前為止,騰訊云的工程師和我本人都沒有找到具體原因。檢查日志,和騰訊云工單的工程師討論。
第一次遭遇云服務器完全崩潰:CPU 突然 100%、控制臺無法重啟、控制臺無法強制關機。到目前為止,騰訊云的工程師和我本人都沒有找到具體原因。
本文所示圖片使用的是 github 倉庫圖片,網速過慢的朋友請移步原文地址或者來我的小站godbmw.com
1. 案件陳述案發地點:騰訊學生云 ubuntu 16.04,寬帶 1M
案發時間:2018-10-09 13:40
案件陳述:
2018-10-09 12:37 左右,CPU 使用率突增到 100%,內網出入寬帶、流量包、內存使用量均無異常。
2018-10-09 13:28 正式死機,控制臺無法強制重啟(清除緩存、更換瀏覽器依然無法重啟)、無法強制關機。
開始提交工單,周折很久,討論無果。遂沒有消息。
2018-10-09 14:00 重回控制臺,再次強制重啟成功!
重新上線了自己的項目和公司的一些腳本,慶幸沒造成損失。
檢查日志,和騰訊云工單的工程師討論。雙方確認日志沒有問題,無法排查出錯誤。
2. 災難現場首先是,個人網站無法進入,如下圖:
首先是,無法強制重啟和強制關機,如下圖所示,請注意截圖上方的報錯提示信息:
騰訊云的控制臺已經說明了,強制關機是強制切斷電源的物理操作!這都沒法進行,我本人表示很迷。
在提交的工單的過程中,有大概 20 分鐘的時間,是沒有任何回復的。然后大概到了 2018-10-09 14:00,多次嘗試后,終于可以強制關機和重啟了。有圖為證:
以上情況,不得不讓我懷疑,是工程師們手動去關的服務器電源:)
3. 如何補救?經過這次服務器事件才體會到:云服務的穩定性是多么重要! 這次事件騰訊云的工程師也沒語焉不詳,我只能猜測是:服務器的物理問題。
所以,我這次果斷準備了兩個服務器,開始做“負載均衡”(還要修改備案)。除此之外,日常備份數據也是非常重要。
最后,還是希望云服務商的服務盡量保持穩定,至少在服務器崩潰的情況下,可以找出崩潰原因并且修復。
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/8074.html
摘要:在未來十年,管理數據倉庫的服務器的數量將增加倍以便迎合倍的大數據增長。毫無疑問,大數據將挑戰企業的存儲架構及數據中心基礎設施等,也會引發云計算數據倉庫數據挖掘商業智能等應用的連鎖反應。 大數據正在徹底改變IT世界。那么,什么樣的數據談得上數據呢? ? 根據IDC的報告,未來十年全球大數據將增加50倍。僅在2011年,我們就將看到1.8ZB(也就是1.8萬億GB)的大數據創建產生。這相當...
摘要:毫無疑問,大數據將挑戰企業的存儲架構及數據中心基礎設施等,也會引發云計算數據倉庫數據挖掘商業智能等應用的連鎖反應。 ?????? 大數據正在徹底改變IT世界。那么,什么樣的數據談得上數據呢? 根據IDC的報告,未來十年全球大數據將增加50倍。僅在2011年,我們就將看到1.8ZB(也就是1.8萬億GB)的大數據創建產生。這相當于每位美國人每分鐘寫3條Tweet,而且還是不停地寫2.6976...
摘要:如果組織受到自然災害的影響,云備份可能無法幫組織恢復其物理基礎設施,但它可以為組織保存大量重要的數據。企業一旦與云備份提供商達成合作關系,并確定了要備份的內容備份計劃,以及恢復要求,供應商就會接管,提供程序確保備份正確執行,并按計劃執行。2017年9月和10月對許多人來說可能記憶深刻。哈維颶風在9月襲擊了美國德克薩斯州,幾個星期后,伊爾瑪颶風對佛羅里達州造成了嚴重破壞,隨后在墨西哥和危地馬拉...
摘要:因為,臉書的服務器也擁堵了,還是遭遇了有史以來全球最大的宕機事故。另外,專家估計全球服務中斷一小時將給全球經濟造成億美元的損失。相比于這些損失而言,受此消息影響,的股價今天暴跌了近,創下全年最大單日跌幅,百億市值瞬間蒸發。 上面這個公號「澀郎」,是我的一個備用號,為了防止萬一哪天大號失聯...
閱讀 1035·2023-04-25 17:51
閱讀 2851·2021-11-23 09:51
閱讀 1469·2021-11-08 13:21
閱讀 2428·2021-09-22 15:14
閱讀 1514·2019-08-30 12:48
閱讀 1076·2019-08-29 12:44
閱讀 1137·2019-08-26 12:21
閱讀 1396·2019-08-26 10:47