摘要:有一次別人的云服務器被攻擊,提供商竟然重啟了物理機然后又諸多悲劇出現最大的感恩就是學到了很多知識。
第一階段(3臺):1測試,1web 1數據庫
這個是云服務器,配置高的驚人,測試的機子竟然和正式的機子一模一樣,只實現了web和數據庫分離的構架
維持了3個月,由于物理機故障,3臺服務器同時掛掉,網站暫停服務至少一天
master-slave:
還是云服務器,配置還是高的驚人, 除了另一個機房實現了web備份和數據庫主從外,跟第一階段沒什么差別
因為一次數據庫服務器數據頁面錯誤,主庫崩潰,web和數據庫跨機房了
master-master
上一次的教訓是數據庫修復的時候,發現master的數據必須從slave導出來...數據一致性的要求.
痛定思痛,決定上雙master-master,這個時候出現了一個應用層的悲劇,就是多個項目要公用一部分表了,而web卻在另在兩個服務器上 期間為了解決沖突,把自增id給岔開了
這個階段最大的悲劇在同一個機房內,web+數據庫沒有備份的,在某次攻擊后,悲劇的發現,web+數據必須切換到那個備份的機房去了
第三階段...還在進行中...
推進太困難了,經過2次事故..我有點不想繼續既做開發又做運維的了...出現問題的時候大家說,我不知道啊,服務器不歸我管理,我怎么操作呢?要講解運維思路的時候大家又不積極
總結得出的最大教訓就是:云服務器太不穩定了,要以數量取勝,不能同一機柜。有一次別人的云服務器被攻擊,提供商竟然重啟了物理機..然后又諸多悲劇出現
最大的感恩就是:學到了很多知識。每次事故服務器我都要被迫親自參與修復,本來不那么熟悉的,一下子被強迫做了很多事情
最近這段時間開始測試的東西有:
Fabric 用于多項目多服務器的代碼發布...
Atlas 數據庫讀寫分離中間件,從另一方面說也是屏蔽數據庫服務器差異的中間件,這點認識很重要,如果有3臺web,當一臺出現問題是,3臺的數據庫連接都要修改,但有了這個中間件,只要把有問題的offline即可...1分鐘就能搞定
Fabric 已經上線使用,Atlas 上線遙遙無期..很多坑等待被發現
2014年2月8日補充:今天因為到期,來不及續費,還剩下10個小時的時間,服務器竟然自動關機了...還好,是關機而已,不是刪除服務器....坑啊
2014年2月12日補充:今天新增加2臺服務器,準備內網使用,中國的帶寬真TMD的貴.并不是每臺都能10M出口帶寬的..
因為沒有統一的上傳文件和圖片,每個服務器都把圖片上傳到自己那臺,最近要考慮怎么把這些圖片整合起來了,因為圖片量比較少,所以準備了一下方案:
rsync + crontab
rsync + inotify
sersync + inotify
inotify + svn
不知道大家還有其它方案么?難點在于多臺服務器之間相互rsync...
再次重申云服務器的好處:新開服務器幾乎是1小時以內,然后,一定要以數量取勝...
2014年2月13日補充:今天同一個物理盤所在的云盤上可能有人大量寫入數據...導致同一個機柜上的N個機子云盤io 100%... 以前對云主機都沒怎么認識,今天真是大開眼界了...
云盤和云主機,另一個大坑就是:天佑同機柜和同物理機的的人都正正當當,不然,一般的人都不知道問題出在哪里
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/7905.html
摘要:有一次別人的云服務器被攻擊,提供商竟然重啟了物理機然后又諸多悲劇出現。造成微博服務短暫不可用。通過建立工具來診斷問題,并創建一種復盤事故的文化來推動并作出改進,防止未來發生故障。 showImg(https://segmentfault.com/img/bV0jif?w=900&h=385); 相信小伙伴們在上網或者玩游戲的時候一定都遇到過無法訪問的情況。服務器炸了的原因有各種各樣,下...
摘要:在谷歌不是這樣,谷歌不會把特定的應用裝在某臺服務器上,業務應用和服務器的強綁定對于谷歌這種量級的數據中心的維護難度太高了。但是金融機構的數據中心規模不像谷歌這么大,所以能做到業務應用和硬件的強綁定。 復雜的基礎IT架構是傳統金融的現狀,如何快速響應用戶需求,加快新業務上線速度,縮短產品的迭代周期? 數人云在容器落地金融云的2年實踐中,實現金融核心業務技術WebLogic、J2EE、Or...
摘要:分享實錄云計算技術源于互聯網公司,現在云計算已經是下一代企業級的發展趨勢。如何做云計算一直是云計算技術的領導者。互聯網公司的快速發展,已經印證了云計算技術和云原生應用相比傳統構架的巨大優勢。 今天小數又給大家帶來一篇干貨滿滿的分享——來自KVM社區線上群分享的實錄,分享嘉賓是數人云CEO王璞,題目是《云計算與 Cloud Native》。這是數人云在KVM社區群分享的第一彈,之后還有數...
摘要:摘要第九屆中國數據庫技術大會,阿里云數據庫產品專家蕭少聰帶來以阿里云如何打破遷移上云的壁壘為題的演講。于是,阿里云給出了上面的解決方案。 摘要: 2018第九屆中國數據庫技術大會,阿里云數據庫產品專家蕭少聰帶來以阿里云如何打破Oracle遷移上云的壁壘為題的演講。Oracle是指數據庫管理系統,面對Oracle遷移上云的壁壘,阿里云如何能夠打破它呢?本文提出了Oracle 到云數據庫P...
閱讀 1411·2021-10-11 11:12
閱讀 3244·2021-09-30 09:46
閱讀 1633·2021-07-28 00:14
閱讀 3132·2019-08-30 13:49
閱讀 2581·2019-08-29 11:27
閱讀 3211·2019-08-26 11:52
閱讀 596·2019-08-23 18:14
閱讀 3435·2019-08-23 16:27