這個(gè)夏天,云服務(wù)日子都不太好過(guò)!繼上次阿里云服務(wù)出現(xiàn)技術(shù)故障后,騰訊云服務(wù)又出了大岔子。7 月 20 日,騰訊云北京三區(qū)部分云硬盤(pán) IO 異常。類(lèi)似的故障在各大云廠(chǎng)商提供的云服務(wù)里,可謂是司空見(jiàn)怪,但這次因?yàn)橐患颐?ldquo;前沿?cái)?shù)控”的創(chuàng)業(yè)公司,這個(gè)事件重新發(fā)酵,引起了熱議。
云廠(chǎng)商故障宕機(jī)這些年來(lái)一直不是什么新聞:
2018 年 6 月 27 日,阿里云故障,起因:運(yùn)維操作失誤觸發(fā)未知 bug;
2017 年 2 月 28 日,云計(jì)算巨頭 AWS S3 故障,起因:調(diào)試時(shí)輸入錯(cuò)誤指令,意外移除大量服務(wù)器導(dǎo)致 S3 不能正常工作;
2017 年 3 月 22 日,微軟云服務(wù)一個(gè)月內(nèi)出現(xiàn)又一次宕機(jī)(上一次是 3 月 7 日);
2015 年 6 月 6 日,QingCloud 廣東 1 區(qū)全部硬件設(shè)備因遭遇雷暴天氣引發(fā)電力故障,造成 QingCloud 官網(wǎng)及控制臺(tái)短時(shí)無(wú)法訪(fǎng)問(wèn)、部署于 GD1 的用戶(hù)業(yè)務(wù)暫時(shí)不可用。
運(yùn)維失誤、硬盤(pán)出故障、機(jī)房被雷劈、調(diào)試輸入錯(cuò)誤指令,不同的失誤會(huì)引起不同的 bug,最后同樣導(dǎo)致云服務(wù)故障,造成大額損失。AWS 的費(fèi)良宏老師回顧云計(jì)算的發(fā)展時(shí)曾說(shuō):“我眼里的云計(jì)算,就是十年生聚,十年教訓(xùn)”。
故障,一直是云服務(wù)命運(yùn)的雙生子,每一次故障的陣痛,都是在倒逼云服務(wù)廠(chǎng)商和用戶(hù)加速成長(zhǎng),只是這一次對(duì)于“前沿?cái)?shù)控”這家創(chuàng)業(yè)公司而言過(guò)于疼痛了。
頭部的云服務(wù)“網(wǎng)紅”產(chǎn)品,都不能保證百分百好用,以至于用戶(hù)都在想,是不是僅僅購(gòu)買(mǎi)一家云服務(wù)廠(chǎng)商的服務(wù),都沒(méi)法保證業(yè)務(wù)穩(wěn)定的需求了?
甚至有公司,因此想自建機(jī)房,但是這樣會(huì)帶來(lái)巨大的后期運(yùn)維成本,大企業(yè)還好,對(duì)于中小企業(yè)尤其是初創(chuàng)企業(yè),更是徒增負(fù)擔(dān)。而且云計(jì)算和自建機(jī)房相比,很明顯云計(jì)算更安全,水平也更高。對(duì)于很多中小企業(yè),公有云無(wú)疑是最好的選擇。
但任何公有云都有可能發(fā)生宕機(jī)或數(shù)據(jù)丟失的風(fēng)險(xiǎn),所以一套完整的運(yùn)維服務(wù)計(jì)劃就顯得尤為重要。
神州光大的服務(wù)即可以助力企業(yè)上云,又可以提供安全可靠的本地備份及按需使用的工程師資源,讓企業(yè)享受上云的便利和低成本的運(yùn)維服務(wù),防止自身經(jīng)驗(yàn)不足帶來(lái)的風(fēng)險(xiǎn)。
對(duì)于企業(yè)而言,IT運(yùn)維的專(zhuān)業(yè)化分工本質(zhì)上是對(duì)IT運(yùn)維人力資源配置的優(yōu)化。例如,明確運(yùn)維事件分級(jí)處理流程,明確運(yùn)維人員的職責(zé)、權(quán)限、義務(wù)和績(jī)效考核標(biāo)準(zhǔn)。事實(shí)上許多實(shí)踐也證明,明確每種運(yùn)維事件的專(zhuān)業(yè)化分工處理流程,可以大大減少I(mǎi)T運(yùn)維操作的隨意性和混亂性,并能大大提高運(yùn)維中的人力資源效率。
服務(wù)架構(gòu)
神州光大IT運(yùn)維管理服務(wù)實(shí)施模型
集中監(jiān)控平臺(tái)
基本排障流程
神州光大致力于幫助企業(yè)解決上云難題,提供可靠的災(zāi)備方案實(shí)施,為客戶(hù)帶來(lái)長(zhǎng)期的運(yùn)維價(jià)值,為保障數(shù)據(jù)安全貢獻(xiàn)力量。