容災項目需要注意的幾大問題
Christophe
2004/05/24
一、容災項目需要多大的投資?
其實這個問題也可以被反問為:你希望容災系統(tǒng)能達到什么效果?要想闡述清楚此問題,首先要明白兩個指標:RTO和RPO。
RTO,Recover Time Object,恢復時間指標,是指當災難發(fā)生后,生產系統(tǒng)需要多長時間能夠恢復生產,它是衡量企業(yè)在災難發(fā)生后多長時間能重新開始運轉的指標。
RPO,Recover Point Object,恢復點指標,是指災難發(fā)生后,容災系統(tǒng)能把數(shù)據(jù)恢復到災難發(fā)生前的哪一個時間點的數(shù)據(jù),它是衡量企業(yè)在災難發(fā)生后會丟失多少生產數(shù)據(jù)的指標。
理想狀態(tài)下,我們希望RTO=0,RPO=0,即災難發(fā)生對企業(yè)生產毫無影響,既不會導致生產停頓,也不會導致生產數(shù)據(jù)丟失。從當前計算機技術水平來說,我們可以為用戶建設這種類型的容災系統(tǒng),其中最著名的例子當屬VISA和Master的結算系統(tǒng),由于這兩個銀行結算組織占據(jù)了全球銀行結算業(yè)務的重要地位,他們的結算系統(tǒng)不允許發(fā)生任何停頓和數(shù)據(jù)丟失的情況,即使在"911"這種極端情況下。但實現(xiàn)這樣的容災系統(tǒng)的投資巨大,它結合了存儲數(shù)據(jù)復制技術、服務器操作系統(tǒng)鏡像技術、集群技術、數(shù)據(jù)庫高可用性設計、應用系統(tǒng)高可用性設計、同步容災技術、異步容災技術、同城容災方案、異地容災方案,以及相應的管理流程和意外事件反映處理流程等詳細的規(guī)章制度,和人員配備、行政保障手段(通信、交通等),綜合在一起完成一個完整的容災方案(實際是雙生產中心或多生產中心方案,并沒有單純的容災中心)。但是這種方案的投資過于巨大,目前中國可能除了中國銀聯(lián)這種特殊性質的企業(yè)外,不會有太多的企業(yè)會去實現(xiàn)這個系統(tǒng)。
因此,在電信企業(yè)BSS/OSS系統(tǒng)容災系統(tǒng)建設中,投資規(guī)模為多少是合理的?如果業(yè)務部門能確認RTO/RPO指標,那技術部門選擇了合適的容災技術以及配套的管理流程就可以確定投資規(guī)模了。例如,如果業(yè)務部門確認,災難發(fā)生后,3個小時內營業(yè)廳恢復生產就可以滿足用戶需求,且營業(yè)系統(tǒng)數(shù)據(jù)不能丟失,那RTO=3小時,RPO=0,那就必須選擇基于存儲平臺數(shù)據(jù)復制技術的同步容災方案;如果業(yè)務部門確認,災難發(fā)生后,3天能恢復經營分析系統(tǒng)工作,且以前的數(shù)據(jù)丟失可以忽略不計,那RTO=3天,RPO無,那選擇ATA磁盤實現(xiàn)異地備份,就能滿足要求。
另外需要提的是,為了百年不遇的災難投入巨資建設一個容災中心,容災中心的設備在災難發(fā)生前不能給企業(yè)帶來效益,這是企業(yè)決策者很難接受的,因此如何合理分配投資,將容災中心建設成為第二生產中心,與生產中心成為企業(yè)支持企業(yè)正常運行的雙中心,并實現(xiàn)互為容災,是降低總體擁有成本(TCO,Total Cost of Ownership),提高投資回報率(ROI,Return Of Investment)的一個重要措施,應該得到企業(yè)的高度重視。
二、容災項目對生產系統(tǒng)性能的影響
容災系統(tǒng)的本質是將生產系統(tǒng)的數(shù)據(jù)以及這些數(shù)據(jù)的變化,完整地復制到容災系統(tǒng)中,并通過相關技術手段,確保容災系統(tǒng)中數(shù)據(jù)的完整性和一致性。容災系統(tǒng)對生產數(shù)據(jù)和生產數(shù)據(jù)的變化的復制操作,必然需要與完成這些操作相對應的CPU資源(存儲的CPU、或服務器的CPU)、內存資源(存儲的Cache、或服務器的RAM)、網絡資源(TCP/IP、FC或FICON),如果這些資源不能獨立分配給容災系統(tǒng)(實際上不可能獨立),則必然會影響生產系統(tǒng)的性能。
因此更準確的問題是,如何確保容災系統(tǒng)上線后,在可以實現(xiàn)既定的RTO/RPO指標的同時,不會影響生產系統(tǒng)的正常運行?答案是可以通過技術手段實現(xiàn)的。
要想實現(xiàn),則必須對現(xiàn)有生產系統(tǒng)進行詳細的性能分析,包括系統(tǒng)I/O特性(IOPS,Respond Time,讀寫比,I/O塊大小,I/O峰值、均值,時間特性等等)、系統(tǒng)內各子系統(tǒng)業(yè)務特點、存儲空間分配、服務器CPU和RAM資源的使用狀況、SAN網絡情況(端口使用狀況、Zoning劃分狀況、端口IOPS等)、能夠使用的數(shù)據(jù)復制鏈路(FC、TCP/IP、ATM、E1/E3)以及鏈路的QoS保障等。獲得這些數(shù)據(jù)后,通過對容災系統(tǒng)I/O分布的詳細設計,將I/O均勻分布到更多的設備上,從而確保生產系統(tǒng)實現(xiàn)容災后,不會造成性能下降影響正常生產的情況出現(xiàn)。
三、容災不能替換備份
容災系統(tǒng)會完整地把生產系統(tǒng)的任何變化復制到容災端去,包括不想讓它復制的工作,比如不小心把計費系統(tǒng)內的用戶信息表刪除了,同時容災端的用戶信息表也會被完整地刪除。如果是同步容災,那容災端同時就刪除了;如果是異步容災,那容災端在數(shù)據(jù)異步復制的間隔內就會被刪除。這時就需要從備份系統(tǒng)中取出最新備份,來恢復被錯誤刪除的信息。因此容災系統(tǒng)的建設不能替代備份系統(tǒng)的建設。
反過來,建設了備份系統(tǒng),是否就不需要容災系統(tǒng)?這還要看業(yè)務部門對RTO/RPO指標的期望值,如果允許RTO=14天,RPO=1天,那備份系統(tǒng)就能滿足要求。不過,可要考慮清楚了:從磁帶上恢復50TB的數(shù)據(jù),并要確保數(shù)據(jù)完整恢復回數(shù)據(jù)庫,是否能在2周內完成?
四、選擇什么容災技術能保證項目實施成功?
容災項目實施成功,與技術關系不大。能舉出成功案例的容災技術,則必有它的可行性。但作為一個工程師,除了考慮項目的可行性外,還要考慮項目的不可行性。任何技術的實現(xiàn),都有它的制約條件。在自己的生產環(huán)境中,能否避免這些制約條件的出現(xiàn)?或者出現(xiàn)后,是否有資源可以解決它?
比如ORACLE在中國實施了一個基于DataGuard的容災方案,但在實施過程中出現(xiàn)了大量意想不到的問題和BUG,作為對中國電信客戶的重視,ORACLE甚至派遣R&D人員到現(xiàn)場編制PATCH以保證項目能實施,但這種資源,是否每個客戶都能向ORACLE索。
因此,選擇一個簡單的容災方案,并選擇一個曾經成功實施過該方案的工程團隊,才是確保容災項目實施成功的關鍵。
中國計費網(www.billingchina.com)
相關鏈接:
感谢您访问我们的网站,您可能还对以下资源感兴趣:
亚洲综合伊人,成人欧美一区二区三区视频不卡,欧美日韩在线高清,日韩国产午夜一区二区三区
a级**毛片,成年女人视频播放免费观看,亚洲第一区视频,日韩在线视频中文字幕
日本不卡中文字幕一区二区,精品国产一二三区,国产高清天干天天视频,天天干天天天天
亚洲高清视频在线播放,一级淫片在线观看,三级aa视频在线观看,欧美天天爽
黄色永久免费,www.sese123,91系列在线观看,美国毛片一级视频在线aa
mmmmxxxx国产在线观看,亚洲合集综合久久性色,在线国产观看,亚洲精品一级无码中文字幕
玖玖精品,国产精品1区2区3区在线播放,天堂网视频在线,欧美精品在线视频
欧美色人阁,aaaa大片,神马影院午夜剧场,91福利一区二区三区
亚洲一区二区三区高清不卡,美国毛片aa,啪啪视,天天添天天操
综合激情网站,最新中文字幕在线播放,电影伦敦战场,亚洲精品在线不卡
www淫,亚洲欧美在线视频免费,www.亚洲一区二区三区,98色花堂国产精品首页
衡东县 |
肃北 |
扶沟县 |
威宁 |
建水县 |
广元市 |
五大连池市 |
霸州市 |
天镇县 |
沈阳市 |
临清市 |
岳普湖县 |
新津县 |
巴南区 |
太白县 |
滨海县 |
安吉县 |
定结县 |
正阳县 |
东宁县 |
玉林市 |
皋兰县 |
尖扎县 |
青川县 |
新河县 |
从江县 |
武鸣县 |
广河县 |
桑植县 |
南充市 |
芮城县 |
随州市 |
贵阳市 |
平安县 |
厦门市 |
抚远县 |
吉隆县 |
繁昌县 |
乃东县 |
兴义市 |
深水埗区 |