[數(shù)據(jù)庫(kù)相關(guān)]數(shù)據(jù)庫(kù)管理中的數(shù)據(jù)備份、災(zāi)備和歸檔區(qū)別及管理
2014-01-06 10:28:26 訪問(wèn):
隨著各企業(yè)信息化水平越來(lái)越高,各系統(tǒng)的數(shù)據(jù)庫(kù)及數(shù)據(jù)文件也越來(lái)越多,關(guān)于數(shù)據(jù)備份大家也越來(lái)越重視,不過(guò)在備份過(guò)程中遇到的幾個(gè)概念,如備份、災(zāi)備、歸檔也讓人摸不清楚,這里將對(duì)這幾個(gè)概念做一個(gè)解釋:
備份和災(zāi)備或者業(yè)務(wù)連續(xù)性有何不同?是否大多數(shù)業(yè)務(wù)部門認(rèn)為他們是一樣的?
備份是保護(hù)數(shù)據(jù)資產(chǎn)的一種方式,同時(shí),對(duì)數(shù)據(jù)資產(chǎn)的保護(hù)是災(zāi)備計(jì)劃或者業(yè)務(wù)連續(xù)性計(jì)劃的一部分。丟失了數(shù)據(jù)就意味著丟失了業(yè)務(wù)。因此,備份也成為了數(shù)據(jù)冗余策略的一部分。
企業(yè)的大多數(shù)信息用一兩種方法就可以保護(hù)。第一種是更換策略。假如說(shuō)有人不小心將可樂(lè)潑在了服務(wù)器上然后短路了,用戶可以購(gòu)買一臺(tái)然后替換它,或者提前在邊上放置一臺(tái)備用的服務(wù)器,一旦需要就換上。
這樣的方法對(duì)于數(shù)據(jù)來(lái)說(shuō)并不現(xiàn)實(shí),對(duì)于數(shù)據(jù)來(lái)說(shuō),它不能被替換。如今,你可能會(huì)驚訝于許多公司還用著50年代的計(jì)劃,“如果遇到了緊急情況或者我們的樓燒壞了,我們會(huì)讓所有的員工一起重新輸入發(fā)票信息以保證我們的發(fā)票系統(tǒng)能快速恢復(fù)。”
非常有意思的概念,但是在如今互聯(lián)網(wǎng)盛行以及以24/7方式運(yùn)營(yíng)的時(shí)代,你甚至沒(méi)有時(shí)間去重新錄入那些發(fā)票數(shù)據(jù)。因此,你無(wú)法替換數(shù)據(jù),唯一能做的是讓這些數(shù)據(jù)成為冗余的。用戶可以事先做一份拷貝,并將拷貝放在另外的地方。最有效的辦法就是使用備份。可以備份到磁帶上,因?yàn)榇艓强梢砸苿?dòng)的備份數(shù)據(jù)存儲(chǔ)介質(zhì):放在盒子里,然后運(yùn)到遠(yuǎn)程安全的存放場(chǎng)所。
那么,你認(rèn)為什么才是真正意義上的歸檔?很多公司把它們的那些舊的備份當(dāng)做為歸檔,這其中是否有所疏漏?
我們可以把歸檔分成兩類,我估計(jì)你所提到的那些數(shù)據(jù)的集合從技術(shù)角度來(lái)講可以被認(rèn)為是第一種歸檔。一些公司認(rèn)為他們的備份——某一時(shí)間點(diǎn)數(shù)據(jù)的快照——就是歸檔,因此它們習(xí)慣于只保存舊的備份,被將它們視為歸檔文件。
然而事實(shí)上,歸檔應(yīng)該包含比備份集更多的功能。比方說(shuō),你能對(duì)歸檔進(jìn)行搜索,找到某種特定的數(shù)據(jù),或者在所有數(shù)據(jù)中找到某一系列的信息。備份卻很難做到這一點(diǎn)。
歸檔軟件根據(jù)某種規(guī)則把數(shù)據(jù)邏輯地整合到一起。它提供索引信息來(lái)幫助實(shí)現(xiàn)搜索及發(fā)現(xiàn)功能。它常能讓你更靈活地組織數(shù)據(jù)。
總的說(shuō)來(lái),歸檔在數(shù)據(jù)組織整理和發(fā)現(xiàn)搜索方面提供了更大的顆粒度,這一點(diǎn)與備份是有很大區(qū)別的。備份僅僅是數(shù)據(jù)在某一特定時(shí)間點(diǎn)的拷貝,然而歸檔擁有其他額外的屬性,我把它認(rèn)為是第二類的歸檔,它也因此被稱作是“深度歸檔”。
第二類歸檔
沒(méi)錯(cuò),它也被稱為是“動(dòng)態(tài)歸檔”,這可能把問(wèn)題搞得更復(fù)雜了。它是使用磁帶作為文件系統(tǒng),用磁帶做文件服務(wù)器,LTFS,線性磁帶文件系統(tǒng)。
目前市場(chǎng)上有很多產(chǎn)品都宣稱能減少需要用于備份的數(shù)據(jù)量。果真如此么?
是的,你說(shuō)的就是重復(fù)數(shù)據(jù)刪除技術(shù)。該技術(shù)曾經(jīng)一度被一個(gè)非常非常聰明的人認(rèn)為是對(duì)備份管理系統(tǒng)的浪費(fèi)。傳統(tǒng)的備份是針對(duì)全卷的,就是說(shuō)你會(huì)對(duì)所有數(shù)據(jù)都進(jìn)行備份。第二個(gè)晚上,你又會(huì)把那所有數(shù)據(jù)備份一遍,目的是捕捉到變化的數(shù)據(jù)。然后第三個(gè)晚上,你再次對(duì)全部數(shù)據(jù)做備份,用來(lái)捕捉那些變化的或增加的數(shù)據(jù)。
你會(huì)不斷重復(fù)地這樣操作。假設(shè)這個(gè)備份有1TB的數(shù)據(jù)量;那么到周末,你就不得不找個(gè)5TB或6TB的空間來(lái)存放備份下來(lái)的數(shù)據(jù)。
但是問(wèn)題是,對(duì)于大多數(shù)拷貝而言,90%的數(shù)據(jù)實(shí)際上是重復(fù)的。
因此,如果我們能夠?qū)⒛遣糠謹(jǐn)?shù)據(jù)除去,就可以把5天備份產(chǎn)生的5TB數(shù)據(jù)縮減到1.5TB,這對(duì)于精簡(jiǎn)磁盤空間當(dāng)然是有好處的。
重復(fù)數(shù)據(jù)消除技術(shù)能找出那些相同的比特或文件或其他相同的數(shù)據(jù),選擇最近的版本保存,并丟棄其他拷貝。通過(guò)這種方式就縮減了信息的數(shù)量。這項(xiàng)技術(shù)是有幫助的,但同時(shí)你會(huì)擔(dān)心應(yīng)該如何恢復(fù)數(shù)據(jù),或者說(shuō)怎么把數(shù)據(jù)從消重的狀態(tài)中取出來(lái)變成可讀的模式。
在有些情況下,這個(gè)不成問(wèn)題,但是有時(shí)由于算法壓縮了數(shù)據(jù),因此在提取數(shù)據(jù)時(shí)需要相反的算法。這實(shí)際上會(huì)增加災(zāi)難恢復(fù)情況下數(shù)據(jù)恢復(fù)所需要的時(shí)間。它同時(shí)也增加了復(fù)雜性并需要用戶有登陸使用該備份軟件的能力。
我不想讓過(guò)程這么麻煩,現(xiàn)在的情況是我的數(shù)據(jù)中心受損了,我需要的是能盡快將數(shù)據(jù)恢復(fù)到可用的狀態(tài),使用新技術(shù)自有其優(yōu)勢(shì)所在,但坦率地說(shuō),我對(duì)重復(fù)數(shù)據(jù)刪除技術(shù)不是特別熱衷。
此外,許多我的金融行業(yè)的客戶們也不會(huì)對(duì)他們的數(shù)據(jù)進(jìn)行去重操作,這是由于美國(guó)證券及交易委員會(huì)的規(guī)定,他們擔(dān)心律師搞不清什么是重復(fù)數(shù)據(jù)刪除,反問(wèn),什么是重復(fù)數(shù)據(jù)刪除。
然后他找到IT,IT的回復(fù)是,“是的,我們的確用了重復(fù)數(shù)據(jù)刪除技術(shù),有些時(shí)候我們也會(huì)從消重后的數(shù)據(jù)里恢復(fù)。”得到了這個(gè)消息,股東就會(huì)和法官說(shuō),“根據(jù)法律,我們是不允許提供修改過(guò)的金融數(shù)據(jù)的,這樣的操作實(shí)際是違反了SEC條款。沒(méi)有證據(jù)證明消重技術(shù)不會(huì)修改數(shù)據(jù)本身。”
其實(shí)是否會(huì)修改數(shù)據(jù)本身并不重要。事實(shí)上它的確可能不會(huì)修改,但這不會(huì)阻礙負(fù)責(zé)價(jià)值1100萬(wàn)美金案子的律師來(lái)證明它有。當(dāng)然他們也不會(huì)花這么多錢在‘證明重復(fù)數(shù)據(jù)刪除技術(shù)沒(méi)有改變數(shù)據(jù)的事實(shí)’上。
消重的確有效果嗎?從廣泛的角度講,答案是肯定的,但使用增量備份的方法也能達(dá)到類似的效果。這就是說(shuō)只用對(duì)每天改變的文件進(jìn)行備份。
這和重復(fù)數(shù)據(jù)刪除很類似,除了沒(méi)有做一個(gè)完整的備份和將每天的增量進(jìn)行去重操作,都是拷貝了改變的數(shù)據(jù)。事實(shí)上是,我這幾天一直在想,備份是不是真是我們應(yīng)該選擇的方法,當(dāng)然我們說(shuō)的是傳統(tǒng)的備份模式。
備份本身將所有的數(shù)據(jù)都收集起來(lái),整合到一個(gè)容器里,稱為一個(gè)備份文件,然后將這份文件存放在任意的存儲(chǔ)介質(zhì)上?;謴?fù)的時(shí)候則需要當(dāng)時(shí)進(jìn)行備份操作時(shí)候的軟件將數(shù)據(jù)恢復(fù)回來(lái)。這是一項(xiàng)耗時(shí)的工作,因此需要給它足夠的時(shí)間以完成。
如今,在有類似線性磁帶文件系統(tǒng)(LTFS)這樣的產(chǎn)品,我們就可以將需要備份的文件直接拷貝到該文件系統(tǒng)上。我們甚至不需要一個(gè)備份容器來(lái)完成這樣的工作。這就給了我們一種全新且具有創(chuàng)新精神的方式來(lái)完成一份數(shù)據(jù)的拷貝。