在時(shí)間軸上記錄數(shù)據(jù)的挑戰(zhàn)之一,就是如何針對(duì)你的使用目的,將數(shù)據(jù)量保持在可管理的范圍內(nèi)。磁盤(pán)空間確實(shí)比以前便宜多了,而且能夠存儲(chǔ)幾個(gè)TB的數(shù)據(jù)也沒(méi)有問(wèn)題,然而,隨著數(shù)據(jù)的不斷增長(zhǎng),確保這些數(shù)據(jù)能夠一直可查詢和可移動(dòng)(如果需要的話),則是明智的。
有些系統(tǒng)采用高分辨率采集數(shù)據(jù),并存入關(guān)系數(shù)據(jù)庫(kù)中。這樣做,解決了數(shù)據(jù)獨(dú)立查詢的問(wèn)題,而且也能夠用SQL對(duì)這些數(shù)據(jù)做些處理,這對(duì)很多工程師來(lái)講,是一個(gè)相對(duì)直接和順手的事情。而且,因?yàn)椴杉倪@些數(shù)據(jù)從來(lái)不會(huì)刪除,最后將得到一個(gè)相對(duì)規(guī)整的數(shù)據(jù)庫(kù),而規(guī)整性肯定有利于數(shù)據(jù)庫(kù)的性能,而且,對(duì)于大規(guī)模數(shù)據(jù)庫(kù)來(lái)說(shuō),也能夠維持其效率。
就個(gè)人而言,用一個(gè)已成為事實(shí)標(biāo)準(zhǔn)的存儲(chǔ)系統(tǒng)來(lái)存儲(chǔ)測(cè)量數(shù)據(jù)的話,我還沒(méi)發(fā)現(xiàn)會(huì)缺少什么,這個(gè)存儲(chǔ)系統(tǒng)就是循環(huán)數(shù)據(jù)庫(kù)(RoundRobinDatabase,RRD)。RRD的基本思想是,隨著時(shí)間的推移,一旦達(dá)到某個(gè)你選定的周期(小時(shí)、天、周、月、年),則有意地降低數(shù)據(jù)的分辨率。這樣樣做的理由是,大多數(shù)測(cè)量數(shù)據(jù)只是在最近的時(shí)間周期內(nèi)有意義,而且另外一個(gè)好處就是RRD的數(shù)據(jù)文件不會(huì)增長(zhǎng)到超過(guò)限制,這意味著你不用擔(dān)心磁盤(pán)空間的問(wèn)題。
許多系統(tǒng)都有RRD的分辨率定義,即對(duì)于磁盤(pán)空間采取保守做法,從一小時(shí)開(kāi)始就從高分辨率往下降。這滿足你的要求嗎?或許滿足,也或許不滿足,取決于是什么測(cè)量數(shù)據(jù),從哪個(gè)時(shí)間點(diǎn)開(kāi)始使用這些數(shù)據(jù),以及從整個(gè)應(yīng)用來(lái)說(shuō)單個(gè)的測(cè)量數(shù)據(jù)有多重要。我曾經(jīng)看到有的機(jī)構(gòu)保存了若干年的、有幾千個(gè)測(cè)量指標(biāo)的、分辨率為10秒的數(shù)據(jù),也看到其他成功的公司,他們的做法是最近一小時(shí)的分辨率是15秒,最近一天的分辨率是1分鐘,而最近一周的分辨率是5分鐘。很明顯,因?yàn)闊o(wú)法回到過(guò)去獲得更多細(xì)節(jié)數(shù)據(jù),所以應(yīng)將分辨率設(shè)置為多粒度的。
高分辨率數(shù)據(jù)應(yīng)存留多長(zhǎng)時(shí)間呢?這也是一個(gè)眾說(shuō)紛紜的問(wèn)題。就我個(gè)人而言,我從來(lái)不需要知道www125服務(wù)器的CPU在2005年2月10日的12:34:50和12:34:60這兩個(gè)時(shí)間點(diǎn)的情況,但我對(duì)2005年所有Web服務(wù)器在每周的峰值情況會(huì)很有興趣,所以我對(duì)大值和平均值的保存時(shí)間會(huì)比原始數(shù)據(jù)的保存時(shí)間要長(zhǎng)。像分辨率的情況一樣,如果你發(fā)現(xiàn)管理起來(lái)有問(wèn)題,則數(shù)據(jù)的存留時(shí)間(retention)可以調(diào)小一點(diǎn)。
在決定測(cè)量的分辨率時(shí),要想清楚它們的使用情況。你要查看這些數(shù)據(jù)以找出宕機(jī)或性能下降的原因嗎?如果是的話,你就要將分辨率設(shè)得高一點(diǎn),小于一分鐘。你要將數(shù)據(jù)用于以3、6或9個(gè)月的時(shí)間尺度做容量規(guī)劃嗎?是的話,你就要將大值和最小值的數(shù)據(jù)保存得更長(zhǎng)一些。
還要讓這些數(shù)據(jù)幫你獲得模式的歷史意義,用這些數(shù)據(jù)回答下面的問(wèn)題時(shí),測(cè)量數(shù)據(jù)采集系統(tǒng)會(huì)真正出彩的:
● 對(duì)某個(gè)特定資源,每天的峰值時(shí)是哪些?每周周的峰值日是哪些?每年的峰值月是哪些?
● 有季節(jié)性模式嗎?如夏時(shí)日會(huì)低些,節(jié)假日會(huì)高些,峰值會(huì)出現(xiàn)在學(xué)校上課期間,等等。
● 大(波峰)值與最小(波谷)值比較起來(lái)怎么樣?
● 在
網(wǎng)站建設(shè)用戶分布于全球、跨越多個(gè)時(shí)區(qū)的情況下,波峰與波谷的關(guān)系是否發(fā)生變化?
本文題目:網(wǎng)站時(shí)間分辨率和存留時(shí)間的考慮
URL標(biāo)題:http://m.rwnh.cn/news4/147454.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站內(nèi)鏈、Google、移動(dòng)網(wǎng)站建設(shè)、微信公眾號(hào)、品牌網(wǎng)站設(shè)計(jì)、云服務(wù)器
廣告
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源:
創(chuàng)新互聯(lián)