Tärkeimmät mittarit usean pilven varmuuskopioinnin valvontaan
Haluatko luotettavia varmuuskopioita? Aloita oikeiden mittareiden seuraaminen. Usean pilven varmuuskopioinnin valvonta yksinkertaistaa tietojen suojaamista keskittämällä kaiken yhteen paikkaan. Mutta todellinen käännekohta on keskittyä keskeisiin mittareihin, jotka varmistavat varmuuskopioiden luotettavuuden, palautuksen nopeuden ja kustannusten hallinnan.
Seurattavaa:
- Palautumisajan tavoite (RTO): Kuinka kauan järjestelmät voivat pysyä alhaalla ennen kuin sillä on vaikutuksia liiketoimintaan?
- Palautuspisteen tavoite (RPO): Kuinka paljon datan menetys on hyväksyttävää?
- Varmuuskopioiden onnistumisprosentti: Ovatko varmuuskopiot valmistuneet suunnitellusti?
- Tiedonsiirtonopeudet: Kuinka nopeasti tiedot voivat liikkua varmuuskopioiden aikana?
- Tallennustilan käyttö: Onko tallennustilasi lähellä rajaansa?
- Tietojen eheystarkastukset: Ovatko varmuuskopiotietosi oikein ja virheettömiä?
- Tapahtuman vasteaika: Kuinka nopeasti epäonnistumiset voidaan korjata?
- Suojattujen resurssien määrä: Ovatko kaikki kriittiset järjestelmät katettu?
- Varmuuskopioarkiston tallennustilan kulutus: Hallitsetko varastointikustannuksia tehokkaasti?
- Käyttölokit ja tarkastusketjut: Kuka käytti varmuuskopioitasi ja milloin?
Näiden mittareiden seuraaminen auttaa estämään käyttökatkoksia, tietojen menetystä ja ylikulutusta. Lisäksi se varmistaa, että varmuuskopiojärjestelmäsi on linjassa liiketoiminnan tarpeiden ja vaatimustenmukaisuusvaatimusten kanssa.
Kysy asiantuntijalta Demo-istunto: Veeam ONE Hybrid Cloud Backup Monitoring Masterclass | Webinaari

1. Palautumisaikatavoite (RTO)
Palautumisaikatavoite (RTO) määrittelee, kuinka kauan järjestelmäsi voivat olla poissa käytöstä vian jälkeen, ennen kuin se alkaa vahingoittaa liiketoimintaasi. Yksinkertaisesti sanottuna se on pisin mahdollinen seisokkiaika, jonka sinulla on varaa ennen kuin kaiken on oltava jälleen täysin toimintakunnossa. Kari Rivas, Backblazen vanhempi tuotemarkkinointipäällikkö, muotoilee asian näin:
""Palauttaminen tarkoittaa, että järjestelmät ovat takaisin toiminnassa – täysin toimintakunnossa – ja käyttäjät (työntekijät, asiakkaat jne.) voivat käyttää niitä samalla tavalla kuin ennen tietoturvaloukkausta.""
Oikeanlaisen palautumisajan (RTO) saaminen on ratkaisevan tärkeää, koska se sitoo tekniset palautumissuunnitelmasi suoraan liiketoimintasi prioriteetteihin.
Seisokkien kustannukset usein asettavat RTO-tavoitteesi. Esimerkiksi rahoitusalan yritykset pyrkivät tyypillisesti lähelle nollaa olevaan RTO:hon, koska jo muutaman minuutin offline-tilanne voi maksaa miljoonia. Toisaalta vähemmän kriittiset järjestelmät, kuten sisäiset arkistot, kestävät seisokkeja päiviä ilman merkittäviä seurauksia.
Käytä porrastettua lähestymistapaa RTO:ihin: Määritä kriittisille sovelluksille tiukat palautumisajat (RTO) ja lisää joustavuutta vähemmän tärkeille järjestelmille. Tämä strategia pitää palautuskustannukset hallittavina ja varmistaa samalla, että tärkeimmät toimintosi suojataan. Tee yhteistyötä osastonjohtajien kanssa arvioidaksesi kunkin järjestelmän seisokkiajan taloudellisia vaikutuksia – tämä tekee RTO:sta liiketoimintalähtöisen mittarin pelkän teknisen mittarin sijaan.
Testaa säännöllisesti "palautumisaikatodellisuuttasi" (RTR) harjoitusten tai todellisten tapahtumien aikana. Jos RTR jatkuvasti jää odotettua hitaammaksi, se on merkki siitä, että varmuuskopiojärjestelmäsi tarvitsee päivitystä. Esimerkiksi nauhapohjaiset varmuuskopiot ovat tunnetusti hitaita, koska ne vaativat fyysisen haun ja latauksen. Pilvipohjainen tallennustila puolestaan tarjoaa välittömän pääsyn, mikä voi nopeuttaa palautumisaikoja huomattavasti. Paloharjoitukset ja pöytäpeliharjoitukset ovat loistavia työkaluja sen varmistamiseksi, että palautumisaikatavoitteesi ovat realistisia ja saavutettavissa.
2. Palautumispisteen tavoite (RPO)
Vaikka RTO keskittyy hyväksyttävään seisokkiaikaan, RPO keskittyy siihen, kuinka paljon datahävikki on siedettävä. Pohjimmiltaan RPO mittaa viimeisimmästä varmuuskopiosta palautettavien tietojen ikää. Jos RPO on esimerkiksi yksi tunti, tiedostat, että jopa 60 minuuttia dataa voi kadota yhden häiriön aikana. Tämä mittari on kriittinen monipilviympäristöissä, joissa tarkka seuranta on välttämätöntä palautustoimien yhdenmukaistamiseksi liiketoiminnan prioriteettien kanssa.
RPO vaikuttaa suoraan siihen, kuinka usein varmuuskopiot on tehtävä. Tunnin RPO tarkoittaa, että varmuuskopiot on suoritettava vähintään kerran tunnissa. Kriittisten järjestelmien – kuten maksuyhdyskäytävien tai potilastietojen – RPO:iden on oltava mahdollisimman lähellä nollaa. Toisaalta vähemmän tärkeät tiedot, kuten markkinointianalytiikka tai arkistoidut ostotilaukset, pystyvät käsittelemään 13–24 tunnin RPO:ita aiheuttamatta merkittäviä häiriöitä.
Tässä on silmiinpistävä tilasto: yli 721 000 yritystä ei saavuta elvytystavoitteitaan[1]. Usein tämä tapahtuu siksi, että RPO-päätöksiä pidetään puhtaasti teknisinä eikä strategisina liiketoimintavalintoina. Kari Rivas, Backblazen vanhempi tuotemarkkinointipäällikkö, korostaa tätä:
""Päätös siitä, mitä standardeja täytetään, on yhteinen vastuu. Ja nuo standardit… ovat tavoitteita, jotka IT- ja infrastruktuuritoimittajien tiimien on täytettävä.""
Sen selvittäminen, kuinka paljon minuutin seisokkiaika maksaa yrityksellesi, voi selkeyttää realististen RPO-tavoitteiden asettamista.
Monipilviympäristöissä, joissa suorituskyky voi vaihdella palveluntarjoajien ja alueiden välillä, on tärkeää pitää silmällä Palautumispisteen todellinen arvo (RPA) – todellinen tiedon menetys tapahtumien aikana – on ratkaisevan tärkeää. Jos RPA jatkuvasti epäonnistuu, on aika joko lisätä varmuuskopiointitiheyttä tai investoida parempaan infrastruktuuriin. Automatisoidut, tiheästi tehtävät varmuuskopiot ovat usein ainoa tapa täyttää tiukat RPO:t, koska manuaaliset menetelmät eivät yksinkertaisesti pysy perässä.
Jotta kustannuksia ja suojausta voidaan tasapainottaa, aseta tiukemmat RPO:t kriittisille järjestelmille, kuten asiakkaan todennukselle, ja lievemmät ei-kriittisille tiedoille, kuten sisäiselle varastolle. Tämä porrastettu lähestymistapa varmistaa, että suojaat tärkeimmät tiedot kuluttamatta liikaa resursseja.
3. Varmuuskopioiden onnistumisprosentti
Varmuuskopioinnin onnistumisprosentti heijastaa suoritettujen varmuuskopiointitöiden prosenttiosuutta verrattuna epäonnistuneisiin tai ohitettuihin varmuuskopiointitöiden prosenttiosuuteen. Ajattele sitä varmuuskopiointijärjestelmäsi suorituskykyraporttina. Korkea onnistumisprosentti osoittaa, että tietosuojasuunnitelmasi on aikataulussa, kun taas tämän mittarin lasku voi häiritä liiketoimintaa, erityisesti kriittisinä hetkinä.
Vahvan varmuuskopioinnin onnistumisprosentin ylläpitäminen on ratkaisevan tärkeää – ethän voi palauttaa tietoja, joita ei ole koskaan varmuuskopioitu. Usean pilven järjestelmissä tämän mittarin seuraaminen voi olla hankalaa, koska tiedot on yhdistettävä eri palveluntarjoajilta. Esimerkiksi AWS Backup päivittää CloudWatchin työmäärillä viiden minuutin välein, kun taas Google Cloud päivittää varmuuskopiointimittarinsa tunneittain. Näiden päivitysten yhdistäminen antaa selkeämmän kuvan varmuuskopioinnin kokonaissuorituskyvystä.
Useat tekijät voivat johtaa varmuuskopiointien epäonnistumisiin. Näitä ovat aikatauluristiriidat ylläpitojaksojen (kuten Amazon FSx:n tai tietokantapalveluiden) kanssa, tallennustilan loppuminen tai verkko-ongelmat, jotka aiheuttavat keskeytyneitä siirtoja varmuuskopioiden välillä pilvipalveluntarjoajat. Pysyäksesi näiden ongelmien edellä, aseta automaattiset hälytykset, kun virheitä esiintyy yli viisi työtä tunnin sisällä. Trendiraporttien suorittaminen 30 päivän tai pidemmän ajan aikana voi auttaa paljastamaan toistuvia ongelmia kertaluonteisten ongelmien sijaan.
Jos virheet jatkuvat, harkitse lähestymistavan muuttamista. Vaihtaminen inkrementaalisiin ja pysyviin varmuuskopioihin tai jatkuvaan tietojen suojaukseen (CDP) voi vähentää siirrettävän tiedon määrää ja helpottaa järjestelmän kuormitusta. Huomaa, että AWS merkitsee työt "VANHENTUNEIKSI", jos ne eivät ala aikataulun mukaisesti, mikä vaikuttaa onnistumisprosenttiisi, vaikka teknistä virhettä ei tapahtuisi. Varmuuskopiointiaikataulujen säännöllinen tarkistaminen ja muuttaminen voi auttaa estämään resurssiristiriitoja ruuhka-aikoina. Näiden prosessien hienosäätö varmistaa, että varmuuskopiointisi pysyvät luotettavina samalla, kun pidät silmällä muita tärkeitä mittareita.
4. Tiedonsiirtonopeudet
Tiedonsiirtonopeudet määräävät, kuinka nopeasti varmuuskopiotiedot siirtyvät pisteestä toiseen, mikä vaikuttaa suoraan varmuuskopiointien valmistumisaikaan. Vaikka kaistanleveys viittaa verkkoyhteytesi kokonaiskapasiteettiin, läpijuoksu mittaa todellista nopeutta, jolla dataa ladataan tai ladataan. Kuten Kari Rivas, Backblazen vanhempi tuotemarkkinointipäällikkö, asian ilmaisee:
""Läpäisykyky on usein tärkeämpi mittari varmuuskopiointi- ja arkistointiasiakkaille, koska se osoittaa loppukäyttäjän kokemat lähetys- ja latausnopeudet.""
Kun läpivirtausnopeus laskee, se voi häiritä varmuuskopiointiaikatauluja ja heikentää järjestelmän suorituskykyä. Hitaat siirtonopeudet tarkoittavat, että varmuuskopiointi kestää kauemmin, mikä voi ulottua tuotantoaikoihin. Siksi käsite "... varmuuskopioikkuna tulee ratkaisevaksi – tietty aikaväli, joka on varattu varmuuskopioille, jotta ne voivat toimia häiritsemättä päivittäistä toimintaa. Jos läpimenoaikasi ei pysty käsittelemään datakuormaa tämän aikavälin sisällä, olet pulassa. Network Worldin avustaja W. Curtis Preston korostaa riskejä:
""Jokainen tallennusjärjestelmä pystyy hyväksymään tietyn määrän varmuuskopioita päivässä… Tämän valvomatta jättäminen voi johtaa siihen, että varmuuskopiointi kestää yhä kauemmin ja venyy työpäivän pidemmälle.""
Siirtonopeuksien seuraaminen on olennaista tunnistaakseen verkon pullonkaulat ennen kuin ne johtavat suurempiin ongelmiin. Jatkuvasti alhaiset nopeudet voivat viitata verkon ruuhkautumiseen, laitteistorajoituksiin tai jopa palveluntarjoajasi rajoittamiseen. Tarkkaile kasvavia jonoja – nämä ovat merkkejä siitä, että järjestelmäsi ei pysy tiedonkulun vauhdissa.
Siirtonopeuksien parantaminen vaatii usein asetusten hienosäätöä. Monisäikeisyys on yksi tapa parantaa suorituskykyä lähettämällä useita tietovirtoja samanaikaisesti, mikä hyödyntää käytettävissä olevaa kaistanleveyttä paremmin. Lohkojen tai osien koon säätäminen voi myös auttaa; suuremmat osat vähentävät toistuvien API-kutsujen aiheuttamaa ylimääräistä kuormitusta, vaikka ne vaativatkin enemmän muistia. Organisaatioille, joilla on tiukat varmuuskopiointi-ikkunat, siirtyminen inkrementaalisiin ikuisiin varmuuskopioihin tai jatkuvaan tietojen suojaukseen (CDP) voi olla mullistava ratkaisu. Nämä menetelmät minimoivat siirrettävän tiedon määrän ja vähentävät verkon kuormitusta.
5. Tallennustilan käyttöaste
Tallennustilan käyttöasteella on merkittävä rooli varmuuskopioinnin tehokkuudessa, aivan kuten siirtonopeuksillakin. Eri pilvipalveluntarjoajien käyttämän tallennustilan määrän seuraaminen voi auttaa hallitsemaan kustannuksia ja välttämään ylikuormitusta. Varmuuskopiointitilan säännöllinen seuranta antaa sinulle mahdollisuuden havaita trendejä ja säätää kapasiteettia ennen kuin se saavuttaa rajansa. Esimerkiksi Google Cloudin varmuuskopioinnin käyttöasteraportit käyttävät lineaarista regressiota historiallisten tietojen perusteella ennustaakseen tulevia tallennustarpeita, jolloin järjestelmänvalvojat saavat ennakkotiedon siitä, milloin skaalata tallennustilaa lisää. Lisäksi deduplikaation ja oikea-aikaisen poiston vaikutusten arviointi tallennustehokkuuteen voi vaikuttaa merkittävästi sekä suorituskykyyn että kustannuksiin.
Hyvä tapa arvioida deduplikaation ja pakkauksen tehokkuutta on vertailla Virtuaalinen koko että Tallennetut tavut. Jos nämä luvut ovat lähes identtiset, se voi viitata siihen, että deduplikaatio ei toimi niin tehokkaasti kuin sen pitäisi. Työkalut, kuten AWS Backup, tarjoavat päivitetyt tallennustilatiedot CloudWatchiin viiden minuutin välein, kun taas Google Cloud päivittää varmuuskopioholvin tallennustiedot tunneittain, mikä varmistaa, että saat usein päivityksiä tallennustilasi tilasta.
Vanhentuneiden palautuspisteiden poistamatta jättäminen voi johtaa tarpeettomiin maksuihin. Kuten tunnettu varmuuskopiointi- ja palautusasiantuntija W. Curtis Preston selittää:
""Ainoa tapa luoda lisää kapasiteettia ostamatta lisää on poistaa vanhat varmuuskopiot. Olisi sääli, jos tallennusjärjestelmän kapasiteetin valvonnan laiminlyönti johtaisi kyvyttömyyteen täyttää yrityksen asettamia säilytysvaatimuksia.""
Tallennustilan kasvun seuranta sekä sovellus- että isäntätasolla voi korostaa, mitkä resurssit ajavat kustannuksia. Saatat esimerkiksi huomata, että yksi tietokanta monopolisoi varmuuskopiointitilaa, kun taas muut sovellukset tuskin tekevät voittoa. Tämä yksityiskohtainen näkemys auttaa sinua keskittämään optimointitoimet sinne, missä niillä on eniten merkitystä. Kynnysarvohälytysten asettaminen – tyypillisesti noin 80%-kapasiteettiin – voi myös antaa sinulle riittävästi aikaa toimia ennen kriittisten tasojen saavuttamista.
Lopuksi, palveluntarjoajakohtaisten laskutusmittareiden ymmärtäminen on ratkaisevan tärkeää yllätysten välttämiseksi. Esimerkiksi AWS Neptunuksen Kokonaisvarmuuskopiointitila, laskutettu Mittari sisältää sekä jatkuvan että tilannevedostallennuksen, ja siinä on päivittäinen ilmainen kiintiö, kun taas Google Cloud antaa sinun suodattaa mittareita resurssityypin mukaan. Näiden tietojen tunteminen varmistaa, että käytät oikeita tallennustasoja ja pysyt kustannustesi hallinnassa.
6. Tietojen eheystarkastukset
Tietojen eheystarkistukset ovat olennaisia sen varmistamiseksi, että varmuuskopioidut tiedot pysyvät oikeellisina ja virheettöminä koko niiden elinkaaren ajan. Nämä tarkastukset perustuvat tekniikoihin, kuten tarkistussummat ja tiivisteen validointi varmistaakseen, että tiedostot pysyvät ehjinä siirron, tallennuksen ja haun aikana, jopa työskenneltäessä useiden pilvipalveluntarjoajien kanssa.
Rakentamalla varmuuskopioinnin ydinmittareihin, eheystarkistukset auttavat varmistamaan, että tietosi pysyvät turvassa, vaikka niitä siirrettäisiin eri pilviympäristöjen välillä. Esimerkiksi tiedonsiirrossa palveluntarjoajan ja kylmän tallennustilan välillä voi esiintyä vioittumista, jota tavalliset varmuuskopiolokit eivät välttämättä huomaa. Osittaiset palautuspisteet – varmuuskopiot, jotka on aloitettu, mutta joita ei ole koskaan täysin suoritettu – aiheuttavat toisen riskin, koska ne voivat jättää tiedostoja puutteellisiksi tai vioittuneiksi palautuksen aikana.
Nykyaikaiset pilvialustat tarjoavat työkaluja, jotka auttavat valvomaan datan eheyttä lähes reaaliajassa. Esimerkiksi, AWS-varmuuskopiointi päivittää CloudWatchin mittareita viiden minuutin välein, jolloin voit tunnistaa ja korjata mahdolliset ongelmat nopeasti. Jotkin alustat jopa erottavat tilat, kuten "Valmis" ja "Valmis, ongelmia ilmennyt", mikä osoittaa, milloin tarvitaan tarkempaa tarkastelua. Toisaalta, Oracle Cloud Infrastructure -objektien tallennustila käyttää ennakoivaa lähestymistapaa korjaamalla vioittuneet tiedot automaattisesti redundanssin avulla. Eheyden valvonnan todellisen validoinnin varmistamiseksi on ratkaisevan tärkeää suorittaa varsinaisia palautustestejä.
Myös aikataulutetut palautustestit auttavat mittaamaan Palautumisajan todellisuus (RTR) ja Palautumispisteen todellisuus (RPR) – keskeiset indikaattorit siitä, kuinka hyvin varmuuskopiointijärjestelmäsi toimii verrattuna palautustavoitteisiisi. Nämä testit antavat tietoa varmuuskopiointistrategiasi todellisesta tehokkuudesta.
Lisäsuojaa varten käyttöönotto muuttumaton säilytystila käyttämällä Write-Once-Read-Many (WORM) -tekniikoita, kuten Amazon S3 -objektilukko, voi estää tietojen muuttamisen niiden kirjoittamisen jälkeen. Tämä on erityisen arvokasta suojautumisessa kiristyshaittaohjelmia vastaan. On kuitenkin tärkeää tarkistaa tiedot haittaohjelmien tai vioittumisen varalta ennen niiden lukitsemista, jotta virheet eivät säily pysyvästi. Seuranta Datan laatupisteet, joka yhdistää mittareita, kuten johdonmukaisuuden, täydellisyyden ja tarkkuuden, voi myös tarjota selkeän tilannekuvan varmuuskopiotietojesi yleisestä kunnosta kaikissa pilviympäristöissä.
sbb-itb-59e1987
7. Tapahtuman vasteaika
Tapahtuman vasteaika seuraa vian havaitsemisen ja sen korjaamisen välistä aikaa. Se on jaettu kahteen keskeiseen osamittariin: Keskimääräinen kuittausaika (MTTA), joka mittaa, kuinka nopeasti tiimisi reagoi hälytyksiin, ja Keskimääräinen toipumisaika (MTTR), joka mittaa, kuinka kauan normaalin toiminnan palauttaminen kestää. Nämä mittarit toimivat käsi kädessä muiden aiemmin käsiteltyjen suorituskykyindikaattoreiden kanssa.
""Kun alkuperäinen varmuuskopiointityö epäonnistuu, on erittäin todennäköistä, että myös muut sitä seuraavat tehtävät epäonnistuvat. Tällaisessa tilanteessa tapahtumien kulkua voi parhaiten ymmärtää seurannan ja ilmoitusten avulla." – AWS:n ohjeistus
Selkeiden reagointikriteerien määrittely tapahtuman vakavuuden perusteella on olennaista. Organisaatiot usein yhdenmukaistavat palvelutasotavoitteensa (SLO) prioriteettitasojen kanssa varmistaakseen tapahtumien tehokkaan käsittelyn:
- P1 (kriittinen)Kuittaa 5 minuutin kuluessa, palauta 4 tunnin kuluessa
- P2 (korkea)Kuittaus 15 minuutin kuluessa, palautus 12 tunnin kuluessa
- P3 (Keskitaso)Kuittaus tunnin sisällä, palautus 24 tunnin kuluessa
Vahvat hälytysjärjestelmät ovat tehokkaan häiriötilanteisiin reagoinnin selkäranka. Yhdistämällä varmuuskopioiden valvonnan työkaluihin, kuten Amazon CloudWatch tai Google Cloud Monitoring, voit määrittää reaaliaikaisia ilmoituksia palveluiden, kuten Amazon SNS:n, kautta. Voit esimerkiksi määrittää hälytykset laukaisemaan korkean prioriteetin tukipyynnön, jos yli viisi varmuuskopiointityötä epäonnistuu tunnin sisällä.
""Kun MTTA on alhainen, se tarkoittaa, että hälytyksesi tavoittavat oikeat ihmiset nopeasti. Kun se on korkea, se viittaa usein hälytysväsymykselle, ilmoitusten ylitarjontaan tai epäselviin vastuisiin." – Wiz
Automaatiolla on ratkaiseva rooli näiden tavoitteiden saavuttamisessa. Työkalut, kuten Amazon EventBridge, voivat automatisoida eskalointiprosesseja varmistaen nopean tikettien luomisen ja johdonmukaisen MTTA-seurannan. Tarkkuuden ylläpitämiseksi on tärkeää määritellä selkeästi, mitä "kuitattu" tarkoittaa monipilviympäristössäsi, ja varmistaa, että kaikki ovat samalla sivulla toimintakelpoisten mittareiden osalta.
8. Suojattujen resurssien määrä
Suojattujen resurssien määrä (Protected Resources Count) mittaa varmuuskopiointipalvelusi suojaamien virtuaalikoneiden, tietokantojen, tiedostojärjestelmien ja muiden infrastruktuurikomponenttien määrää. Se on keskeinen mittari arvioitaessa, kuinka hyvin varmuuskopiointijärjestelmäsi kattaa monipilviympäristösi. Tarkat määrät ovat ratkaisevan tärkeitä asianmukaisen tiedonhallinnan varmistamiseksi, erityisesti nyt, kun monipilviympäristöjen käyttöönotto on ylittänyt 90%-tason sekä yksityisellä että julkisella sektorilla. Näiden suojattujen resurssien seuranta on nyt vaatimustenmukaisuuden ja hallinnan kulmakivi pilviympäristöissä.
Tämän mittarin todellinen arvo käy selväksi, kun vertaat sitä koko infrastruktuuri-inventaarioosi. Monet pilvialustat tarjoavat työkaluja suojattujen resurssien laskemiseen, joiden avulla voit tunnistaa mahdolliset kattavuusaukot. Vertailemalla tätä lukua koko inventaarioosi voit nopeasti paikantaa resurssit, jotka saattavat jäädä suojaamattomiksi.
Pysyäkseen edelläkävijänä automatisoidut etsintätyökalut ovat välttämättömiä. Dynaamisissa pilviympäristöissä uusia resursseja lisätään jatkuvasti, ja ilman automatisoituja skannauksia jotkin resurssit – joita usein kutsutaan "varjoresursseiksi" – voivat ohittaa varmuuskopiointikäytännöt. Esimerkiksi Azuren "Suojattavat resurssit" -blade korostaa resursseja, joita ei ole vielä varmuuskopioitu, mikä helpottaa näiden puutteiden välitöntä korjaamista.
Hälytysten asettaminen voi parantaa valvontaa entisestään. Voit esimerkiksi määrittää CloudWatchin tai Google Cloud Monitoringin lähettämään ilmoituksia, jos suojattujen resurssien prosenttiosuus laskee alle tietyn kynnysarvon, kuten 95%:n kokonaisvarastostasi. Tämä ennakoiva lähestymistapa auttaa sinua havaitsemaan mahdolliset haavoittuvuudet ennen kuin ne johtavat tietojen menetykseen. Lisäksi resurssien merkitseminen tunnisteilla, kuten "BackupTier: Gold" tai "BackupTier: Silver", voi tehostaa käytäntöjen valvontaa ja yksinkertaistaa seurantaa eri tiimien tai osastojen välillä.
Keskitetyt kojelaudat ovat toinen tärkeä työkalu näkyvyyden ylläpitämiseen monipilviympäristöissä. Esimerkiksi AWS Backup päivittää CloudWatchin mittareita viiden minuutin välein, kun taas Google Cloud tarjoaa tunneittain päivityksiä tallennustilan käytöstä. Käyttämällä alustoja, jotka normalisoivat tietomuotoja – kuten JSON- tai syslog-tiedostoja käsitteleviä alustoja – voit varmistaa yhdenmukaisen raportoinnin eri pilvipalveluntarjoajien välillä. Infrastruktuuri-APIen säännölliset tarkastukset varmistavat edelleen, että kaikki resurssit on katettu, mikä auttaa ylläpitämään vaatimustenmukaisuutta ja välttämään suojausaukkoja.
9. Varmuuskopioarkiston tallennustilan kulutus
Varmuuskopioholvin tallennustilan käytön seuraaminen on ratkaisevan tärkeää kustannusten hallinnan ja kapasiteetin tehokkaan suunnittelun kannalta. Yksi keskeisistä seurattavista mittareista on tallennetun datan määrä (mitattuna GiB- tai TB-yksiköissä). Tämä mittari näyttää, kuinka paljon tilaa on käytössä, mikä auttaa välttämään kapasiteettirajojen saavuttamisen tai odottamattomia laskutusongelmia.
Toinen tärkeä mittari on tallennusaltaan käyttöaste, joka näyttää varmuuskopiojärjestelmässäsi käytetyn tilan prosenttiosuuden käytettävissä olevaan tilaan verrattuna. Jos käyttö alkaa lähestyä ennalta määritettyjä kynnysarvoja, on aika joko laajentaa kapasiteettia tai poistaa vanhentuneet varmuuskopiot. Esimerkiksi AWS Backup päivittää nämä mittarit 5 minuutin välein CloudWatchin avulla, kun taas Google Cloud päivittää arvot tunneittain ja toistaa uusimmat tiedot 5 minuutin välein.
On myös tärkeää seurata vähimmäissäilytyspäivät varmistaakseen, että tietoja säilytetään vaaditun ajan. Lisäksi ensimmäisen ja viimeisen palautuksen aikaleiman seuraaminen voi auttaa varmuuskopioinnin elinkaaren validoinnissa ja määräysten noudattamisen varmistamisessa.
Yksi mahdollinen kustannustekijä on vanhentuneet palautuspisteet, joita ei poisteta. AWS Backup tarjoaa mittarin VanhentuneidenPisteidenLukumäärä, joka tunnistaa varmuuskopiot, jotka olisi pitänyt poistaa, mutta jotka vievät edelleen tilaa. Tämä voi johtaa korkeampiin tallennuskustannuksiin. Samoin Palautumispisteiden määrä kylmänä Mittari auttaa varmistamaan, että vanhempi data siirtyy edullisempiin arkistointitasoihin suunnitellusti. Vaikka arkistointi on halvempaa, on syytä huomata, että tämän datan hakukustannukset voivat olla korkeammat.
Pysyäksesi edellä, aseta kynnyshälytykset ennakoivaa hallintaa varten. Valvontajärjestelmäsi tulisi ilmoittaa sinulle, kun tallennustilan käyttöaste ylittää asetetut rajat tai kun vanhentuneiden palautuspisteiden määrä alkaa kasvaa. On myös hyödyllistä segmentoida kulutusmittarit resurssityypin mukaan – kuten Compute Engine -instanssit, SQL-tietokannat tai Oracle-järjestelmät. Tällä tavoin voit määrittää, mitkä työkuormat ajavat tallennustilan kasvua, ja mukauttaa säilytyskäytäntöjä vastaavasti.
Niille, jotka käyttävät Serverion‘n monipilvivarmuuskopiointiratkaisut (Serverion) näiden valvontastrategioiden integrointi voi parantaa sekä suorituskykyä että kustannustehokkuutta. Nämä käytännöt luovat pohjan yksityiskohtaisemmille operatiivisille mittareille seuraavissa osioissa.
10. Käyttölokit ja tarkastusketjut
Jokainen varmuuskopiointi-infrastruktuuriisi liittyvä toimenpide – olipa kyseessä sitten tietojen palauttaminen, käytännön muuttaminen tai jopa vain tietojen lukeminen – on kirjattava huolellisesti. Käyttölokit ja tarkastusketjut tarjoavat yksityiskohtaisen tiedon siitä, kuka on käyttänyt mitä, milloin ja mistä. Tämä läpinäkyvyyden taso on ratkaisevan tärkeää sekä tietoturvatutkimuksille että sääntelyvaatimusten täyttämiselle.
Tarkastuslokien tulisi tallentaa kaikki olennaiset tiedot jokaisesta tapahtumasta. Näitä ovat muun muassa kyseessä oleva käyttäjä tai IAM-rooli, suoritetun toiminnon tyyppi (esim. RestoreBackup, DeleteBackup, CreateBackupPlan), lähteen IP-osoite, vaikutusalueen resurssi, aikaleima ja toiminnon tulos. Pitkäkestoisille prosesseille Google Cloud Backup ja DR luovat kaksi erillistä lokimerkintää: toisen toiminnon alkaessa ja toisen sen päättyessä.
Pilvialustat jakavat lokit tyypillisesti kahteen luokkaan: Ylläpitäjän toimintalokit kokoonpanomuutoksia ja Tietojen käyttölokit arkaluonteisia tietoja sisältäviin toimintoihin. Ylläpitäjän toimintalokit ovat yleensä oletusarvoisesti käytössä, mutta datan käyttölokit vaativat usein manuaalisen aktivoinnin. Esimerkiksi Google Cloudissa datan käyttölokit ovat oletusarvoisesti poissa käytöstä (BigQueryä lukuun ottamatta) niiden koon vuoksi. Näiden lokien käyttöönotto on kuitenkin ratkaisevan tärkeää sen seuraamiseksi, kuka tarkastelee tai palauttaa arkaluonteisia tietoja, ja varmistaa siten tietosuojamääräysten noudattamisen.
Vahvista valvontaasi määrittämällä reaaliaikaisia hälytyksiä kriittisille toimille, kuten DeleteBackupille. Lisäksi reititä lokit keskitettyihin tallennusratkaisuihin säilytysvaatimusten täyttämiseksi, jotka voivat vaihdella 30 päivästä jopa 10 vuoteen vaatimustenmukaisuusstandardien mukaan. Keskitettyihin tallennusvaihtoehtoihin kuuluvat alustat, kuten Azure Log Analytics tai Cloud Storage.
Monipilviympäristöissä työkaluja, kuten Serverion voi yksinkertaistaa lokien hallintaa. Yhdistämällä AWS CloudTrailin, Azure-toimintalokien ja Google Cloud -tarkastuslokien lokit yhteen SIEM-järjestelmään voit saavuttaa yhtenäisen näkyvyyden koko varmuuskopiointi-infrastruktuuriisi. Tämä lähestymistapa ei ainoastaan virtaviivaista valvontaa, vaan myös parantaa kykyäsi ylläpitää vaatimustenmukaisuutta eri alustoilla.
Vertailutaulukko
10 tärkeintä usean pilven varmuuskopiointimittaria: kategoriat, mittaukset ja hälytyskynnykset
Jotta asioita olisi helpompi seurata, tässä taulukossa on järjestetty tärkeimmät varmuuskopiointimittarit kolmeen luokkaan: suorituskyky, tietoturva/terveys ja kapasiteetti. Tällaisten mittareiden ryhmittely auttaa paikantamaan mahdolliset ongelmat ja tarjoaa selkeän etenemissuunnitelman niiden ratkaisemiseksi. Alta löydät yhdeksän keskeistä mittaria, joilla kullakin on oma tarkoituksensa, mittaustapansa ja hälytyskynnyksensä, joka viestii, että jokin vaatii huomiota.
Suorituskykymittarit keskittyvät siihen, kuinka nopeasti varmuuskopiot ja palautukset tapahtuvat. Ne vastaavat kysymyksiin, kuten: Valmistuvatko varmuuskopiot ajoissa? Voidaanko tiedot palauttaa riittävän nopeasti kriisin aikana? Jos esimerkiksi palautumisaikatavoitteesi (RTO) on asetettu 4 tuntiin, mutta todellinen palautumisaikasi (RTR) saavuttaa säännöllisesti 6 tuntia, se on selvä merkki siitä, että järjestelmäsi saattaa tarvita remonttia.
Tietoturva- ja terveysmittarit Seuraa varmuuskopioidesi toimintaa ja varmista, että tietosi pysyvät ehjinä. Jos esimerkiksi varmuuskopiointien onnistumisprosentti laskee alle 99%:n tai epäonnistuneita töitä tapahtuu yli viisi tunnissa, on aika tutkia asiaa.
Kapasiteettimittarit auttaa välttämään tallennustilaan liittyviä häiriöitä seuraamalla käyttöä. Esimerkiksi hälytysten asettaminen, kun tallennustilan käyttöaste saavuttaa 80–90%, voi estää tilan loppumisesta aiheutuvia häiriöitä.
| Kategoria | Metrinen | Tarkoitus | Esimerkki mittauksesta | Suositeltu hälytyskynnys |
|---|---|---|---|---|
| Esitys | Palautumisajan tavoite (RTO) | Varmista, että toipumisnopeus vastaa liiketoiminnan tarpeita | Palautukseen kuluva minuutti tai tunti | RTR ylittää liiketoiminnan määrittelemän RTO:n |
| Esitys | Tiedonsiirtonopeudet (läpivirtaus) | Varmuuskopiointi- ja palautusnopeuksien mittaus | MB/s tai TB/tunti | Laitteiston vähimmäisnopeuden alapuolella |
| Esitys | Varmuuskopioikkunan käyttöaste | Varmista, että varmuuskopiot valmistuvat määräajassa | Kesto (HH:MM) | > Määritellyn ikkunan 100% |
| Turvallisuus/terveys | Varmuuskopion onnistumisprosentti | Seuraa tietosuojan luotettavuutta | %:n onnistumis-/epäonnistumismäärä | < 99% onnistuu tai > 5 epäonnistuu tunnissa |
| Turvallisuus/terveys | Tietojen eheystarkastukset | Varmista, että tiedot ovat vioittumattomia ja palautettavissa | Onnistuneiden testien määrä | < 1 onnistunut palautus 24 tunnissa |
| Turvallisuus/terveys | Terveydentilan tapahtumat | Pysyvien ja ohimenevien vikojen tunnistaminen | Terveet, epäterveet, rappeutuneet tilat | Mikä tahansa "jatkuva epäterveellinen" tila |
| kapasiteetti | Tallennustilan käyttöaste | Estä varastoinnin loppuminen | % käytettyjä / tallennettuja tavuja | > 80–90% kapasiteetti |
| kapasiteetti | Varmuuskopioarkiston tallennustilan kulutus | Seuraa pilvitallennustilan kustannuksia ja käyttöä | GB tai TB | Kokonaisdata ylittää budjettikynnyksen |
| kapasiteetti | Suojattujen resurssien määrä | Varmista, että kaikki kriittiset resurssit on suojattu | Suojattujen instanssien lukumäärä | Määrä < odotettu varasto |
Tämä taulukko korostaa nopean toiminnan tärkeyttä kynnysarvojen ylittyessä. Näiden mittareiden seuranta varmistaa, että varmuuskopiojärjestelmäsi pysyy luotettavana, turvallisena ja valmiina käsittelemään mitä tahansa eteen tuleekin.
Johtopäätös
Oikeiden mittareiden seuraaminen voi siirtää usean pilven varmuuskopiointitoimintojesi toiminnan pelkästä ongelmiin reagoimisesta niiden ennakoivaan ehkäisyyn. Seuraamalla työllistymisasteet, tallennustilan käyttöaste, ja palautumiskyky, luot turvaverkon, joka vähentää tietojen menetyksen ja käyttökatkosten riskiä.
Käsittelemämme mittarit keskittyvät kolmeen keskeiseen alueeseen: tietosuoja, turvallisuus, ja kustannusten hallinta. Kynnysarvohälytysten asettaminen ja todellisten palautumisaikojen säännöllinen vertaaminen RTO- (palautumisaika-tavoite) ja RPO- (palautumispiste-tavoite) tavoitteisiin voi auttaa sinua havaitsemaan mahdolliset ongelmat ennen kuin niistä tulee kriittisiä. Kuten Cody Slingerland, FinOps-sertifioitu ammatinharjoittaja, osuvasti sanoo:
""Et voi korjata sitä, mitä et mittaa.""
Tämä näkemys korostaa perusteellisen valvonnan merkitystä liiketoiminnan jatkuvuuden varmistamiseksi.
Näiden mittareiden avulla voit tehdä älykkäämpiä päätöksiä resurssien kohdentamisesta, välttää hätäpoistoja ja varmistaa, että varmuuskopiot valmistuvat ajoissa. Kun organisaatiot dokumentoivat ja jakavat nämä mittarit johdon kanssa, heidän on usein helpompi perustella infrastruktuuripäivityksiä ja osoittaa varmuuskopiojärjestelmiensä arvo.
Ryhdy käytännön toimiin, kuten aseta automaattisia hälytyksiä yli viiden tehtävän tunnissa tapahtuville virheille, testaa palautuksia säännöllisesti RTO:n ja RPO:n validoimiseksi ja käytä moniulotteisia suodattimia tunnistaaksesi alustoja tai resursseja, jotka vaativat huomiota. Nämä toimenpiteet muuttavat raakadatan merkityksellisiksi parannuksiksi ja vahvistavat varmuuskopiointi-infrastruktuuriasi.
Näiden valvontakäytäntöjen käyttöönotto antaa sinulle selkeyttä ja varmuutta hallita monipilvivarmuuskopioita tehokkaasti. Näin vähennät riskejä, hallitset kustannuksia ja saat varmuuden siitä, että tietosi ovat turvassa.
UKK
Mitä keskeisiä mittareita on seurattava onnistuneiden monipilvivarmuuskopiointitoimintojen kannalta?
Oikeiden mittareiden seuranta on avainasemassa, jotta usean pilven varmuuskopiointitoiminnot toimivat sujuvasti ja luotettavasti. Kiinnitä erityistä huomiota Palautumisajan tavoitteet (RTO) ja Palautuspisteen tavoitteet (RPO) – nämä mittarit osoittavat, kuinka nopeasti ja tehokkaasti voit palauttaa tietosi tarvittaessa. Toinen tärkeä tekijä on tilanteen seuraaminen tiedonsiirtonopeudet ja latenssi varmistaaksesi, että varmuuskopiot tapahtuvat ajallaan ja keskeytyksettä pilviympäristöissäsi.
On myös tärkeää seurata tallennustilan käyttöaste, mukaan lukien kokonaiskapasiteetti ja käytettävissä oleva tila, jotta saat resursseistasi kaiken irti. Pidä silmällä varmuuskopiointitöiden onnistumisprosentit ja käsiteltyjen tietojen kokonaismäärä voi auttaa sinua havaitsemaan mahdolliset ongelmat varhaisessa vaiheessa, ennen kuin ne eskaloituvat. Seuraamalla näitä mittareita jatkuvasti voit ylläpitää luotettavaa ja tehokasta varmuuskopiointistrategiaa.
Miten yritykset voivat tasapainottaa kustannukset ja suojauksen asettaessaan RTO- ja RPO-tavoitteita?
Jotta löydät oikean tasapainon kustannusten ja suojauksen välillä asetuksissasi Palautumisajan tavoite (RTO) ja Recovery Point Objective (RPO), Ensimmäinen vaihe on perusteellinen liiketoimintavaikutusten analyysi. Tämä auttaa sinua selvittämään, mitkä sovellukset ovat ehdottoman kriittisiä ja vaativat lyhimmän palautumisajan (RTO) ja palautumisajan (RPO), ja mitkä kestävät pidempiä palautusaikoja ja jonkin verran tietojen menetystä. Esimerkiksi kriittiset työkuormat tulisi varmuuskopioida usein, kun taas vähemmän tärkeät tiedot voidaan tallentaa käyttämällä edullisempia vaihtoehtoja, joissa on pidemmät varmuuskopiointivälit.
Järjestämällä varmuuskopiot tasoihin – tiheyden ja tallennustyypin perusteella – voit välttää tarpeettomat kustannukset, jotka aiheutuvat tehokkaan tallennustilan käyttämisestä kaikille tiedoillesi. Säännölliset palautustestit ovat välttämättömiä sen varmistamiseksi, että RTO- ja RPO-tavoitteesi ovat saavutettavissa nykyisellä kokoonpanollasi. Jos ne eivät ole, sinun on ehkä tutkittava vaihtoehtoja, kuten inkrementaalisia varmuuskopioita, deduplikaatiota tai tehokkaita pilvinatiiveja työkaluja kustannusten hallitsemiseksi vaarantamatta suojausta.
Serverion yksinkertaistaa tätä prosessia monipilvivarmuuskopiointiratkaisuillaan. Tarvitsetpa sitten tehokasta SSD-tallennustilaa kriittisille tiedoille tai budjettiystävällistä objektitallennusta arkistointia varten, niiden joustavat vaihtoehdot antavat sinun saavuttaa RTO- ja RPO-tavoitteesi pysyen budjetissa – kaikki tämä tinkimättä luotettavuudesta liiketoiminnan jatkuvuuden kannalta.
Miten voin parantaa tiedonsiirtonopeuksia monipilvivarmuuskopioissa?
Voit tehostaa tiedonsiirtonopeutta monipilvivarmuuskopioissa keskittymällä muutamaan keskeiseen tekniikkaan. Aloita hyödyntämällä rinnakkaiskäsittely samalla kun verkossa lähetettävän datan määrä vähenee. Useiden varakanavien määrittäminen ja keskitason pakkauksen käyttöönotto voivat hyödyntää kaistanleveyttäsi parhaalla mahdollisella tavalla kuormittamatta liikaa prosessoriasi. Toinen vinkki? Jaa suuret tiedostot pienempiin osiin – noin 1 Gt:n kokoisiin – ja määritä nämä osat erillisille kanaville. Tämä mahdollistaa useiden tietovirtojen samanaikaisen toiminnan, mikä parantaa merkittävästi läpimenoaikaa.
Pariliitos viikoittaiset täydelliset varmuuskopiot kanssa päivittäiset lisävarmuuskopiot on toinen älykäs lähestymistapa. Lähettämällä vain muuttuneet datalohkot voit säästää kaistanleveyttä ja nopeuttaa tavallisia varmuuskopiointitehtäviä. Pidä silmällä siirtomittareita ja harkitse varmuuskopioiden ajoittamista ruuhka-aikojen ulkopuolelle verkon ruuhkautumisen välttämiseksi. Haluatko viedä asian pidemmälle? Reunavälimuistin tai nopean tallennuksen käyttäminen lähellä pilvipalvelun aloituspistettä voi vähentää viivettä, mikä tekee siirroistasi entistä saumattomampia.
Serverionin monipilvipalvelinalusta tukee näitä menetelmiä vankan infrastruktuurinsa ja maailmanlaajuisesti hajautettujen datakeskustensa avulla, mikä auttaa sinua saavuttamaan nopeampia ja tehokkaampia varmuuskopioita.