Lépjen kapcsolatba velünk

info@serverion.com

Hívjon minket

+1 (302) 380 3902

A többfelhős biztonsági mentések monitorozásának legfontosabb mutatói

A többfelhős biztonsági mentések monitorozásának legfontosabb mutatói

Megbízható biztonsági mentéseket szeretne? Kezdje el nyomon követni a megfelelő mutatókat. A többfelhős biztonsági mentések monitorozása leegyszerűsíti az adatvédelmet azáltal, hogy mindent egy helyre konszolidál. Az igazi áttörést azonban az jelenti, ha azokra a kulcsfontosságú mutatókra összpontosítunk, amelyek biztosítják a biztonsági mentések megbízhatóságát, a gyors helyreállítást és a költségek kordában tartását.

Íme, mire kell figyelni:

  • Helyreállítási idő célkitűzés (RTO): Meddig maradhatnak leállás alatt a rendszerek, mielőtt az hatással lenne az üzleti tevékenységre?
  • Helyreállítási pont célja (RPO): Mekkora adatvesztés elfogadható?
  • Biztonsági mentés sikerességi aránya: A biztonsági mentések a tervek szerint befejeződnek?
  • Adatátviteli sebesség: Milyen gyorsan mozoghatnak az adatok a biztonsági mentések során?
  • Tárhelykihasználás: Közeledik a tárhelyed határához?
  • Adatintegritási ellenőrzések: Pontosak és sértetlenek a biztonsági mentési adataid?
  • Incidensre adott válaszidő: Milyen gyorsan lehet megoldani a hibákat?
  • Védett erőforrások száma: Minden kritikus rendszer lefedett?
  • Biztonsági mentési tárhely felhasználása: Hatékonyan kezeli a tárolási költségeket?
  • Hozzáférési naplók és auditnaplók: Ki és mikor férhetett hozzá a biztonsági mentéseidhez?

Ezen mutatók nyomon követése segít megelőzni az állásidőt, az adatvesztést és a túlköltekezést. Ezenkívül biztosítja, hogy a biztonsági mentési rendszer összhangban legyen az üzleti igényekkel és a megfelelőségi követelményekkel.

Kérdezzen szakértőt! Demo előadás: Veeam ONE hibrid felhőalapú biztonsági mentés-felügyeleti mesterkurzus | Webinárium

Veeam ONE

1. Helyreállítási idő célkitűzés (RTO)

A helyreállítási idő célkitűzése (RTO) azt határozza meg, hogy a rendszerek mennyi ideig állhatnak le egy meghibásodás után, mielőtt az károsan hatna az üzleti tevékenységére. Egyszerűen fogalmazva, ez a maximális állásidő, amelyet megengedhet magának, mielőtt mindennek újra teljesen működőképesnek kell lennie. Kari Rivas, a Backblaze vezető termékmarketing-menedzsere így fogalmaz:

"A helyreállítás azt jelenti, hogy a rendszerek újra működnek – teljes mértékben funkcionálisan –, a felhasználók (alkalmazottak, ügyfelek stb.) pedig ugyanúgy használhatják őket, mint az adatvédelmi incidens előtt."

A megfelelő RTO (reteszelés) kulcsfontosságú, mivel ez közvetlenül összekapcsolja a műszaki helyreállítási terveket az üzleti prioritásokkal.

A leállás költsége gyakran meghatározza az RTO-célokat. Például a pénzügyi kereskedő cégek jellemzően a nullához közeli RTO-t célozzák meg, mivel akár néhány perc offline állapot is milliókba kerülhet. Másrészt a kevésbé kritikus rendszerek, mint például a belső archívumok, napokig is elviselik a leállást jelentős következmények nélkül.

Többszintű megközelítést alkalmazzon az RTO-khoz: Rendeljen szigorú RTO-kat a kritikus alkalmazásokhoz, és biztosítson nagyobb rugalmasságot a kevésbé létfontosságú rendszerek számára. Ez a stratégia kezelhetővé teszi a helyreállítási költségeket, miközben biztosítja a legfontosabb műveletek védelmét. Működjön együtt az osztályvezetőkkel az egyes rendszerek leállásának pénzügyi hatásának becslésében – ez az RTO-t üzleti szempontból vezérelt mérőszámmá teszi, nem pedig pusztán technikaivá.

Rendszeresen tesztelje a "helyreállítási idő valóságát" (RTR) gyakorlatok vagy valós események során. Ha az RTR folyamatosan elmarad a várakozásoktól, az annak a jele, hogy a biztonsági mentési rendszerét frissíteni kell. Például a szalagos mentések köztudottan lassúak, mivel fizikai visszakeresést és betöltést igényelnek. Ezzel szemben a felhőalapú tárolás azonnali hozzáférést kínál, ami drámaian felgyorsíthatja a helyreállítási időt. A tűzriadó- és asztali gyakorlatok nagyszerű eszközök annak biztosítására, hogy az RTO-céljai realisztikusak és elérhetőek legyenek.

2. Helyreállítási pont célkitűzése (RPO)

Míg az RTO az elfogadható állásidőre összpontosít, az RPO arra összpontosít, hogy mekkora adatvesztés tolerálható. Lényegében az RPO az utolsó biztonsági mentésből helyreállítható adatok korát méri. Például, ha az RPO egy óra, akkor tudomásul veszi, hogy akár 60 percnyi adat is elveszhet egy incidens során. Ez a mutató kritikus fontosságú a többfelhős rendszerekben, ahol a pontos nyomon követés elengedhetetlen a helyreállítási erőfeszítések üzleti prioritásokkal való összehangolásához.

Az RPO közvetlenül befolyásolja a biztonsági mentések gyakoriságát. Az egyórás RPO azt jelenti, hogy a biztonsági mentéseknek legalább óránként kell futniuk. A kritikus rendszerek – például fizetési átjárók vagy betegadatok – esetében az RPO-knak a lehető legközelebb kell lenniük a nullához. Másrészt a kevésbé fontos adatok, mint például a marketinganalitika vagy az archivált megrendelések, 13-24 órás RPO-kat is képesek kezelni anélkül, hogy jelentős fennakadásokat okoznának.

Íme egy meglepő statisztika: több mint 72% vállalat nem éri el a helyreállítási céljait[1]. Ez gyakran azért történik, mert az RPO-val kapcsolatos döntéseket pusztán technikai, nem pedig stratégiai üzleti döntéseknek tekintik. Kari Rivas, a Backblaze vezető termékmarketing-menedzsere ezt emeli ki:

"A megfelelni kívánt szabványról szóló döntés közös felelősség. És ezek a szabványok… azok a célok, amelyeket az informatikai és infrastruktúra-szolgáltatók csapatainak meg kell felelniük."

Ha kiszámolja, hogy mennyibe kerül egy perc állásidő a vállalkozásának, az segíthet a reális RPO-célok kitűzésében.

Többfelhős környezetekben, ahol a teljesítmény szolgáltatónként és régiónként eltérő lehet, fontos a folyamatos nyomon követés. Tényleges helyreállítási pont (RPA) – az incidensek során bekövetkező tényleges adatvesztés – kulcsfontosságú. Ha az RPA folyamatosan elmarad a várakozásoktól, itt az ideje növelni a biztonsági mentések gyakoriságát, vagy jobb infrastruktúrába befektetni. Az automatizált, nagy gyakoriságú biztonsági mentések gyakran az egyetlen módja a szigorú RPO-k betartásának, mivel a manuális módszerek egyszerűen nem tudják tartani a lépést.

A költségek és a védelem közötti egyensúly megteremtése érdekében szigorúbb RPO-kat kell rendelni a kritikus rendszerekhez, például az ügyfél-hitelesítéshez, és enyhébbeket a nem kritikus adatokhoz, például a belső leltárhoz. Ez a többszintű megközelítés biztosítja, hogy a legfontosabb adatokat védje anélkül, hogy felesleges erőforrásokat pazarolna.

3. Biztonsági mentések sikerességi aránya

A biztonsági mentések sikerességi aránya a befejezett biztonsági mentési feladatok százalékos arányát tükrözi a sikertelen vagy kihagyott feladatokhoz képest. Tekintsen rá úgy, mint a biztonsági mentési rendszer teljesítményjelentésére. A magas sikerességi arány azt jelzi, hogy az adatvédelmi terve a tervek szerint halad, míg ennek a mutatónak a csökkenése megzavarhatja az üzleti működést, különösen a kritikus pillanatokban.

A magas biztonsági mentési sikerarány fenntartása kulcsfontosságú – elvégre nem lehet visszaállítani azokat az adatokat, amelyekről soha nem készült biztonsági mentés. Többfelhős rendszerekben ennek a mutatónak a nyomon követése bonyolult lehet, mivel különböző szolgáltatóktól származó adatokat kell konszolidálni. Például az AWS Backup 5 percenként frissíti a CloudWatch-ot a feladatok számával, míg a Google Cloud óránként frissíti a biztonsági mentési mutatóit. Ezen frissítések kombinálása világosabb képet ad a biztonsági mentések teljes teljesítményéről.

Számos tényező vezethet biztonsági mentési hibákhoz. Ilyenek lehetnek az ütemezési ütközések a karbantartási időszakokkal (például az Amazon FSx vagy az adatbázis-szolgáltatások esetében), a tárhely elfogyása, vagy a hálózati problémák, amelyek miatt megszakadtak az átvitelek a fájlok és a fájlok között. felhőszolgáltatók. A problémák megelőzése érdekében állítson be automatikus riasztásokat, amikor a hibák száma meghaladja az öt feladatot egy órán belül. A trendjelentések 30 napon vagy azon túl történő futtatása segíthet az ismétlődő problémák feltárásában az egyszeri problémák helyett.

Ha a hibák továbbra is fennállnak, érdemes lehet módosítani a megközelítést. Az örök növekményes biztonsági mentésekre vagy a folyamatos adatvédelemre (CDP) való átállás csökkentheti az átvitt adatok mennyiségét, így tehermentesítve a rendszert. Ne feledje, hogy az AWS "LEJÁRT"-ként jelöli meg a feladatokat, ha azok nem indulnak el az ütemezett időkereten belül, ami akkor is befolyásolja a sikerességi arányt, ha nem történik technikai hiba. A biztonsági mentési ütemtervek rendszeres felülvizsgálata és módosítása segíthet megelőzni az erőforrás-ütközéseket csúcsidőszakokban. Ezen folyamatok finomhangolása biztosítja, hogy a biztonsági mentések megbízhatóak maradjanak, miközben más kritikus mutatókat is figyelemmel kísér.

4. Adatátviteli sebességek

Az adatátviteli sebesség határozza meg, hogy milyen gyorsan mozognak a biztonsági mentési adatok egyik pontról a másikra, ami közvetlenül befolyásolja a biztonsági mentések elkészítésének idejét. sávszélesség a hálózati kapcsolat teljes kapacitására utal, áteresztőképesség az adatok feltöltésének vagy letöltésének tényleges sebességét méri. Ahogy Kari Rivas, a Backblaze vezető termékmarketing-menedzsere fogalmaz:

"Az átviteli sebesség gyakran az a mérőszám, amely fontosabb a biztonsági mentést és archiválást végző ügyfelek számára, mivel ez jelzi a végfelhasználó által tapasztalt feltöltési és letöltési sebességet."

Amikor az átviteli sebesség alacsony, az megzavarhatja a biztonsági mentések ütemezését és ronthatja a rendszer teljesítményét. Az alacsony átviteli sebesség azt jelenti, hogy a biztonsági mentések hosszabb időt vesznek igénybe, ami potenciálisan átterjedhet az éles órákra. Itt jön képbe a „…” koncepciója. biztonsági mentési ablak kulcsfontosságúvá válik – egy adott időkeret, amelyet a biztonsági mentések futtatására tartanak fenn a napi működés zavarása nélkül. Ha az átviteli sebesség nem tudja kezelni az adatterhelést ebben az időkeretben, akkor bajban van. W. Curtis Preston, a Network World munkatársa kiemeli a kockázatokat:

"Minden tárolórendszer képes egy bizonyos mennyiségű biztonsági mentést fogadni naponta… [Ennek figyelésének elmulasztása] azt eredményezheti, hogy a biztonsági mentések egyre tovább tartanak, és átnyúlnak a munkanapra."

Az átviteli sebességek nyomon követése elengedhetetlen az azonosításhoz hálózati szűk keresztmetszetek mielőtt nagyobb problémákhoz vezetnének. A tartósan alacsony sebesség hálózati torlódásra, hardverkorlátozásokra vagy akár a szolgáltatód általi korlátozásra is utalhat. Figyelj a növekvő sorokra – ezek annak a jelei, hogy a rendszered nehezen tud lépést tartani az adatáramlással.

Az átviteli sebesség javítása gyakran a beállítások finomhangolását igényli. A többszálú feldolgozás az egyik módja a teljesítmény növelésének azáltal, hogy több adatfolyamot továbbít egyidejűleg, így jobban kihasználva a rendelkezésre álló sávszélességet. A blokk- vagy alkatrészméretek módosítása is segíthet; a nagyobb részek csökkentik a gyakori API-hívások okozta terhelést, bár több memóriát igényelnek. A szűk biztonsági mentési ablakokkal küzdő szervezetek számára az inkrementális-örök biztonsági mentésekre vagy a folyamatos adatvédelemre (CDP) való áttérés gyökeres változást hozhat. Ezek a módszerek minimalizálják az átvitt adatmennyiséget, csökkentve a hálózat terhelését.

5. Tárhelykihasználás

A tárhelykihasználtság az átviteli sebesség mellett fontos szerepet játszik a biztonsági mentések hatékonyságában. A felhőszolgáltatók közötti tárhelyhasználat nyomon követése segíthet a költségek szabályozásában és a túlzott kiépítés elkerülésében. A biztonsági mentési tárhely rendszeres figyelése lehetővé teszi a trendek észlelését és a kapacitás korrigálását, mielőtt elérné a korlátokat. Például a Google Cloud biztonsági mentési kihasználtsági jelentései lineáris regressziót használnak a korábbi adatok alapján a jövőbeli tárhelyigények előrejelzésére, így a rendszergazdák előre tudják jelezni, hogy mikor kell bővíteni a kapacitást. Ezenkívül a deduplikáció és az időben történő törlés hogyan befolyásolja a tárolási hatékonyságot, jelentősen befolyásolhatja mind a teljesítményt, mind a költségeket.

A deduplikáció és a tömörítés hatékonyságának értékelésére jó módszer a következők összehasonlítása: Virtuális méret nak nek Tárolt bájtok. Ha ezek a számok közel azonosak, az arra utalhat, hogy a deduplikáció nem működik olyan hatékonyan, mint kellene. Az olyan eszközök, mint az AWS Backup, ötpercenként frissített tárolási mutatókat biztosítanak a CloudWatch-ban, míg a Google Cloud óránként frissíti a biztonsági mentési trezor tárolási adatait, biztosítva, hogy gyakran kapjon frissítéseket a tárhely állapotáról.

A lejárt helyreállítási pontok eltávolításának elmulasztása szükségtelen költségekhez vezethet. Ahogy W. Curtis Preston, egy ismert biztonsági mentési és helyreállítási szakértő elmagyarázza:

"Az egyetlen módja annak, hogy további kapacitást hozzunk létre anélkül, hogy újat vásárolnánk, a régebbi biztonsági mentések törlése. Kár lenne, ha a tárolórendszer kapacitásának figyelésének elmulasztása azt eredményezné, hogy nem tudjuk teljesíteni a vállalat által meghatározott megőrzési követelményeket."

A tárhely növekedésének figyelése mind az alkalmazás, mind a gazdagép szintjén rávilágíthat arra, hogy mely erőforrások okozzák a költségeket. Előfordulhat például, hogy egyetlen adatbázis monopolizálja a biztonsági mentések tárhelyét, míg más alkalmazások alig érnek el jelentős eredményt. Ez a részletes betekintés segít abban, hogy az optimalizálási erőfeszítéseket oda összpontosítsa, ahol a legfontosabbak. A küszöbérték-riasztások beállítása – jellemzően 80% kapacitás körül – elegendő időt biztosíthat a cselekvésre, mielőtt elérné a kritikus szintet.

Végül, a szolgáltatóspecifikus számlázási mutatók megértése kulcsfontosságú a meglepetések elkerülése érdekében. Például az AWS Neptune Teljes biztonsági mentési tárhely számlázva A metrika magában foglalja a folyamatos és a pillanatkép-tárolást is, napi ingyenes kvótával, míg a Google Cloud lehetővé teszi a metrika erőforrástípus szerinti szűrését. Ezen részletek ismerete biztosítja, hogy a megfelelő tárolási szinteket használja, és kézben tartsa a költségeket.

6. Adatintegritási ellenőrzések

Az adatintegritási ellenőrzések elengedhetetlenek annak biztosításához, hogy a biztonsági mentésben lévő adatok pontosak és sértetlenek maradjanak az életciklusuk során. Ezek az ellenőrzések olyan technikákra támaszkodnak, mint a ellenőrzőösszegek és hash-érvényesítés annak megerősítésére, hogy a fájlok sértetlenek maradnak az átvitel, tárolás és visszakeresés során, még akkor is, ha több felhőszolgáltatón keresztül dolgozik.

Az alapvető biztonsági mentési metrikákra építve az integritásellenőrzések segítenek biztosítani, hogy az adatok biztonságban maradjanak, még akkor is, ha különböző felhőkörnyezetek között mozognak. Például a szolgáltatók közötti adatátvitel vagy a meleg tárolóról a hideg tárolóra való átállás során olyan adatsérülések léphetnek fel, amelyeket a szabványos biztonsági mentési naplók nem észlelnek. A részleges helyreállítási pontok – a megkezdett, de soha nem teljesen befejezett biztonsági mentések – további kockázatot jelentenek, mivel hiányos vagy sérült fájlokat hagyhatnak maguk után a helyreállítás során.

A modern felhőplatformok olyan eszközöket kínálnak, amelyek segítenek az adatok integritásának közel valós idejű monitorozásában. Például, AWS biztonsági mentés ötpercenként frissíti a CloudWatch mutatóit, lehetővé téve a potenciális problémák gyors azonosítását és kezelését. Egyes platformok különbséget tesznek az olyan állapotok között, mint a "Befejezett" és a "Problémákkal befejeződött", jelezve, ha alaposabb vizsgálatra van szükség. Másrészt, Oracle Cloud Infrastructure objektumtárolás proaktív megközelítést alkalmaz a sérült adatok automatikus javításával redundancia segítségével. Az integritásfigyelés valódi validálásához elengedhetetlen a tényleges visszaállítási tesztek végrehajtása.

Az ütemezett visszaállítási tesztek segítenek a mérésben is Felépülési idő valósága (RTR) és Helyreállítási Pont Valósága (RPR) – kulcsfontosságú mutatók, amelyek azt mutatják, hogy a biztonsági mentési rendszer mennyire jól teljesít a helyreállítási célokhoz képest. Ezek a tesztek betekintést nyújtanak a biztonsági mentési stratégia valós hatékonyságába.

A fokozott védelem érdekében a megvalósítás változtathatatlan tároló egyszer írható, sokszor olvasható (WORM) technológiák használatával, mint például Amazon S3 objektumzár, megakadályozhatja az adatok írás utáni módosítását. Ez különösen értékes a zsarolóvírus-támadások elleni védelemben. Fontos azonban az adatok ellenőrzése rosszindulatú programok vagy sérülések szempontjából, mielőtt zárolnánk őket, hogy elkerüljük a hibák végleges megőrzését. Adatminőségi mutató, amely olyan mutatókat összesít, mint a konzisztencia, a teljesség és a pontosság, egyértelmű pillanatképet nyújthat a biztonsági mentési adatok általános állapotáról az összes felhőalapú környezetben.

7. Incidensre adott válaszidő

Az incidensre adott válaszidő a hiba észlelése és megoldása között eltelt időt követi nyomon. Két fő almutatóra bontható: Átlagos visszaigazolási idő (MTTA), amely azt méri, hogy a csapatod milyen gyorsan reagál a riasztásokra, és Átlagos felépülési idő (MTTR), amely azt méri, hogy mennyi időbe telik a normál működés helyreállítása. Ezek a mutatók kéz a kézben működnek a korábban tárgyalt egyéb teljesítménymutatókkal.

"Amikor a kezdeti biztonsági mentési feladat meghiúsul, nagy a valószínűsége annak, hogy a többi, azt követő feladat is meghiúsul. Ilyen esetben a legjobban a monitorozás és az értesítések révén értheti meg az események menetét." – AWS előírásos útmutató

Elengedhetetlen az incidens súlyosságán alapuló egyértelmű reagálási kritériumok meghatározása. A szervezetek gyakran összehangolják szolgáltatási szintű célkitűzéseiket (SLO-kat) a prioritási szintekkel az incidensek hatékony kezelésének biztosítása érdekében:

  • P1 (kritikus): Nyugtázás 5 percen belül, helyreállítás 4 órán belül
  • P2 (Magas): 15 percen belül nyugtázandó, 12 órán belül helyreállítandó
  • P3 (Közepes): 1 órán belül visszaigazolás, 24 órán belül helyreállítás

Az erős riasztórendszerek a hatékony incidensreagálás gerincét alkotják. A biztonsági mentések monitorozásának olyan eszközökkel való integrálásával, mint az Amazon CloudWatch vagy a Google Cloud Monitoring, valós idejű értesítéseket állíthat be olyan szolgáltatásokon keresztül, mint az Amazon SNS. Például riasztásokat állíthat be úgy, hogy magas prioritású jegyet indítsanak el, ha egy órán belül több mint öt biztonsági mentési feladat sikertelen.

"Ha az MTTA alacsony, az azt jelenti, hogy a riasztások gyorsan eljutnak a megfelelő emberekhez. Ha magas, az gyakran riasztási fáradtságra, értesítési túlterhelésre vagy nem egyértelmű felelősségi körökre utal." – Wiz

Az automatizálás kritikus szerepet játszik e célok elérésében. Az olyan eszközök, mint az Amazon EventBridge, automatizálhatják az eszkalációs folyamatokat, biztosítva a gyors jegylétrehozást és az MTTA következetes nyomon követését. A pontosság megőrzése érdekében elengedhetetlen, hogy egyértelműen meghatározzuk, mit jelent az "elismert" a többfelhős környezetünkben, biztosítva, hogy mindenki ugyanazon az oldalon legyen a gyakorlatban hasznosítható mutatók tekintetében.

8. Védett erőforrások száma

A védett erőforrások száma (Protected Resources Count) méri a biztonsági mentési szolgáltatás által védett virtuális gépek, adatbázisok, fájlrendszerek és egyéb infrastruktúra-összetevők számát. Ez egy kulcsfontosságú mérőszám annak felmérésére, hogy a biztonsági mentési rendszer mennyire jól fedi le a többfelhős környezetet. A pontos számok elengedhetetlenek a megfelelő adatkezelés biztosításához, különösen mivel a többfelhős rendszer bevezetése mind a magán-, mind az állami szektorban meghaladta a 90% szintet. Ezen védett eszközök nyomon követése ma már a felhőalapú környezetek megfelelőségének és irányításának sarokköve.

Ennek a mutatónak a valódi értéke akkor válik világossá, ha összehasonlítjuk a teljes infrastruktúra-készlettel. Számos felhőplatform biztosít eszközöket a védett eszközök számának megállapítására, lehetővé téve a lefedettségbeli hiányosságok azonosítását. Ha ezt a számot a teljes készlettel összevetjük, gyorsan meghatározhatjuk azokat az erőforrásokat, amelyek esetleg védelem nélkül maradnak.

A versenyelőny megőrzéséhez elengedhetetlenek az automatizált felderítő eszközök. A dinamikus felhőkörnyezetekben folyamatosan új erőforrások kerülnek hozzáadásra, és automatizált vizsgálatok nélkül egyes erőforrások – amelyeket gyakran "árnyék" erőforrásoknak neveznek – megkerülhetik a biztonsági mentési szabályzatokat. Például az Azure "Védhető erőforrások" panelje kiemeli azokat az eszközöket, amelyekről még nem készült biztonsági mentés, így könnyen megoldhatók ezek a hiányosságok azonnal.

A riasztások beállítása tovább javíthatja az áttekintést. Például beállíthatja a CloudWatch vagy a Google Cloud Monitoring szolgáltatást, hogy értesítéseket küldjenek, ha a védett eszközök százalékos aránya egy küszöbérték alá esik, például a teljes készlet 95%-je alá. Ez a proaktív megközelítés segít a potenciális sebezhetőségek észlelésében, mielőtt azok adatvesztéshez vezetnének. Ezenkívül az erőforrások címkézésével, például a "BackupTier: Gold" vagy a "BackupTier: Silver" címkékkel, egyszerűsíthető a szabályzatok betartatása és a nyomon követés a különböző csapatok vagy részlegek között.

A központosított irányítópultok egy másik kritikus eszköz a többfelhős környezetek átláthatóságának fenntartásához. Az AWS Backup például 5 percenként frissíti a CloudWatch mutatóit, míg a Google Cloud óránkénti frissítéseket biztosít a tárhelyhasználatról. Az adatformátumokat normalizáló platformok – például a JSON-t vagy a syslog-ot betöltő platformok – használatával biztosítható a konzisztens jelentéskészítés a különböző felhőszolgáltatók között. Az infrastruktúra API-k rendszeres auditjai tovább ellenőrzik, hogy minden erőforrás lefedett-e, segítve a megfelelőség fenntartását és a védelmi hiányosságok elkerülését.

9. Biztonsági mentési tárhely felhasználása

A biztonsági mentési trezor tárhelyhasználatának nyomon követése kulcsfontosságú a költségek kezelése és a kapacitás hatékony tervezése szempontjából. Az egyik legfontosabb nyomon követendő mérőszám a tárolt adatmennyiség (GiB-ben vagy TB-ban mérve). Ez a mutató megmutatja, hogy mennyi tárhely van elfoglalva, így elkerülhető a kapacitáskorlátok elérése vagy a váratlan számlázási problémák.

Egy másik fontos mutató az tárolókészlet kihasználtsága, amely a biztonsági mentési rendszerben felhasznált és elérhető tárhely százalékos arányát mutatja. Ha a használat elkezd közeledni az előre meghatározott küszöbértékekhez, akkor itt az ideje a kapacitás bővítésének vagy az elavult biztonsági mentések eltávolításának. Az AWS Backup például 5 percenként frissíti ezeket a mutatókat a CloudWatch segítségével, míg a Google Cloud óránként frissíti az értékeket, és 5 percenként megismétli a legfrissebb adatokat.

Az is elengedhetetlen, hogy figyelemmel kísérjük minimális megőrzési napok hogy biztosítsa az adatok megőrzését a szükséges ideig. Ezenkívül az első és az utolsó visszaállítási időbélyegek nyomon követése segíthet a biztonsági mentés életciklusának érvényesítésében és a szabályozásoknak való megfelelés megerősítésében.

Az egyik lehetséges költségtényező a lejárt helyreállítási pontok, amelyek nem törlődnek. Az AWS Backup biztosítja a metrikát. LejártHelyreállításiPontokSzáma, amely azonosítja azokat a biztonsági mentéseket, amelyeket el kellett volna távolítani, de még mindig sok helyet foglalnak. Ez magasabb tárolási költségekhez vezethet. Hasonlóképpen, a FelépülésiPontokSzámaHideg A metrika segít megerősíteni, hogy a régebbi adatok a tervek szerint átkerülnek az olcsóbb archiválási szintekre. Bár az archív tárolás olcsóbb, érdemes megjegyezni, hogy az ilyen adatok visszakeresési költségei magasabbak lehetnek.

Hogy megelőzd a versenytársaidat, állítsd be küszöbérték-riasztások proaktív kezeléshez. A monitorozó rendszernek értesítenie kell, ha a tárhelykihasználtság meghaladja a beállított korlátokat, vagy ha a lejárt helyreállítási pontok száma növekedni kezd. Az is hasznos, ha a felhasználási mutatókat erőforrástípus – például Compute Engine példányok, SQL adatbázisok vagy Oracle rendszerek – szerint szegmentáljuk. Így pontosan meghatározhatjuk, hogy mely munkaterhelések hajtják a tárhely növekedését, és ennek megfelelően módosíthatjuk a megőrzési szabályzatokat.

Azoknak, akik használják Serverion‘többfelhős biztonsági mentési megoldásai (Serverion), ezen monitorozási stratégiák integrálása javíthatja mind a teljesítményt, mind a költséghatékonyságot. Ezek a gyakorlatok megalapozzák a részletesebb működési mutatókat a következő szakaszokban.

10. Hozzáférési naplók és auditnaplók

A biztonsági mentési infrastruktúrát érintő minden műveletet – legyen szó adat-visszaállításról, szabályzat módosításáról vagy akár csak információolvasásról – aprólékosan rögzíteni kell. A hozzáférési naplók és az auditnaplók részletes nyilvántartást biztosítanak arról, hogy ki, mikor és honnan fért hozzá az adatokhoz. Ez az átláthatósági szint kritikus fontosságú mind a biztonsági vizsgálatok, mind a szabályozási követelmények teljesítése szempontjából.

Az auditnaplóknak minden esemény összes lényeges részletét rögzíteniük kell. Ez magában foglalja az érintett felhasználót vagy IAM szerepkört, a végrehajtott művelet típusát (pl. RestoreBackup, DeleteBackup, CreateBackupPlan), a forrás IP-címét, az érintett erőforrást, az időbélyeget és a művelet eredményét. Hosszú ideig futó folyamatok esetén a Google Cloud Backup és a DR két külön naplóbejegyzést generál: egyet a művelet megkezdésekor, egy másikat pedig a befejezésekor.

A felhőalapú platformok általában két kategóriába sorolják a naplókat: Adminisztrátori tevékenységnaplók konfigurációs változtatásokhoz és Adathozzáférési naplók érzékeny adatokat tartalmazó műveletekhez. Az adminisztrátori tevékenységnaplók általában alapértelmezés szerint engedélyezve vannak, de az adathozzáférési naplók gyakran manuális aktiválást igényelnek. A Google Cloudban például az adathozzáférési naplók alapértelmezés szerint le vannak tiltva (a BigQuery kivételével) a méretük miatt. Azonban ezeknek a naplóknak az engedélyezése kulcsfontosságú annak nyomon követéséhez, hogy ki tekinti meg vagy állítja vissza az érzékeny adatokat, biztosítva az adatvédelmi előírások betartását.

A monitorozás megerősítése érdekében állítson be valós idejű riasztásokat a kritikus műveletekhez, például a DeleteBackuphoz. Ezenkívül a naplókat központosított tárolási megoldásokba irányíthatja a megőrzési követelmények teljesítése érdekében, amelyek a megfelelőségi szabványoktól függően 30 naptól akár 10 évig is változhatnak. A központosított tárolási lehetőségek közé tartoznak olyan platformok, mint az Azure Log Analytics vagy a Cloud Storage.

Többfelhős környezetekhez olyan eszközök, mint a Serverion leegyszerűsítheti a naplókezelést. Az AWS CloudTrail, az Azure Activity Logs és a Google Cloud Audit Logs naplóinak egyetlen SIEM rendszerbe történő konszolidálásával egységes láthatóságot érhet el a teljes biztonsági mentési infrastruktúrájában. Ez a megközelítés nemcsak egyszerűsíti a monitorozást, hanem javítja a platformok közötti megfelelőség fenntartásának képességét is.

Összehasonlító táblázat

A 10 legfontosabb többfelhős biztonsági mentési mutató: kategóriák, mérések és riasztási küszöbértékek

A 10 legfontosabb többfelhős biztonsági mentési mutató: kategóriák, mérések és riasztási küszöbértékek

A könnyebb követhetőség érdekében ez a táblázat három kategóriába sorolja a legfontosabb biztonsági mentési mutatókat: teljesítmény, biztonság/egészség és kapacitás. Az ilyen mutatók csoportosítása segít a potenciális problémák meghatározásában, és egyértelmű ütemtervet biztosít azok kezelésére. Az alábbiakban kilenc alapvető mutatót talál, mindegyiknek megvan a maga célja, mérési módja és a riasztási küszöbérték, amely jelzi, hogy valami figyelmet igényel.

Teljesítménymutatók arra összpontosítsanak, hogy milyen gyorsan történnek a biztonsági mentések és a helyreállítások. Olyan kérdésekre adnak választ, mint: Időben elkészülnek-e a biztonsági mentések? Elég gyorsan visszaállíthatók-e az adatok válság esetén? Például, ha a helyreállítási idő célkitűzése (RTO) 4 órára van beállítva, de a tényleges helyreállítási idő (RTR) rendszeresen eléri a 6 órát, az egyértelmű jel arra, hogy a rendszerének felülvizsgálatra lehet szüksége.

Biztonsági és állapotmutatók Kövesse nyomon, hogy a biztonsági mentések megfelelően működnek-e, és gondoskodjon az adatai épségéről. Például, ha a biztonsági mentések sikerességi aránya 99% alá esik, vagy óránként ötnél több sikertelen feladatot tapasztal, itt az ideje kivizsgálni a helyzetet.

Kapacitási mutatók A használat monitorozásával segíthet elkerülni a tárhellyel kapcsolatos hibákat. Például a riasztások beállítása, amikor a tárhelykihasználtság eléri a 80–90% értéket, megakadályozhatja a tárhely kifogyása okozta fennakadásokat.

Kategória Metrikus Célja Példa mérésre Ajánlott riasztási küszöbérték
Teljesítmény Helyreállítási idő célkitűzés (RTO) A helyreállítási sebesség megfeleljen az üzleti igényeknek Percek vagy órák a visszaállításhoz Az RTR meghaladja az üzletileg meghatározott RTO-t
Teljesítmény Adatátviteli sebesség (átviteli sebesség) Mérje fel a biztonsági mentés és visszaállítás sebességét MB/s vagy TB/óra A minimális hardversebesség alatt
Teljesítmény Biztonsági mentési ablak kihasználtsága Győződjön meg arról, hogy a biztonsági mentések a megadott időn belül befejeződnek Időtartam (ÓÓ:PP) > 100% a definiált ablakból
Biztonság/Egészségügy Biztonsági mentés sikerességi aránya Az adatvédelem megbízhatóságának nyomon követése % sikerek/sikertelenségek száma < 99% siker vagy > 5 hiba óránként
Biztonság/Egészségügy Adatintegritási ellenőrzések Ellenőrizze az adatok sértetlenségét és helyreállíthatóságát Sikeres tesztek száma < 1 sikeres visszaállítás 24 órán belül
Biztonság/Egészségügy Egészségügyi események Azonosítsa az állandó és az átmeneti hibákat Egészséges, egészségtelen, leromlott állapotok Bármilyen "tartós egészségtelen" állapot
Kapacitás Tárhelykihasználás A tárolókapacitás-kimerülés megelőzése % felhasznált / tárolt bájtok > 80–90% kapacitás
Kapacitás Biztonsági mentési tárhely felhasználása Felhőalapú tárhelyköltségek és -használat nyomon követése GB vagy TB Az összes adat meghaladja a költségvetési küszöböt
Kapacitás Védett erőforrások száma Győződjön meg arról, hogy minden kritikus eszköz le van fedve Védett példányok száma Darabszám < várható készlet

Ez a táblázat kiemeli a gyors cselekvés fontosságát a küszöbértékek átlépése esetén. Ezen mutatók monitorozása biztosítja, hogy a biztonsági mentési rendszer megbízható, biztonságos és készen álljon bármilyen kihívás kezelésére.

Következtetés

A megfelelő mérőszámok nyomon követésével a többfelhős biztonsági mentési műveletek a problémákra való egyszerű reagálásról a proaktív megelőzésükre helyezhetők át. munkavállalási sikerarányok, tárhelykihasználás, és felépülési teljesítmény, egy biztonsági hálót hoz létre, amely csökkenti az adatvesztés és az állásidő kockázatát.

Az általunk vizsgált mutatók három fő területre összpontosítanak: adatvédelem, biztonság, és költségkontroll. A küszöbértékek beállítása és a tényleges helyreállítási idők rendszeres összehasonlítása az RTO (helyreállítási idő célkitűzés) és az RPO (helyreállítási pont célkitűzés) célokkal segíthet a potenciális problémák észlelésében, mielőtt azok kritikussá válnának. Ahogy Cody Slingerland, FinOps minősített szakember találóan mondja:

""Amit nem mérsz meg, azt nem tudod megjavítani.""

Ez a felismerés rávilágít az alapos monitorozás fontosságára az üzletmenet-folytonosság biztosítása érdekében.

Ezen mutatók használatával okosabb döntéseket hozhat az erőforrás-elosztással kapcsolatban, elkerülheti a vészhelyzeti törléseket, és biztosíthatja a biztonsági mentések időben történő elkészülését. Amikor a szervezetek dokumentálják és megosztják ezeket a mutatókat a vezetőséggel, gyakran könnyebben tudják indokolni az infrastruktúra-fejlesztéseket, és bemutatni a biztonsági mentési rendszereik értékét.

Tegyen gyakorlati lépéseket, például állítson be automatikus riasztásokat az óránként öt feladatot meghaladó hibák esetén, rendszeresen tesztelje a visszaállításokat az RTO és az RPO validálásához, és alkalmazzon többdimenziós szűrőket a figyelmet igénylő platformok vagy erőforrások azonosítására. Ezek a lépések a nyers adatokat érdemi fejlesztésekké alakítják, megerősítve a biztonsági mentési infrastruktúrát.

Ezen monitorozási gyakorlatok alkalmazása átláthatóságot és magabiztosságot biztosít a többfelhős biztonsági mentések hatékony kezeléséhez. Ezáltal csökkentheti a kockázatokat, kézben tarthatja a költségeket, és biztosíthatja adatai biztonságát.

GYIK

Melyek a sikeres többfelhős biztonsági mentési műveletekhez figyelendő legfontosabb mutatók?

A megfelelő mutatók monitorozása kulcsfontosságú ahhoz, hogy a többfelhős biztonsági mentési műveletek zökkenőmentesen és megbízhatóan működjenek. Fordítson különös figyelmet a következőkre: Helyreállítási idő célkitűzései (RTO) és Recovery Point Objectives (RPO) – ezek a mutatók megmutatják, hogy milyen gyorsan és hatékonyan tudja visszaállítani adatait, amikor szükséges. Egy másik kritikus tényező a folyamatos nyomon követés. adatátviteli sebességek és késleltetés hogy a biztonsági mentések időben és zavartalanul történjenek a felhőalapú környezetekben.

Fontos nyomon követni is tárhelykihasználás, beleértve a teljes kapacitást és a rendelkezésre álló területet, hogy a lehető legjobban kihasználhassa erőforrásait. Figyelemmel kísérve biztonsági mentési feladatok sikerességi aránya és a a feldolgozott adatok teljes mennyisége segíthet a potenciális problémák korai felismerésében, mielőtt azok eszkalálódnának. Ezen mutatók következetes monitorozásával megbízható és hatékony biztonsági mentési stratégiát tarthat fenn.

Hogyan tudják a vállalkozások egyensúlyt teremteni a költségek és a védelem között az RTO és RPO célok kitűzésekor?

A költség és a védelem közötti megfelelő egyensúly megteremtése érdekében a beállításakor Helyreállítási idő célkitűzés (RTO) és Recovery Point Objective (RPO), az első lépés egy alapos üzleti hatáselemzés. Ez segít meghatározni, hogy mely alkalmazások abszolút kritikusak, és a legrövidebb RTO-t és RPO-t igénylik, és melyek képesek hosszabb helyreállítási időket és némi adatvesztést kezelni. Például a kritikus munkaterhelésekről gyakori biztonsági mentéseket kell készíteni, míg a kevésbé fontos adatok gazdaságosabb megoldásokkal, hosszabb biztonsági mentési időközökkel tárolhatók.

A biztonsági mentések – gyakoriság és tárolási típus alapján – rétegekbe rendezésével elkerülheti a nagy teljesítményű tároló használatának felesleges költségeit az összes adatához. A rendszeres helyreállítási tesztek elengedhetetlenek annak megerősítéséhez, hogy az RTO és RPO célok elérhetők-e a jelenlegi beállításokkal. Ha nem, akkor érdemes lehet olyan lehetőségeket megvizsgálni, mint az inkrementális biztonsági mentések, a deduplikáció vagy a hatékony, felhőalapú eszközök, hogy a költségeket a védelem feláldozása nélkül kezelje.

A Serverion leegyszerűsíti ezt a folyamatot többfelhős biztonsági mentési megoldásaival. Akár nagy teljesítményű SSD-tárolóra van szüksége a kritikus fontosságú adatokhoz, akár költségvetésbarát objektumtárolásra archiváláshoz, rugalmas opcióik lehetővé teszik, hogy RTO és RPO céljait a költségvetésen belül maradva teljesítse – mindezt anélkül, hogy feláldozná az üzletmenet folytonosságának megbízhatóságát.

Hogyan javíthatom az adatátviteli sebességet többfelhős biztonsági mentések esetén?

A többfelhős biztonsági mentések adatátviteli sebességének növelése érdekében összpontosítson néhány kulcsfontosságú technikára. Kezdje a kihasználással párhuzamos feldolgozás miközben csökkenti a hálózaton keresztül küldött adatok mennyiségét. Több tartalék csatorna konfigurálásával és a közepes szintű tömörítés engedélyezésével a legtöbbet hozhatja ki a sávszélességből, mindezt anélkül, hogy túlságosan megterhelné a processzort. Még egy tipp? Bontsa fel a nagy fájlokat kisebb – egyenként körülbelül 1 GB-os – darabokra, és rendelje ezeket a darabokat külön csatornákhoz. Ez lehetővé teszi, hogy több adatfolyam egyszerre működjön, ami jelentősen javítja az átviteli sebességet.

Párosítás heti teljes biztonsági mentések -vel napi inkrementális biztonsági mentések egy másik okos megközelítés. Azzal, hogy csak a megváltozott adatblokkokat továbbítja, sávszélességet takaríthat meg és felgyorsíthatja a szokásos biztonsági mentési feladatokat. Tartsa szemmel az átviteli mutatókat, és fontolja meg a biztonsági mentések ütemezését csúcsidőn kívüli időszakokra a hálózati torlódások elkerülése érdekében. Szeretne még egy lépéssel továbbmenni? A peremhálózati gyorsítótárazás vagy a nagy sebességű tárolás használata a felhő belépési pontja közelében csökkentheti a késleltetést, így az átvitel még zökkenőmentesebbé válhat.

A Serverion többfelhős tárhelyplatformja robusztus infrastruktúrájával és globálisan elosztott adatközpontjaival támogatja ezeket a módszereket, segítve a gyorsabb és hatékonyabb biztonsági mentések elérését.

Kapcsolódó blogbejegyzések

hu_HU