Kézi feladatátvétel-tesztelési lépések
A kézi feladatátvételi tesztelés biztosítja, hogy a rendszer a működés megszakítása nélkül át tudjon kapcsolni biztonsági mentésre a kimaradások vagy karbantartás során. Íme egy gyors áttekintés a folyamatról:
- Miért fontos: Tesztelje a helyreállítási lépéseket, erősítse meg a biztonsági mentési kapacitást, képezze ki a csapatokat, és akadályozza meg a jövőbeni problémákat.
- Tervezés: Célok meghatározása (pl. 15 perc alatti leállás), kritikus rendszerek (adatbázisok, alkalmazások) kiválasztása és a tesztek ütemezése csúcsidőn kívül.
- Készítmény: Ellenőrizze a rendszer készenlétét, az adatok szinkronizálását, a biztonsági mentéseket és a hálózati kapcsolatot.
- Végrehajtás: Kövesse a lépésenkénti feladatátvételi tervet, figyelje a naplókat, és érvényesítse a biztonsági mentési rendszereket és az alkalmazások működését.
- Helyreállítás: A tesztelés után váltson vissza az elsődleges rendszerre, ellenőrizze az adatok konzisztenciáját, és dokumentálja az eredményeket a jövőbeni fejlesztésekhez.
Ez a folyamat minimalizálja az állásidőt, biztosítja az adatok integritását, és felkészíti csapatát a valós eseményekre. A rendszeres (háromhavonta) tesztek és a kifinomult dokumentáció megbízhatóbbá teheti a feladatátvételi stratégiát.
Feladatátvételi munkafolyamat tesztelése
A feladatátvételi teszt megtervezése
A gondos tervezés minimális fennakadást biztosít, és megerősíti a rendszer rugalmasságát a kézi feladatátvételi tesztek során. Így állíthat be célokat, választhat rendszereket, ütemezheti a tesztet és készíthet el dokumentációt.
Tesztcélok beállítása
Határozzon meg egyértelmű célokat a katasztrófa utáni helyreállításhoz, például:
- A feladatátvétel során megengedett maximális állásidő (cél 15 percnél rövidebb időre)
- Az adatok konzisztenciájának ellenőrzése a rendszerek között
- Az alkalmazás működésének biztosítása feladatátvétel után
- Hálózati teljesítmény mérése
- Felhasználói hozzáférés és hitelesítés megerősítése
Tesztrendszerek kiválasztása
Fókuszban az alapvető rendszerekre, beleértve:
- Elsődleges adatbázis-kiszolgálók
- Ügyfélközpontú alkalmazások
- Belső eszközök az üzleti műveletekhez
- Hitelesítési rendszerek
- Maghálózati infrastruktúra
Használjon függőségi térképet a rendszer interakcióinak megértéséhez. Ez segít eldönteni, hogy mely komponenseket kell együtt tesztelni, és melyeket lehet elkülöníteni.
Teszt ütemterv és csapatfrissítések
Tervezze meg a teszteket csúcsidőn kívül, és vegye figyelembe a következőket:
- Karbantartási ablakok: A tesztek összehangolása az előre ütemezett karbantartási időkkel.
- Időzónák: A globális csapatok helyszínei és a változó nyitvatartási idő.
- Erőforrások elérhetősége: Gondoskodjon arról, hogy a csapat kulcsfontosságú tagjai rendelkezésre álljanak a teljes teszt során.
- Üzleti naptár: Kerülje a mozgalmas időszakokat, például a hónap végi feldolgozást.
Értesítse az érdekelt feleket a teszt ütemtervéről legalább két héttel korábban. Tartalmazzon részleteket, például:
- Várható rendszerleállás
- Lehetséges szolgáltatáskimaradások
- Sürgősségi kapcsolatfelvételi adatok
- Visszagörgetési eljárások
A tesztterv megírása
Az alapos vizsgálati tervnek tartalmaznia kell:
1. Feladatátvétel előtti ellenőrzőlista
Sorolja fel az összes előkészítő lépést, például a rendszerek biztonsági mentését, az adatok szinkronizálásának ellenőrzését és az erőforrások kiosztását.
2. Végrehajtási lépések
Írja le a feladatátvétel műveleteinek pontos sorrendjét. Tartalmazzon parancsokat, konfigurációs módosításokat és érvényesítési pontokat.
3. Sikerkritériumok
Határozzon meg mérőszámokat a siker mérésére, például:
- A rendszer válaszideje
- Adatok integritásának ellenőrzése
- Alkalmazás működési tesztek
- Felhasználói hozzáférés ellenőrzése
4. Visszaállítási eljárások
Adja meg a részletes lépéseket az elsődleges rendszerhez való visszatéréshez, ha problémák merülnek fel. Adja meg azokat a feltételeket, amelyek kiváltják a visszaállítást.
A rendszer készenléti ellenőrzése
A feladatátvételi teszt megkezdése előtt nagyon fontos ellenőrizni, hogy minden kulcsfontosságú összetevő a helyén van-e. Ez segít optimális tesztkörülmények megteremtésében, és csökkenti a váratlan problémák kockázatát. Fókuszáljon a rendszerkonfigurációk áttekintésére, az adatok szinkronizálásának ellenőrzésére, a biztonsági mentések megfelelőségének biztosítására és a hálózati kapcsolat tesztelésére.
Rendszerbeállítások áttekintése
Kezdje az aktuális rendszerbeállítás ellenőrzésével:
- Ellenőrizze a CPU, a memória és a tárhely kiosztását.
- Győződjön meg arról, hogy minden szükséges szolgáltatás fut.
- Ellenőrizze az engedélyeket és a hozzáférés-szabályozást.
- Ellenőrizze még egyszer a biztonsági beállításokat.
- Győződjön meg róla megfigyelő eszközök megfelelően vannak beállítva.
Jegyezze fel ezeket a konfigurációkat, beleértve a verziószámokat, a javítási szinteket és a beállításokat, hogy ellenőrizhesse őket a feladatátvételi teszt után. Ezek a lépések biztosítják, hogy a rendszer felkészült a tesztelésre.
Adatszinkronizálás állapota
A rendszerkonfigurációk áttekintése után győződjön meg arról, hogy az adatszinkronizálás a várt módon működik:
- Replikációs késés mérése.
- Ellenőrizze az adatbázis konzisztenciáját.
- Ellenőrizze a fájlrendszer szinkronizálását.
- Az adatok integritásának ellenőrzése ellenőrző összegekkel.
Fókuszáljon a valós idejű szinkronizálási jelzőkre. A legtöbb üzleti alkalmazás esetében a replikációs késleltetésnek 60 másodperc alatt kell lennie. Ez biztosítja, hogy az adatok készen állnak a feladatátvételi tesztre.
Biztonsági mentés rendszerellenőrzés
Alaposan ellenőrizze a biztonsági mentési rendszert, hogy megbizonyosodjon arról, hogy készen áll:
Hardver:
- Ellenőrizze az elektromos rendszert és a hűtést.
- Győződjön meg arról, hogy a tárolási kapacitás és a teljesítmény megfelel a követelményeknek.
- Ellenőrizze a hálózati interfész kártyákat.
- Vizsgálja meg a redundáns alkatrészeket.
Szoftver:
- Az operációs rendszer állapotának felmérése.
- Ellenőrizze, hogy az alkalmazásfüggőségek működnek.
- Ellenőrizze a biztonsági mentési eszközöket és segédprogramokat.
- Ellenőrző ügynökök érvényesítése.
Hozzáférés-vezérlés:
- Hitelesítési rendszerek tesztelése.
- Tekintse át a felhasználói engedélyeket.
- Ellenőrizze, hogy a biztonsági tanúsítványok érvényesek.
- Ellenőrizze a VPN-kapcsolatokat.
Ezek az ellenőrzések biztosítják, hogy a biztonsági mentési rendszer teljesen működőképes legyen, és készen áll a feladatátvételi tesztre.
Hálózati ellenőrzés
Értékelje a hálózati kapcsolatot a következő kritériumok alapján:
| Teszt típusa | Elfogadási kritériumok | Módszer |
|---|---|---|
| Látencia | 50 ms alatt | Ping tesztek |
| Sávszélesség | Több mint 1 Gbps | iperf3 tesztelés |
| DNS felbontás | 100 ms alatt | dig/nslookup |
| Load Balancer | Aktív/passzív állapot | Egészségügyi vizsgálatok |
Futtassa ezeket a teszteket különböző hálózati szegmensekből, hogy megbizonyosodjon arról, hogy az összes lehetséges feladatátvételi útvonal le van fedve. Dokumentálja az alapteljesítmény-mérőszámokat összehasonlításhoz a feladatátvételi folyamat alatt és után.
Ezenkívül ellenőrizze, hogy a redundáns hálózati utak konfigurálva vannak-e és elérhetőek-e. Adott esetben tesztelje a hálózati összetevők automatikus feladatátvételét, és győződjön meg arról, hogy minden szükséges port és protokoll nyitva van az elsődleges és a tartalék hely között.
sbb-itb-59e1987
A feladatátvételi teszt futtatása
A készenléti ellenőrzések elvégzése után óvatosan folytassa a feladatátvételi folyamatot, hogy csökkentse az esetleges fennakadásokat.
Indítsa el a feladatátvételt
- Értesítse az érintetteket legalább 15 perccel korábban.
- Szüntesse meg az összes tranzakciót, és ellenőrizze, hogy nincs replikációs késés.
- Indítsa el a feladatátvételi sorrendet, és rögzítse a pontos kezdési időpontot.
Szorosan figyelje, hogyan reagál a rendszer kezdetben. A feladatátvételi folyamat általában 30-45 másodpercet vesz igénybe. Ha tovább tart, azonnal vizsgálja meg. A folyamat elindítása után helyezze a hangsúlyt a valós idejű naplófigyelésre, hogy a felmerülő problémákat azonosítsa.
Nézze meg a rendszernaplókat
A rendszernaplók figyelése elengedhetetlen a problémák korai felismeréséhez:
| Napló típusa | Figyelmeztető jelek | Kritikus riasztások |
|---|---|---|
| Alkalmazás | Kapcsolati időtúllépések | A szolgáltatás összeomlik |
| Adatbázis | Replikációs hibák | Adatsérülés |
| Hálózat | Csomagvesztés > 1% | Csatlakozási hibák |
| Biztonság | Hitelesítési késések | Hozzáférés megsértése |
A valós idejű üzenetek nyomon követéséhez tartsa nyitva a parancssori felületet (CLI). Különös figyelmet kell fordítani a "FAIL" vagy "ERR" kezdetű hibakódokra, mivel ezek gyakran olyan sürgős problémákat jeleznek, amelyek azonnali beavatkozást igényelnek.
Ellenőrizze a biztonsági mentési webhelyet
A feladatátvétel elindítása után győződjön meg arról, hogy a biztonsági mentés helye megfelelően működik:
1. Szolgáltatás elérhetősége
Győződjön meg arról, hogy a biztonsági mentési webhely összes alapvető szolgáltatása 60 másodpercen belül „AKTÍV” állapotot mutat. Jegyezze fel a felülvizsgálati késéseket.
2. Erőforrás felhasználás
Figyelje ezeket a kritikus mutatókat az átállás során:
- CPU használat: 80% alatt kell maradnia.
- Memóriahasználat: Cél a 75% alatti kihasználtság.
- Tároló I/O: Tartsa 2000 IOPS alatt.
- Hálózati áteresztőképesség: A normál szint 40-60% közötti használatára számítson.
3. Terhelés-elosztás
Ellenőrizze, hogy a forgalom megfelelően van-e irányítva a biztonsági mentés helyére. Ellenőrizze a terheléselosztó mérőszámait, hogy biztosítsa a forgalom egyenletes elosztását a rendelkezésre álló erőforrások között.
Alkalmazások és adatok tesztelése
Azonnal tesztelje a kulcsalkalmazásokat és ellenőrizze az adatok integritását:
- Alapvető alkalmazás tesztelése: Végezze el az alapvető CRUD-műveleteket, tesztelje a felhasználói hitelesítést, ellenőrizze a kritikus üzleti munkafolyamatokat, és ellenőrizze az API-válaszkészséget.
- Adatok érvényesítése: Biztosítsa az adatbázis konzisztenciáját, ellenőrizze a fájlrendszer integritását, erősítse meg a legutóbbi tranzakciókat, és tesztelje az adatlekérési sebességet.
A másodlagos rendszerekre való átállás előtt összpontosítson a kritikus alkalmazások tesztelésére. Dokumentáljon minden szabálytalanságot, például a válaszidőket, amelyek több mint 20%-vel térnek el az alapmérésektől.
Tesztelés feladatátvétel után
Miután a biztonsági mentési hely elkészült, a következő lépés annak biztosítása, hogy az alapvető üzleti funkciók megfelelően működjenek. Ez magában foglalja a műveletek gondos ellenőrzését és ellenőrzését, hogy megbizonyosodjon arról, hogy minden a megfelelő módon fut.
Üzleti funkció ellenőrzése
- Futtasson le egy teljes üzleti tranzakciós ciklust a munkafolyamatok és az adatáramlás zökkenőmentes megerősítéséhez, beleértve a külső integrációkat is.
- Tesztelje a kulcskapcsolatokat olyan külső rendszerekkel, amelyekre a korábbi alkalmazástesztelések nem vonatkoztak.
- Győződjön meg arról, hogy minden ütemezett feladatot időben végrehajtanak.
- Az eltérések elkerülése érdekében ellenőrizze a jelentési rendszer pontosságát.
Ezek a lépések segítenek megbizonyosodni arról, hogy a biztonsági mentési környezet megszakítás nélkül képes kezelni a kritikus műveleteket. Az ellenőrzések többszöri futtatása egyenletes teljesítményt biztosít, és lehetővé teszi a problémák gyors kezelését.
Váltson vissza a fő rendszerre
Miután meggyőződött arról, hogy a biztonsági mentési rendszer megfelelően működik, ideje visszaállni az elsődleges rendszerre. Ez magában foglalja a korábbi lépések visszafordítását a normál működés helyreállításához.
Indítsa el a visszaküldési folyamatot
Értesítsen minden érintett felet, és egyeztetjen a műszaki csapattal. Készítsen ellenőrzőlistát a folyamat minden lépésének nyomon követésére, beleértve az adatbázis-szinkronizálást és az alkalmazásváltás időzítését.
Győződjön meg arról, hogy:
- Győződjön meg arról, hogy minden kritikus folyamat befejeződött.
- Győződjön meg arról, hogy ne maradjanak függőben lévő tranzakciók.
- Dokumentálja az ideiglenes útválasztási szabályokat referenciaként a visszafordítás során.
- Ellenőrizze, hogy a rendszerműveletek megfelelően működnek-e.
Ellenőrizze az adatok szinkronizálását
Biztosítsa az adatok konzisztenciáját a rendszerek között az alábbiakkal:
- Az adatbázis tranzakciós naplóinak pontos visszajátszása.
- A fájlrendszer változásainak teljes szinkronizálása.
- Az időbélyeggel ellátott rekordok összehangolása a rendszerek között.
- A feladatátvétel során használt ideiglenes fájlok eltávolítása.
Használjon olyan eszközöket, mint az ellenőrző összegek vagy az összehasonlító szoftver, hogy megbizonyosodjon arról, hogy a feladatátvétel során módosított összes adat megegyezik a rendszerek között, mielőtt folytatná a végső váltást.
Vizsgálja meg az elsődleges rendszert
Végezzen alapos állapotfelmérést, hogy megbizonyosodjon arról, hogy az elsődleges rendszer készen áll:
- Infrastruktúra állapota: Ellenőrizze, hogy minden hardverelem működőképes-e.
- Hálózati kapcsolat: Ellenőrizze és erősítse meg a megfelelő útválasztási konfigurációkat.
- Alkalmazási szolgáltatások: Indítsa el az alkalmazásszolgáltatásokat a megfelelő sorrendben.
- Biztonsági rendszerek: Győződjön meg arról, hogy minden biztonsági intézkedés aktív és működőképes.
Dokumentálja az eredményeket
Miután az elsődleges rendszer teljesen helyreállt, rögzítse az eredményeket a jövőbeli folyamatok finomítása érdekében:
- Tesztmetrikák
Naplózza a kulcsfontosságú mérőszámokat, például a feladatátvételi időtartamot, az adatszinkronizálási időt, a problémák számát és a teljesítmény-összehasonlításokat. - Kiadás dokumentációja
- Jegyezze fel a hibaüzeneteket és azok megoldásait.
- Részletes hibaelhárítási lépések.
- Mérje fel a feladatátvétel üzleti hatását.
- Fejlesztési területek
- Azonosítsa a folyamatok elégtelenségeit vagy szűk keresztmetszeteit.
- Emelje ki a kommunikáció hiányosságait.
- Jelölje meg azokat a területeket, ahol a dokumentációt javítani lehetne.
- Szüntesse meg az esetleges technikai korlátokat.
Tárolja az összes dokumentációt egy központi helyen, amelyhez a katasztrófa-helyreállítási csapat hozzáférhet későbbi hivatkozás céljából.
Összegzés
A kézi feladatátvételi tesztelés alapos tervezést, alapos ellenőrzéseket, pontos végrehajtást és zökkenőmentes helyreállítási folyamatot foglal magában. Íme a legfontosabb fázisok lebontása:
- Tervezés: Célok meghatározása, függőségek feltérképezése, szerepek hozzárendelése és lehetséges kockázatok kezelése.
- Ellenőrzés: Győződjön meg arról, hogy az infrastruktúra készen áll, az adatok szinkronizálva vannak, a hálózatok csatlakoztatva vannak, és a biztonság sértetlen.
- Végrehajtás: Végezze el a feladatátvételt lépésről lépésre, figyeljen valós időben, ellenőrizze az alkalmazások működését, és kövesse nyomon a teljesítménymutatókat.
- Helyreállítás: Az elsődleges rendszerek visszaállítása, az adatok pontosságának ellenőrzése, a szolgáltatások futásának biztosítása és a teljes folyamat dokumentálása.
A feladatátvételi tesztelés javítása érdekében:
- Tervezze be a vizsgálatokat háromhavonta.
- Tartsa naprakészen a dokumentációt.
- Változtassa meg a csapat felelősségét a szakértelem fejlesztése érdekében.
- Minden teszt után értékelje és finomítsa a folyamatot.
A jól végrehajtott feladatátvételi teszt megerősíti az üzleti tevékenység fenntartásának képességét fennakadások idején. A valósághű forgatókönyvek ellenőrzött környezetben történő szimulációja megbízható eredményeket biztosít a termelési rendszerek kockáztatása nélkül.