Manuel Devralma Testi Adımları
Manuel yedekleme testi, sistemlerinizin kesintiler veya bakım sırasında operasyonları aksatmadan yedeklere geçebilmesini sağlar. İşte sürecin kısa bir özeti:
- Neden Önemlidir?: Kurtarma adımlarını test edin, yedekleme kapasitesini onaylayın, ekipleri eğitin ve gelecekteki sorunları önleyin.
- Planlama: Hedefler belirleyin (örneğin, 15 dakikanın altında kesinti süresi), kritik sistemleri seçin (veritabanları, uygulamalar) ve testleri düşük yoğunluklu saatlere planlayın.
- Hazırlık: Sistemin hazır olup olmadığını, veri senkronizasyonunu, yedeklemeleri ve ağ bağlantısını doğrulayın.
- Uygulamak: Adım adım bir devralma planını takip edin, günlükleri izleyin ve yedekleme sistemlerini ve uygulama işlevselliğini doğrulayın.
- İyileşmek: Testten sonra birincil sisteme geri dönün, veri tutarlılığını onaylayın ve gelecekteki iyileştirmeler için sonuçları belgelendirin.
Bu süreç kesinti süresini en aza indirir, veri bütünlüğünü garanti eder ve ekibinizi gerçek olaylara hazırlar. Düzenli testler (üç ayda bir) ve rafine edilmiş dokümantasyon, devralma stratejinizi daha güvenilir hale getirebilir.
Bir Failover İş Akışını Test Etme
Failover Testini Planlama
Dikkatli planlama, manuel devralma testleri sırasında minimum kesintiyi garanti eder ve sistem dayanıklılığını doğrular. İşte hedeflerin nasıl belirleneceği, sistemlerin nasıl seçileceği, testin nasıl planlanacağı ve dokümantasyonun nasıl hazırlanacağı.
Test Hedefleri Belirleme
Afet kurtarma için net hedefler tanımlayın, örneğin:
- Yedekleme sırasında izin verilen maksimum kesinti süresi (15 dakikanın altında olmasını hedefleyin)
- Sistemler arasında veri tutarlılığının doğrulanması
- Yedekleme sonrasında uygulama işlevselliğinin sağlanması
- Ağ performansının ölçülmesi
- Kullanıcı erişimini ve kimlik doğrulamasını doğrulama
Test Sistemlerinin Seçilmesi
Temel sistemlere odaklanın, bunlar şunlardır:
- Birincil veritabanı sunucuları
- Müşteri odaklı uygulamalar
- İş operasyonları için dahili araçlar
- Kimlik doğrulama sistemleri
- Çekirdek ağ altyapısı
Sistem etkileşimlerini anlamak için bir bağımlılık haritası kullanın. Bu, hangi bileşenlerin birlikte test edilmesi gerektiğine ve hangilerinin izole edilebileceğine karar vermenize yardımcı olur.
Test Programı ve Takım Güncellemeleri
Testleri yoğun olmayan saatlerde planlayın ve aşağıdakileri göz önünde bulundurun:
- Bakım Pencereleri: Testleri önceden planlanmış bakım zamanlarıyla uyumlu hale getirin.
- Zaman Dilimleri: Küresel ekip lokasyonlarını ve değişen iş saatlerini göz önünde bulundurun.
- Kaynak Kullanılabilirliği: Kilit ekip üyelerinin testin tamamı boyunca hazır bulunmasını sağlayın.
- İş Takvimi: Ay sonu işlemleri gibi yoğun dönemlerden kaçının.
Paydaşları test programı hakkında en az iki hafta önceden bilgilendirin. Şunlar gibi ayrıntıları ekleyin:
- Beklenen sistem kesintisi
- Olası hizmet kesintileri
- Acil durum iletişim bilgileri
- Geri alma prosedürleri
Test Planının Yazılması
Kapsamlı bir test planı şunları içermelidir:
1. Ön-Yükseltme Kontrol Listesi
Sistemlerin yedeklenmesi, veri senkronizasyonunun doğrulanması ve kaynakların tahsisi gibi tüm hazırlık adımlarını listeleyin.
2. Uygulama Adımları
Yedekleme için eylemlerin tam sırasını açıklayın. Komutları, yapılandırma değişikliklerini ve doğrulama noktalarını ekleyin.
3. Başarı Kriterleri
Başarıyı ölçmek için aşağıdaki gibi ölçütler tanımlayın:
- Sistem yanıt süreleri
- Veri bütünlüğü kontrolleri
- Uygulama işlevsellik testleri
- Kullanıcı erişim doğrulaması
4. Geri Alma Prosedürleri
Sorunlar oluşursa birincil sisteme geri dönmek için ayrıntılı adımlar sağlayın. Geri alma işlemini tetikleyecek koşulları belirtin.
Sistem Hazırlık Kontrolleri
Yedekleme testine başlamadan önce, tüm temel bileşenlerin yerinde olduğunu doğrulamak çok önemlidir. Bu, optimum test koşullarının oluşturulmasına yardımcı olur ve beklenmeyen sorunların riskini azaltır. Sistem yapılandırmalarını incelemeye, veri senkronizasyonunu kontrol etmeye, yedeklemelerin sağlıklı olduğundan emin olmaya ve ağ bağlantısını test etmeye odaklanın.
Sistem Kurulum İncelemesi
Mevcut sistem kurulumunu doğrulayarak başlayın:
- CPU, bellek ve depolama alanı tahsislerini kontrol edin.
- Gerekli tüm servislerin çalıştığını doğrulayın.
- İzinleri ve erişim kontrollerini doğrulayın.
- Güvenlik ayarlarınızı tekrar kontrol edin.
- Emin olmak izleme araçları doğru bir şekilde ayarlanmıştır.
Sürüm numaraları, yama düzeyleri ve ayarlar dahil olmak üzere bu yapılandırmaları kaydedin, böylece devralma testinden sonra bunları doğrulayabilirsiniz. Bu adımlar sistemin test için hazır olduğundan emin olmanızı sağlar.
Veri Senkronizasyon Durumu
Sistem yapılandırmalarını inceledikten sonra, veri senkronizasyonunun beklendiği gibi çalıştığını doğrulayın:
- Replikasyon gecikmesini ölçün.
- Veritabanı tutarlılığını kontrol edin.
- Dosya sistemi senkronizasyonunu doğrulayın.
- Veri bütünlüğünü doğrulamak için kontrol toplamlarını kullanın.
Gerçek zamanlı senkronizasyon göstergelerine odaklanın. Çoğu iş uygulaması için, çoğaltma gecikmesi 60 saniyenin altında olmalıdır. Bu, verilerin devralma testi için hazır olduğundan emin olmanızı sağlar.
Yedekleme Sistemi Kontrolü
Yedekleme sisteminin hazır olduğunu doğrulamak için sistemi iyice inceleyin:
Donanım:
- Güç sistemlerini ve soğutmayı kontrol edin.
- Depolama kapasitesinin ve performansının gereksinimleri karşıladığından emin olun.
- Ağ arayüz kartlarını doğrulayın.
- Fazla bileşenleri inceleyin.
Yazılım:
- İşletim sistemi sağlığını değerlendirin.
- Uygulama bağımlılıklarının çalıştığını doğrulayın.
- Yedekleme araçlarını ve yardımcı programlarını kontrol edin.
- İzleme ajanlarını doğrulayın.
Erişim Kontrolleri:
- Kimlik doğrulama sistemlerini test edin.
- Kullanıcı izinlerini inceleyin.
- Güvenlik sertifikalarının geçerli olduğunu onaylayın.
- VPN bağlantılarını doğrulayın.
Bu kontroller yedekleme sisteminin tam olarak çalışır durumda olmasını ve yedekleme testine hazır olmasını sağlar.
Ağ Kontrolü
Aşağıdaki ölçütleri kullanarak ağ bağlantısını değerlendirin:
| Test Türü | Kabul Kriterleri | Yöntem |
|---|---|---|
| Gecikme | 50ms'nin altında | Ping testleri |
| Bant genişliği | 1 Gbps'den fazla | iperf3 testi |
| DNS Çözümlemesi | 100ms'nin altında | kaz/nslookup |
| Yük Dengeleyici | Aktif/pasif durumu | Sağlık kontrolleri |
Tüm olası devralma yollarının kapsandığından emin olmak için bu testleri farklı ağ segmentlerinden çalıştırın. Devir işlemi sırasında ve sonrasında karşılaştırma için temel performans ölçümlerini belgelendirin.
Ek olarak, yedekli ağ yollarının yapılandırıldığını ve kullanılabilir olduğunu doğrulayın. Uygulanabilirse ağ bileşenleri için otomatik devralmayı test edin ve birincil ve yedek siteler arasında tüm gerekli bağlantı noktalarının ve protokollerin açık olduğundan emin olun.
sbb-itb-59e1987
Failover Testini Çalıştırma
Hazırlık kontrollerini tamamladıktan sonra, olası kesintileri en aza indirmek için yedekleme sürecini dikkatli bir şekilde sürdürün.
Failover'ı Başlat
- Paydaşları en az 15 dakika önceden bilgilendirin.
- Tüm işlemleri duraklatın ve çoğaltma gecikmesi olmadığını doğrulayın.
- Yedekleme dizisini başlatın ve tam başlangıç saatini kaydedin.
Sistemin başlangıçta nasıl yanıt verdiğini yakından takip edin. Yedekleme süreci genellikle 30-45 saniye sürmelidir. Daha uzun sürerse, hemen araştırın. Süreç başladıktan sonra, ortaya çıkan sorunları belirlemek için odağınızı gerçek zamanlı günlük izlemeye kaydırın.
Sistem Günlüklerini İzle
Sorunları erken tespit etmek için sistem kayıtlarının izlenmesi çok önemlidir:
| Günlük Türü | Uyarı İşaretleri | Kritik Uyarılar |
|---|---|---|
| Başvuru | Bağlantı zaman aşımı | Hizmet çöküyor |
| Veritabanı | Çoğaltma hataları | Veri bozulması |
| Ağ | Paket kaybı > 1% | Bağlantı hataları |
| Güvenlik | Kimlik doğrulama gecikmeleri | Erişim ihlalleri |
Gerçek zamanlı mesajları izlemek için komut satırı arayüzünü (CLI) açık tutun. "FAIL" veya "ERR" ile başlayan hata kodlarına ekstra dikkat edin, çünkü bunlar genellikle acil dikkat gerektiren acil sorunları işaret eder.
Yedekleme Sitesini Kontrol Edin
Yedeklemeyi başlattıktan sonra yedekleme sitesinin düzgün çalıştığını doğrulayın:
1. Hizmet Kullanılabilirliği
Yedekleme sitesindeki tüm temel hizmetlerin 60 saniye içinde 'AKTİF' durumunu gösterdiğinden emin olun. İnceleme için herhangi bir gecikmeyi not edin.
2. Kaynak Kullanımı
Geçiş sırasında bu kritik ölçümleri izleyin:
- CPU kullanımı: 80%'nin altında kalmalıdır.
- Bellek kullanımı: 75%'nin altında bir kullanım hedefleyin.
- Depolama G/Ç: 2.000 IOPS'un altında tutun.
- Ağ verimi: 40-60%'nin normal seviyelerde kullanılması beklenir.
3. Yük dağılımı
Trafiğin yedekleme sitesine doğru şekilde yönlendirildiğini doğrulayın. Trafiğin kullanılabilir kaynaklar arasında eşit şekilde dağıtıldığından emin olmak için yük dengeleyici ölçümlerini kontrol edin.
Uygulamaları ve Verileri Test Edin
Önemli uygulamaları hemen test edin ve veri bütünlüğünü doğrulayın:
- Çekirdek Uygulama Testi: Temel CRUD işlemlerini gerçekleştirin, kullanıcı kimlik doğrulamasını test edin, kritik iş akışlarını kontrol edin ve API yanıt verebilirliğini onaylayın.
- Veri Doğrulama: Veritabanı tutarlılığını sağlayın, dosya sistemi bütünlüğünü doğrulayın, son işlemleri onaylayın ve veri alma hızlarını test edin.
İkincil sistemlere geçmeden önce görev açısından kritik uygulamaları test etmeye odaklanın. Temel ölçümlerden 20%'den fazla sapan tepki süreleri gibi düzensizlikleri belgelendirin.
Failover Sonrası Test Etme
Yedekleme sitesi kurulduktan ve çalışmaya başladıktan sonraki adım, temel iş fonksiyonlarının düzgün çalıştığından emin olmaktır. Bu, her şeyin gerektiği gibi çalıştığını doğrulamak için işlemleri dikkatlice kontrol etmeyi ve doğrulamayı içerir.
İşlev Kontrolü
- Harici entegrasyonlar da dahil olmak üzere iş akışlarını ve veri akışını sorunsuz bir şekilde onaylamak için tam bir işletme işlem döngüsü çalıştırın.
- Önceki uygulama testlerinde ele alınmayan harici sistemlerle anahtar bağlantıları test edin.
- Zamanlanmış tüm görevlerin zamanında yürütüldüğünden emin olun.
- Herhangi bir tutarsızlığı önlemek için raporlama sisteminin doğruluğunu kontrol edin.
Bu adımlar, yedekleme ortamının kritik işlemleri kesintiler olmadan idare edebileceğini doğrulamaya yardımcı olur. Bu doğrulamaları birden çok kez çalıştırmak tutarlı performansı garanti eder ve herhangi bir sorunu hızla çözmenize olanak tanır.
Ana Sisteme Geri Dön
Yedekleme sisteminin düzgün çalıştığını doğruladıktan sonra, birincil sisteme geri dönme zamanı gelir. Bu, normal işlemleri geri yüklemek için önceki adımların tersini yapmayı içerir.
İade Sürecini Başlat
Tüm ilgili paydaşları bilgilendirin ve teknik ekiple koordine olun. Veritabanı senkronizasyonu ve uygulama geçiş zamanlaması dahil olmak üzere sürecin her adımını izlemek için bir kontrol listesi hazırlayın.
Şunları yaptığınızdan emin olun:
- Tüm kritik süreçlerin tamamlandığını teyit edin.
- Bekleyen işlem kalmadığından emin olun.
- Geri dönüş sırasında referans olması için geçici yönlendirme kurallarını belgelendirin.
- Sistem işlemlerinin beklendiği gibi çalıştığını doğrulayın.
Veri Senkronizasyonunu Doğrulayın
Sistemler arası veri tutarlılığını şu şekilde kontrol ederek sağlayın:
- Veritabanı işlem kayıtlarının doğru bir şekilde tekrarlanması.
- Dosya sistemi değişikliklerinin tam senkronizasyonu.
- Zaman damgalı kayıtların sistemler arasında hizalanması.
- Yedekleme sırasında kullanılan geçici dosyaların kaldırılması.
Son geçişe geçmeden önce, devralma sırasında değiştirilen tüm verilerin sistemler arasında eşleştiğini doğrulamak için kontrol toplamları veya karşılaştırma yazılımları gibi araçlar kullanın.
Birincil Sistemi Denetleyin
Birincil sistemin hazır olduğunu doğrulamak için kapsamlı bir sağlık kontrolü gerçekleştirin:
- Altyapı Durumu: Tüm donanım bileşenlerinin çalışır durumda olduğunu doğrulayın.
- Ağ Bağlantısı: Yönlendirme yapılandırmalarının doğruluğunu kontrol edin ve onaylayın.
- Uygulama Hizmetleri: Uygulama servislerini doğru sırayla başlatın.
- Güvenlik Sistemleri: Tüm güvenlik önlemlerinin aktif ve çalışır durumda olduğundan emin olun.
Sonuçları Belgeleyin
Birincil sistem tamamen restore edildikten sonra, gelecekteki süreçleri iyileştirmek için sonuçları kaydedin:
- Test Metrikleri
Arıza yedekleme süresi, veri senkronizasyon süresi, sorun sayıları ve performans karşılaştırmaları gibi önemli ölçümleri kaydedin. - Sorun Belgeleri
- Herhangi bir hata mesajını ve çözümlerini not edin.
- Ayrıntılı sorun giderme adımları atıldı.
- Yedeklemenin işletme üzerindeki etkisini değerlendirin.
- İyileştirme Alanları
- Süreç verimsizliklerini veya darboğazları belirleyin.
- İletişimdeki boşlukları vurgulayın.
- Belgelemenin iyileştirilebileceği alanları belirtin.
- Karşılaşılan teknik kısıtlamaları giderin.
Tüm belgeleri, felaket kurtarma ekibinin gelecekte referans olması için erişebileceği merkezi bir konumda saklayın.
Özet
Manuel devralma testi dikkatli planlama, kapsamlı kontroller, hassas yürütme ve sorunsuz bir kurtarma sürecini içerir. İşte temel aşamaların bir dökümü:
- Planlama: Hedefleri tanımlayın, bağımlılıkları haritalayın, rolleri atayın ve olası riskleri ele alın.
- Doğrulama:Altyapının hazır olduğundan, verilerin senkronize edildiğinden, ağların bağlı olduğundan ve güvenliğin sağlam olduğundan emin olun.
- Uygulamak:Adım adım yedeklemeyi gerçekleştirin, gerçek zamanlı olarak izleyin, uygulama işlevselliğini kontrol edin ve performans ölçümlerini takip edin.
- İyileşmek: Birincil sistemleri geri yükleyin, verilerin doğru olduğunu onaylayın, hizmetlerin çalıştığından emin olun ve tüm süreci belgelendirin.
Yedekleme testlerinizi geliştirmek için:
- Testleri üç ayda bir planlayın.
- Dokümantasyonu güncel tutun.
- Uzmanlığı artırmak için ekip sorumluluklarını dönüşümlü olarak değiştirin.
- Her testten sonra sürecinizi değerlendirin ve iyileştirin.
İyi yürütülen bir devralma testi, kesintiler sırasında iş operasyonlarını sürdürme yeteneğinizi güçlendirir. Kontrollü bir ortamda gerçekçi senaryoları simüle etmek, üretim sistemlerinizi riske atmadan güvenilir sonuçlar sağlar.