UPS sunucuları doğru sırada yeniden başlatacak şekilde nasıl yapılandırılır?


12

Burada bazı sunucularımız var ve neredeyse her birinin özel bir UPS'si var. Aralarında bağımlılıklar vardır, bu yüzden doğru sırayla açılmalıdırlar. Nihayetinde güç kaynağı ile ilgili ciddi sorunlar yaşıyoruz, bu yüzden güç geri geldiğinde sunucular kapanıyor ve rastgele bir sırayla yeniden başlatılıyor. Bir elektrik kesintisi sırasında sunucuların kapatılması bir sorun değildir, güç geri geldiğinde herhangi bir insan müdahalesi olmadan doğru çalışması önemlidir.

UPS'lerimiz oldukça ucuz ve hedefim için yararlı olan tek yapılandırma parametresi power the load xx seconds after power is restored. Teoride, her UPS'e doğru gecikmeleri koyarak sunucunun yeniden başlatma sırasını düzeltebilirim, ancak UPS'in beklendiği gibi davranacağına inanmıyorum.

Gitmek için doğru yol mu?
Yüksek seviyeli UPS, yeniden başlatma sırasını düzeltmek için başka seçenekler sunuyor mu?
Son bir not: Ups'um 1000 - 2200 VA aralığında


1
Bu, sunulan güzel şeylerden biridir systemd- başlangıç ​​sürecinde uygun bağımlılıkları tanımlama yeteneği. Y hizmetini başlatmayı denemeden önce X hizmetinin hazır olmasını bekleyin.
MSalters

1
@MSalters AFAIK systemd bağımlılık yönetimi, yalnızca birimler aynı systemdörnek tarafından işlendiğinde çalışır ve tamamen farklı sunucularda çalışan hizmetler için
çalışmaz

1
@HBruijn: Bir çeşit ağ bağları, örneğin sunucular arasında çalışır. Yani, sunucu1 sunucu2 tarafından barındırılan bir dosya sistemini bağlarsa, sunucuya bağlı olan serve1'in hizmetleri sunucu2 bu hizmetleri başlatana kadar duraklar. Ve IIRC, sunucuların DHCP'yi beklemesini de sağlayabilirsiniz (bana bir sunucunun neden DHCP kullandığını sormayın, ancak bir cevapta belirtildi)
MSalters

Yanıtlar:


25

Bunun standart cevabı "hiç değil". Yeniden başlatmaları rastgele sırayla işlemek için yazılımı düzeltin. Öncelikle SOME sunucularına gerçekten ihtiyacınız varsa (örnek: Active Directory), bunları çok daha uzun süren USV'lere koyun. Düşük güçlü atom tabanlı bir sunucu, Active Directory denetleyicisi olarak yeterince iyidir ve küçük bir USV'de bir gün hayatta kalacaktır.

Yüksek seviyeli UPS, yeniden başlatma sırasını düzeltmek için başka seçenekler sunuyor mu?

Hayır. Genelde programcıların konuyu düzgün bir şekilde çözebilecek kadar yetkin oldukları varsayılır.

Yapabileceğiniz şey:

  • Sunucuların "rastgele" başlatılmasını sağlayın. DHCP / Active Directory dışında, düzeltilemeyen bir sipariş talep eden hiçbir şey yoktur.
  • Bir süre sonra (5 dakika) çeşitli makinelerdeki hizmetleri doğru sırayla başlatın.

Bu tür bir kurulumun çok daha yaygın olduğunu söyleyebilirim. REQUIRES sunucusunun belirli bir sırayla (saf altyapı dışında) başladığı herhangi bir yazılımı kırık ve iş için uygun olmayan olarak adlandırırım.

Not: kendi kurulumumuz, sunucular için düşük maliyetli 20kva USV (bir tane kullandığımız için düşük maliyetli), ağın (ve yedek makinenin) "kökü" olarak hizmet veren bir makine için köle 2000VA USV ile. Slav, USV'nin büyük olanın arkasında olduğu anlamına gelir - bu nedenle yalnızca büyük olanı (bilgisayar ağımızın ne kadar çevrimiçi olduğuna bağlı olarak yarım saat ile 8 saat arasında süren) terminal kapanmaya başladığında bataryaya geçer.


2
Bunun bazen söylenenden daha kolay olduğunu düşünüyorum (dediğin gibi AD, bariz bir örnek) ama katılıyorum. Doğru çözüm, sunucuların veya hizmetlerin başlangıç ​​sırası gibi şeylere olan bağımlılıkları ortadan kaldırmak için çalışmaktır. Başka bir şey yoksa, örneğin, bir web uygulamasında, "Arka ucuma bağlanamazsam," uyu "ve korkunç bir şekilde çökmek yerine daha sonra tekrar deneyin" kodunu yazmak mümkün olmalıdır.
Rob Moir

AD ile ilgili sorun AD bile değil - çoğunlukla dhcp sunucusundan önce çevrimiçi olan bilgisayarlar için hazırlanmamış IPv4 DHCP'dir. Ipv6 bunu idare eder;)
TomTom

Bu doğru. IPv4 bir acıdır ... ve hala insanları buraya neden "bu yeni çıkmış IPv6 çöpü" ile uğraşmamız gerektiğini soruyorum.
Rob Moir

1
"Genellikle programcılar bu sorunu çözmek için yeterince yetenekli olduğu varsayılır" - fazla programlama yapmamalısınız! Hayır, tüm ciddiyetle, bir sistemin belirli bir düzende gündeme getirilmesi için çok büyük nedenler vardır. Evet, yazılım "zarif bir şekilde başarısız" ve kopmuş bağlantıları yeniden denemelidir, ancak bu her zaman mümkün değildir. Hatırladığım kadarıyla, güzel PDU'ların bazıları ayrı bağlantı noktalarını başlatma / durdurma yeteneğine sahiptir, bu yüzden orada bir şeyler yapılabilir.
SnakeDoc

1
"USV" yi aramak zorunda kaldım ve "İnsansız yüzey aracı" buldum. Bunun yanlış olduğunu biliyorum, ama doğru olmasını istiyorum.
Braiam

14

Yönetilen Güç Dağıtımları Birimler (UPS yerine), güç yeniden başlatıldıktan sonra ayrı ayrı çıkışların etkinleştirilmesinde genellikle özelleştirilmiş gecikmeleri destekler.

Tipik olarak, sistem dolu bir kabin güç geri geldikten hemen sonra aynı anda açıldığında devre kesicilerin açılmasını önlemek, ancak sistem bağımlılıklarınızın önyükleme sırasını korumak için de kullanılabilir.


Evet, doğru. Bu gelişmiş bir işlevselliktir ve USV'nin aslında sunuculara bağlı olduğu varsayılmaz - ancak ayrıntıları işlemek için PDU'ları kullanan raflara güç sağlar.
TomTom

6

Tam olarak bu sorunu yaşadım. Tek fark sağlam rafa monte edilmiş APC güç ünitelerine (örneğin APC SmartUPS 3000 ) yatırım yapmamızdı . APC PowerChute ağ kapatma yazılımı ( PowerChute Ağ Kapatma yazılımı) ile , sunucuları belirli bir sırayla kapatabilir ve getirebilirim. Yazılımın bir başka kullanışlı özelliği de sunucuları son dakikada kapanacak şekilde ayarlamaktı, yani APC birimlerinin ne kadar pil gücü bıraktığını hesaplamak ve sunucuları sadece kapatmak yerine düzgün bir şekilde kapatmak için yeterli zamanla kapatmaktı.

Yazılım ... kullanıcı dostu değil ama anlamaya zaman ayırırsanız zor bir şey değildir. Altyapınıza daha fazla yatırım yapmak istiyorsanız, bu kesinlikle gidilecek yoldur.


1
Apc Smart Ups'umuz da var, bazıları nispeten eski ve belki de zayıf pilleri var. Üretimde oldukları için üzerinde bazı testler yapmak zordur. Ayrıca herhangi bir ucube yükümüz yok, yani ani bir gücü sorunsuz bir şekilde yükleyebilen bir yük demek istiyorum. UPS'in her zaman bir elektrik kesintisini simüle ettiğimde beklediğimden farklı davrandığını, bunun yanlış bir konfigürasyondan kaynaklanabileceğini, ancak bu UPS'in çok güvenilir olmadığını hissediyorum.
Filippo

@Filippo kesinlikle YMMV ama 3 yıl devam etmek için PowerChute yazılımını kullanan birden fazla sitede SmartUPS 3000 ve 3000XLM'lerin bir karışımına sahibim ve yazılımı anladıktan sonra, kesinlikle bir öğrenme eğrisi var ve bazı testler gerekli, oldukça sağlamdı.
Winski Tech

2

UPS ünitelerinin düşük maliyetli olduğu ve güç geri geldikten sonra belirli bir çıkış bekleme süresi için yapılandırılamadığı anlaşılıyor (bazı yüksek uç üniteler). Aynı işlevselliği elde etmek için, her zaman hemen açmak için belirli bir ana bilgisayar seçmeniz gerekir (belki herhangi bir zamanda herhangi bir sistemin önyükleme yapmasına izin verilir) ve diğer tüm sunucuları kapalı durumda (bios'ta güce geri dönmek için yapılandırılmış) AC uygulandığında söner ve söylendiğinde açılması için Wake On Lan sihirli paketini onurlandırmak için). Ardından, önyükleme yapan ana ana bilgisayarda, WOL sihirli paketinin her ana bilgisayara iletilmesini zamanlamak için bir komut dosyası / yardımcı program çalıştırın.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.