Soru Ubuntu'nun uzaktan yükseltilmesi: Sunucuyu kaybetme riskini en aza indirmek nasıl?


Arka fon: Raid denetleyicisi ile uyumsuzluk nedeniyle bir sunucuyu Ubuntu 8.04 LTS'den 10.04 LTS'ye yükseltmeye zorladım.

Sunucuya internet bağlantısı biraz kararlıdır ve nadiren düşer. Buna rağmen, yükseltmeyi yaparken SSH üzerinden bağlantıyı kaybetmekten endişe duyuyorum ve sunucuyu ulaşılamaz bir halde bırakıyorum. Ben de sorun ne olduğunu bilmek mümkün olamayacak durumda, yükseltme sonra önyükleme yapamaz sunucu hakkında endişeleniyorum.

Hareket planı: Aradığım şey tavsiye küçültmek Sunucu kaybetme riski, yaptığım şeyin çok riskli olduğunun farkındayım. Bu benim mevcut eylem planım:

1) Yerel ve harici olarak önemli olan her şeyi yedekleyin.

2) Önyükleme zamanı disk denetimlerini fsck ile geçici olarak devre dışı bırakın. (Disk kontrolünün tamamlanması uzun zaman alacaksa ne olacağı hakkında hiçbir fikrim olmayacaktır). Bu, son parametrenin 1'den 0'a değiştirilerek fstab üzerinden gerçekleştirilir:

UUID=5b1ff964-7608-44fd-a38d-7e43ad6b4c11 /               ext3    relatime,errors=remount-ro 0       0

3) Tüm yükseltme işlemlerini ekranla başlayarak bağlantıyı kaybedersem devam edebilmelerini sağlayın. yani:

sudo screen apt-get upgrade

Sorular:

  • Önerilen eylem planım makul görünüyor mu?
  • Önyükleme zamanı diskini devre dışı bırakmak kötü bir fikir olup olmadığını kontrol ediyor mu?
  • Sunucu kaybetme riskini azaltmak için başka neler yapılabilir?

Güncelleme: Hemen hemen tüm cevaplar, şimdi yaptığım DRAC / IPMI'yi kurmamı önerdi. Bu, KVM / konsol yönlendirme üzerinden tüm güç döngüsünü takip edebildiğimden, riski çok daha küçük hale getirecek gerçekten harika bir başarı gibi görünüyor. Gelecekteki referanslar için, yaptığım şey bu:

1) IPMI v2.0 için IP adresi, ağ geçidi vb. Kurmak için kurulu ipmitool:

sudo ipmitool lan set 1 ipaddr 192.168.1.99 
sudo ipmitool lan set 1 defgw ipaddr 192.168.1.1

2) NIC seçim modunu paylaşılacak şekilde değiştirmek için ücretsiz-ipmi kurdum (ağa bağlı tek bir ağ arayüzüm var):

sudo ipmi-oem dell set-nic-selection shared 

3) Kullanılan DRAC'ın https arayüzü https://192.168.1.99 konsol yönlendirme görüntüleyicisini başlatmak için Bu, tüm önyükleme sırasının yanı sıra BIOS, baskın denetleyicileri vb. Yapılandırmayı da sağlar.


Güncelleme 2. Tamamlandı. Hepsi bir çekicilik ile gitti, işi yapmak için 30 dakikadan az sürdü. Yeniden yönlendirilen konsol istediğimde onu kesebilme özgürlüğü verdiği için disk kontrolünü kapatmamaya başladım, ama sonuna kadar çalışmasına izin verdim.

Teşekkürler beyler, bilgelik paha biçilmez! 


6
2017-10-04 11:33


Menşei


İLO / DRAC gibi bant dışı sunucu yönetimi yeteneğiniz yok mu? - Chopper3
İyi işaretçi. Onun bir dell R710 ve iDRAC6 var, ama ne yazık ki yapılandırılmış olduğunu düşünmüyorum. Bununla birlikte, bunun içine gireceğim. Teşekkürler! - Avada Kedavra
Kesinlikle. Bir uzak sunucu 8heck, herhangi bir sunucu) böyle şeyler ile başa çıkmak için izin veren bir ILO tahta veya benzer bir şey olmalıdır. - TomTom
Bir demo kutusuna ihtiyacınız varsa, 30 gün boyunca kiralayabileceğiniz bir borç veya demo modeli için bir Dell temsilcisine başvurmayı düşünün. - zerolagtime
ILO anakartları "ISO imgesi monte etme" yeteneğine sahip olabilir, ancak iDRAC6'nın yapıp yapmadığından emin değilim. Eğer öyleyse, RAID denetleyicisinin bilgisine sahip bir kurtarma CD'si isteyeceksiniz, böylece sistemin yapılandırmasını değiştirebilir ve yeniden başlatmayı deneyebilirsiniz. Kurtarma CD'nizin beklendiği gibi çalışıp çalışmadığını görmek için uzaktan yeniden başlatmayı bile deneyebilirsiniz. - zerolagtime


Cevaplar:


Donanım kırılmazsa, bir seri konsol ile yapamayacağınız bir şey yoktur, işte bu yol:

  • Seri konsola uzaktan erişim sağlayın (sistem> = IPMI-2.0 ise minibüs üzerinde IPMI seri veya minicom'u çalıştıracağınız başka bir sisteme bağlı boş modem seri kablosu)
  • seri konsolu kullanmak için grub ve linux yapılandırın
  • Mümkün ise sistem BIOS arayüzünü seri olarak yeniden yönlendirin (birçok sunucu sistemi bunu yapabilir)
  • sistemi yeniden başlatın ve (bios), gruba bakın, dmesg'e bakın, init betiklerini görün ve seri konsolun her yerine giriş yapın.
  • yükseltmeyi çalıştır
  • parmaklarını çapraz

Ayrıca, yeni sistemi mümkün olan her durumda başka bir diske veya bölüme kurun, böylece eski sistemi silmeden önce yeni sistemi test edebilirsiniz. Bunu genellikle iki disk sistemi ile yapıyorum: Aynadan bir disk alıyorum, boş diskle yeni (bozulmuş) bir ayna yaratıyorum, oraya kurun, her şey yolundaysa eski aynayı yok edip 'eski' diski yeni aynaya ve yeniden oluşturmaya izin verin.

DÜZENLEME: IPMI2 olması gereken bir Dell R710, AFAIK olduğunu okudum. Ipmitool'ü sistem üzerinde yerel olarak çalıştırarak yapılandırın ve başka bir sistemde ipmitool sol etkinleştirmesini kullanarak seri üzerinden LAN özelliğini test edin. Bang! Seri konsolun var. Dells ayrıca, BIOS'u seri konsolda yeniden yönlendirebilir (bu IPMI, sıralı olarak seri olarak yeniden yönlendirir). Bir şey gerçekten kötü giderse, sisteme erişmek için bunu yapmalıydınız. Ben bir çift eski Dell PE1425'i bios, grup, sistem seri konsolları ve bir çift Dell R300 ile aynı şekilde ama gerçek seri kablo yerine IPMI seri üzerinden LAN null modem kabloları kullanarak yönetiyorum.


2
2017-10-04 11:57



Gerçekten çok ilginç! Bu şeylerle ilgili jack bilmiyorum, bu yüzden ondan ne kadar kullanabileceğimi kontrol etmem gerekiyor. Gerçekten iyi bir işaretçi olsa da, iDRAC6 arayüzünün yanı sıra bunu da takip ediyorum! - Avada Kedavra
Merhaba Luke. Bu ucu son derece kullanışlı buluyorum ama DRAC'ın “NIC seçim modu” nu “ipmitool” kullanarak “paylaşma” olarak ayarlayamıyorum (IP ayarları vb. Değiştirilebilir). Sunucu buradan uzak olduğu için bu parametreyi ayarlamak için yeniden başlatamayacağım ve bu parametre "adanmış" olarak ayarlandığı sürece sunucuya bağlanamıyorum. Bununla ilgili nasıl bir öneriniz var? (Her şeyi test etmek için yerel bir yedek sunucum var). - Avada Kedavra
Yeey, bunu yapmanın bir yolunu buldu: freeipmi-tools'ları ve sudo ipmi-oem dell set-nic-selection shared - Avada Kedavra
OMG, bu harika! Aydınlanmış hissediyorum! DRAC / IPMI / Konsol yeniden yönlendirme kurulumudur ve KVM ile tüm yeniden başlatmayı takip edebilirim. Çok teşekkür ederim! - Avada Kedavra
aydınlanmış ve her şeyi hissetmek güzel bir şey, ama lütfen yaptığınız şey prod sistemlerinde yapılacak bir şey değil, ve uzak sistemin kontrolünü kaybetme ve / veya temiz bir kurulum için silmek zorunda olduğunuzu unutmayın. lan'da bir önyükleme sunucunuz varsa, seri konsol aracılığıyla uzaktan yapılmalıdır) her zaman olası bir sonuçtur. konsol sadece kontrol altında olmanıza izin verecek, böylece çözebileceksiniz basit önyükleme sorunları ve / veya tamamen berbat olduğunuzda / şüpheniz varsa bilebilirsiniz. - Luke404


Şahsen, bu sunucunun (işiniz vb.) Sizin için ne kadar önemli olduğuna bağlı olarak, ellerimi benzer bir sisteme alıp çevreyi yeniden üretmeye ve daha sonra odadaki SSH yoluyla yükseltmeye çalışacağım (ya da fiziksel olarak size erişebilir) ) böylece prosedürünüzü test edebilirsiniz. Yapılandırmanızı / bağlantınızı kaybetmeden bunu yükseltebilirseniz, uzak sunucuyu yükseltmek için oldukça iyi bir şansa sahip olursunuz.

Bu,% 100 kesin olmayacaktır, ancak en azından, test sistemini mümkün olduğunca uzak sunucunuza yapılandırılmış olarak yapabileceğiniz sürece, yazılım yükseltmelerinin, yazılım yapılandırmasının, değişikliklerin ve benzerlerinin neden olduğu hataları ortadan kaldırmalıdır.

DÜZENLEME: Başka bir çözüm, ilk olarak yük devretme olarak ikinci bir sunucu oluşturmaktır. Bu şekilde sunucu ölürse, birincil sunucu geri gelene kadar müşteriler / kullanıcılar için hala bir yedeklemeniz olur. Bu, deneyimlediğiniz bazı kelebekleri, uzaktaki bir sunucuya sahip olmakla azaltacaktır. Yine de, bu durum pek çok durumda aşırı olabilir, ancak bu şirket sunucunuzun şirketinize ne kadar önemli olduğuna ve etki kesintilerinin ne kadar zaman harcayacağınıza bağlı olarak ne kadar harcama yapmak istediğinize bağlı olacağına bağlıdır. toplam başarısızlık.


2
2017-10-04 11:59



Daha önce SSH üzerinden yükseltilen 5 yerel sunucuyu zaten yükselttim. Tüm yükseltmeler sorunsuz çalışıyor. Ama bu sunucu Avustralya'da bulunuyor ve İsveç'te oturuyorum, bu yüzden bu sefer daha fazla dikkat etmem gerekiyor. Ve maalesef bu sunucu bizim için gerçekten önemli: / - Avada Kedavra
Uzak konsol erişim donanımı hala büyük bir yardımdır, ancak NASA'nın astronotlara yardım etmek için bir çözüme ihtiyaç duyduğu Apollo 13 filmini hatırlattım ve uzaktan ortamlarını çoğaltan çözümler bulmak için simülatörlerle yere test etmeye başladılar. Yaptığınız gibi çalışmanız gerektiğine inanmak için bir nedeniniz var gibi geliyor ve neyin yanlış gidebileceği konusunda endişeleniyorsunuz. Bunun için ne kadar çaba harcayacağınız önemli değil. olasılık. - Bart Silverstrim
Tüm bildiğiniz için, bir sürücü yeniden başlatma sırasında başarısız olabilir veya birim erişiminizi öldürebilecek bir sürücü değişebilir. Cevabımda da ikinci bir düşünce düzenliyorum ... - Bart Silverstrim
Evet, bunun benim beğenime göre çalışacağına inanıyorum ve sadece yanlış gitmesi için daha az şey yapmasını istediğim şeyleri arıyorum. Ayrıca, ekstra donanım getirmeden veya yeniden sarmak için harici bir yardım almadan da bunu denemeyi istiyorum. Bir yük devretme çözümünün kullanılması, biraz aşırı bir yük getiriyor. Düşüncelerinize minnettarım! - Avada Kedavra


Bant Dışı Yönetim (HP'nin iLO'suna en aşina olduğum) veya IP KVM'nin bile en iyi bahis olacağını düşünüyorum.

Bart'ın belirttiği gibi, eğer kaynaklara sahipseniz, test etme paha biçilemezdir (okuyun: yedek bir benzer kutu veya başka bir grup üyesi).

Son olarak, (veya aslında, aslında) Yedekler. Test Edilmiş Yedeklemeler. Gurur duyabileceğin yedekler ...


1
2017-10-04 12:09