Soru Bir sunucunun sabit diskini arıza yapmadan önce değiştirmek için bir neden var mı?


Sadece hızlı bir soru: Bir sunucunun sabit diskini, hata yapmadan önce x yıl sonra (sonunda bir noktaya kadar) değiştirmenin bir sebebi var mı yoksa hata yapana kadar mı bırakmalıyım? Ben gerçek sunucu yönetimi ile biraz deneyimim var bu yüzden merak ediyorum ...


11
2018-05-21 12:21


Menşei


Bu kadar çok cevap almayı beklemiyordum, wow :) Hepsini gözden geçirdikten sonra ve a) Sunucunun harddrivesleri bunun için yeterliyse b) Yedekleme kesinlikle garantilidir (RAID + Replication Slave + günlük yedekleme bir dış kaynak) Bir sürücü değişikliği önermek için bir neden bulamıyorum. Hepinize teşekkürler! - Spiros


Cevaplar:


Bunu değiştirmenin en büyük nedeni, yanlış giden bir şeyin şansını artırırken yapılacaklar listenizde başka bir görev eklemek istiyorsanız.

Bir kenara şaka, gerçekten zaman önceden sürücüyü değiştirmek için duyduğum herhangi bir sebep yoktur. Eğer yerinde RAID varsa, zaten yerinde bir korumaya sahip olursunuz (iyi yedeklerinizin olduğu varsayılarak) ve atmak için ölü bir sürücü şeklinde atık malzeme üretmiyorsunuz ve gereksiz yere gereksiz yere çalışmak zorunda kalmıyorsunuz. sürücüden hassas veriler. Yeni sürücülere fazladan para harcamazsınız ve yine de, hala bir hata hatası kaynağı olarak görülmeyen ama olabilecek bir sürücü denetleyicisi gibi, hala yanlış gidebilecek şeylere karşı proaktif bir şekilde korunmayacaksınız.

Diğer yandan bu, RAID 5'de olduğu gibi, RAID ünitesinde alarm tetiklemeyen, düzeltilemeyen sürücü hatalarını keşfetmenize yardımcı olabilir. Bu şekilde ısırıldık ve bizden gelen çıplak metalden yeniden oluşturmaya ihtiyaç duyduk. Bu durumda, uygun bir yedekleme, kurtarmanıza yardımcı olacaktır.) Günümüzün daha büyük sürücü kapasitelerini ve kurtarılamayacak hata toleranslarını dikkate alan bir RAID düzeyi, eğer olmasa da, yedeklemeleri güne kaydetmemize yardımcı olacaktır.

Çoğu yöneticinin makul bir RAID ve yedekleme planı vardır, bu nedenle gereksiz yere sürücü değiştirerek fazladan atık üretmeye gerek yoktur.


8
2018-05-21 12:35





Proaktif olduğum için hepim ama bunu hiç yapmadım ve hiç kimsenin bunu yapmadığını hiç duymadım. Muhtemelen bir çeşit RAID kurulumunuz var ve söz konusu sistem (ler) için düzenli olarak meydana gelen geçerli yedeklemeler var.


5
2018-05-21 12:25



+1, hiç düşünmedim. Yalnızca bir diskin değiştirilmesi ve bir dizinin kasıtlı olarak tetiklenmesi, kalan üretim disklerini "çalıştırmanın" en iyi yolu gibi görünmemektedir. Yeniden inşa edildiyse, sistemin neden kapalı olduğunu patrona açıklamak zorlaşır. - jscott
SMART hataları olan diskleri değiştirdim, ancak teknik olarak çalışsalar bile, bunların başarısız olduğunu düşünürdüm. - Chris S


Bunu düşünebileceğim tek zaman, aynı partiden bir sürü diskim olsaydı ve partideki diğerleri başarısız olmaya başladıysa, bunu düşünebilirim.

Uzamda sıkı olsaydım, o zaman kesinlikle yapardım - ama yaşlanmaktan başka bir sebepten ötürü değil mi? Hayır, çünkü ortalama İlk yıldaki başarısızlık oranı, diğer yıllardaki başarısızlık oranına benzer. (grafiğin 3 ay, 6 ay, 1 yıl boyunca ilk yılı bozduğunu, ancak 1 yıl boyunca başarısızlık şansını elde etmek için hepsini bir araya eklemeniz gerektiğini unutmayın). Ve yüksek disk kullanımına bakıldığında, ilk yılda bir sonraki üç yıldan daha fazla başarısız olma olasılığı daha yüksektir.

Geç sürücü arızasıyla ilgili tek korelasyon daha sıcak odadaydı ve sunucu odalarımızı serin tutuyoruz.


5
2018-05-21 13:06





Evet, performans ve kapasite. Eğer eski sabit disk 70MB / sn sürekli okuma ve 100 IOPS yaparsa ve potansiyel yedek 200MB / sn sürekli okuma ve 175 IOPS yaparsa ve aynı zamanda 3 kat kapasiteye sahipse, yeni sürücüler satın almanız ve sadece yeni için eskileri değiştirmeniz gerekecek performans / kapasite nedenleri. (ve bu rakamlar tamamen oluşturuldu, nokta daha yeni olabilir, daha hızlı olabilir).

Şimdi eski sürücülerle ne yapıyorsun? Bunları bir test sunucusunda kullanabilir ya da bunları bir disk dizisine yedeklemeye ekleyebilir veya acil yedek olarak onlara tutabilirsiniz. Ya da sadece onları silip bertaraf etmek için gönderebilirsin.

Şu an ortalama sunucunuz günler IO, işlemci bağlı olduğundan (veya en azından benimkilerden) daha fazla bağlı. Dolayısıyla, CPU zamanı veya Bellek kıtlığıyla ilgili sorunları olmayan eski bir sunucunuz varsa, bunları değiştirmek için kolayca satın alabileceğiniz şeylerin arkasında birkaç nesil olan sabit diskleri değiştirerek performansı önemli ölçüde artıracak bir alanınız olacaktır.


4
2018-05-21 13:28





Sabit sürücü arızası durumunda darbeye göre değişir.

RAID'iniz yoksa
Hizmetin durdurulması veya yüksek kullanılabilirlik nedeniyle ve verilerin çalışan bir yedeğiniz olması nedeniyle sunucu kullanılabilirliğini umursamıyorsanız. Tamam diyeyim, sürücünün ölmesine ve değiştirmesine ve başarısız olduğunda verileri geri yüklemesine izin verin.
Kullanılabilirliği önemsiyorsanız, RAID kullanacağım;)

RAID (1, 5, 6, ...) varsa
Diyelim ki, hatadan önce sabit sürücüyü neden değiştiriyorsunuz? RAID (ve yedekleme) bunun için var. Bir sabit diski değiştirmek, başarısızlıkla sonuçlanabilirse, bir şeyi kırma riski vardır (baskının yeniden yapılması her zaman risklidir)

Ama sadece bakış açım! Sürücünüzün çok eski olabileceğini düşünüyorsanız, sunucunuzu da değiştirmek isteyebilirsiniz.


3
2018-05-21 12:36





Bazı diskler 1 saat içinde ölür, diğerleri ise son 2 yıldır.

Başarısız veya başarısız olursa (genellikle S.M.A.R.T. izleme veya performans sorunları aracılığıyla kurabileceğiniz bir şey), atmak için tek neden, amaçlarınız için yeterince büyük veya hızlı değilse.


2
2018-05-21 12:28



Sadece sürücüyü S.M.A.R.T. ve genellikle çok geç olmadan başarısızlık belirtilerini gösterir. - Prof. Moriarty
@Prof Google'ın toplu disk çalışması, SMART'ın "genellikle" güvenilir% 44 -% 72 olduğunu gösterdi. static.googleusercontent.com/external_content/untrusted_dlcp/... - jscott


Disklerle, soru değil Eğer başarısız olacaklar ama ne zaman. Mekanik aygıtlardır (SSD'leri kullanmadıkça, ancak kendi uyarıları vardır), bu yüzden er ya da geç başarısız olurlar.

Disk üreticileri, üretim süreçlerini olabildiğince ucuz hale getirme eğilimindedir, çünkü binlerce disk üretirken ve sattığında disk başına tek bir kuruş bile önemli olabilir; ancak elbette, garanti süresinin bitiminden önce disklerinin arızalanmasını istemiyorlar ya da her zaman özgür kalacaklar; Bu yüzden, garanti kapsamı onları kapladığı sürece en az kadar harcayacak kadar harcayacaklar ... ama tek bir kuruş daha fazla değil.

Sonuç şu şekildedir: çoğu disk garanti süresi bittikten hemen sonra başarısız olma eğilimindedir. Bu elbette genel bir kural değil, sadece istatistikler ve diskiniz başarısız olabilir şimdi ya da artık ihtiyacınız olmayacak kadar devam eder ... ancak, istatistiksel olarak, garanti süresi dolduktan birkaç gün veya ay sonra başarısız olan birçok disk vardır.

Elbette, hala bunlara ihtiyacınız olmadığında yenilerini almak masraflı olabilir ... ancak garanti süresi dolduğunda bunları değiştirmek ve başarısız olmaları pahalıya mal olacaktır.

Şimdi, hala garantili iken başarısız olmalarını sağlayacak bir yol bulabilirseniz (ve süreçte veri kaybetmemek, yani iyi RAID'e sahip olmak) VE yedekler), iyi, bu optimal olurdu ;-)


2
2018-05-21 12:36





Çalışan bir güç kaynağını değiştirdiğimden daha fazla bir iş yerine geçmezdim. Her ikisi de sonunda başarısız olacak, ancak teknik olarak ya da maddi olarak, onları iyi bir neden olmadan değiştirecek hiçbir anlam ifade etmiyor. Sorun belirtileri göstermeye başladığında değiştirin.

Sabit diskler söz konusu olduğunda, eğer bir sürücü erken başarısız olursa, ilk yıl içinde bunu yapmaktan çok daha fazlası olacaktır. 6 yıl boyunca sorunsuz olarak çalışan sürücüler, normalde en az birkaç yıl daha çalışmaya devam etmek için güvenilebilir. Açıkçası, bunun için birçok istisna var ama genel eğilim.


2
2018-05-21 12:58



Bir güç kaynağı başarısız olduğunda (genellikle) veri kaybetmezsiniz ... - Massimo
@Massimo - Doğru, ancak bir sunucuda, genellikle bir sürücü arızalandığında verileri kaybetmezsiniz. Benim düşünceme göre, artıklık yoksa sadece bir yüceltilmiş iş istasyonu, gerçek bir sunucu değil. - John Gardeniers