Soru Bir SAN üzerinde "Zorunlu" boş alan?


SAN'ların uzmanı değilim. Burada, tedarikçimizin çözemediği görünen sürekli ve zorlayıcı problemler hakkında bazı ipuçları almak için yazıyorum.

Video gözetim sistemimiz için temin edilen 16 x 2 Tb diskli bir ENHANCE ES3160P4 SAN sahibiz. SAN, tedarikçi tarafından bir RAID 5 dizisinde 14 disk kullanacak şekilde yapılandırıldı ve 2 disk de global yedeklerdir. RAID genellikle tüm RAID alanı boyunca yayılan eşit boyutta 2 sanal diske bölünür. Her biri 12 Tb'den fazla bir şey olur. Her sanal disk, video verilerini sürekli olarak depolayan ve gerektiğinde kullanıcıların kayıtları almasına izin veren tek bir video sunucusuna bağlı olan tek bir LUN'a karşılık gelir. LUN'lar NTFS ile biçimlendirilmiştir ve iSCSI aracılığıyla Windows Server 2012 videoservatörlerine eklenmiştir. Video oynatıcılar sahip oldukları alanı tamamen kullanma eğilimindedir.

Bu yapılandırmada SAN diskleri başarısız oluyor ve başarısız oluyor ve her defasında SAN RAID'i kurtaramaz, çünkü bu sırada başka bir disk arızalanır. RAID'i son birkaç ayda 4 kez kaybettik.

Bu sorun, kötü bir SAN örneğinden kaynaklanmıyor gibi görünüyor, çünkü aynı tipte benzer sorunları olan benzer şekilde yapılandırılmış diğer üç makineye sahibiz. Sadece bir sorun yok, ama şu anda az kullanılıyor.

Birkaç ay süren testler ve kontroller sonucunda, tedarikçi, SAN'ın% 100 kullanılmaması gerektiği ya da aynı zamanda fiziksel olarak hızlıca degrade olacağını ve sorunun çözülmesi için sanal disklerin oluşturulması gerektiğini söyledi. RAID'de mevcut toplam alanın% 10-15'ini kaldırarak.

Web’i problem için aradım ve bunu söylediği özel ifadeleri bulamadım. Bana öyle geliyor ki, tüm RAID'i kapsayan sanal diskler oluşturmak ve daha sonra LUN'ları kullanmak (Windows'un boş alana sahip olmasını ve parçalanmayı önlemek). Değilse, ENHANCE SAN'un neden bazı boş alanların kalması gerektiğine dair "iyi bilinen" tüm RAID'yi kapsayan sanal diskler oluşturmasına neden olduğunu ve tedarikçinin bu şekilde sistemi neden bu şekilde yapılandırdığını anlamıyorum. ... ama bu başka bir nokta.

Sonunda, bu durumu çözmek istiyoruz. Herhangi bir öneri kabul edilir. Dediğim gibi, bir SAN uzmanı değilim, ama o kadar çok problemden sonra, tedarikçinin ne olup bittiğini bildiğini gerçekten anlamak isterim, çünkü bu durumu artık kabul edemeyiz.

Şimdiden çok teşekkürler! Saygılarımızla

Düzenleme: disk türü Cevabı itibariyle ilgili bilgiler gibi görünüyor, ben disklerin tüm Western Digital model WD2001FYYG-01SL3 olduğunu ekliyorum.


8
2018-02-11 08:44


Menşei


Düzgün tasarlanmış herhangi bir sistem, düzgün çalışması için yedek alana ihtiyaç duyması halinde, müşteriler tarafından kullanılmasını gerektirmeden alan ayırır. Anlık görüntüler, uzaya ve Yazma Üzerine Kopyala dosya sistemlerine ihtiyaç duyabilir, ancak genellikle bu amaçlar için küçük bir rezerv vardır. En azından varsayılan olarak, tabii ki, risk almak isteyen kullanıcılar tarafından geçersiz kılınabilir. - ptman
En azından diskler iyi görünüyor, 7/24 SAS diskleri, ancak sık sık başarısız olmamalılar ... - Sven♦
İossue boş alan değil, aptal bir konfigürasyon. Bir Raid 5'teki 14 disk, matematik gibi sabit değildir, basittir. Raid 6 bile buna vergi ekleyebilir. Genellikle - 2tb diskli bir Raid, istatistiksel olarak sabit değildir. Dönemi. - TomTom
@TomTom: Basit bir matematik olduğunu düşünüyorsanız, lütfen matematiği gösteren soruya cevap verin. Peçete matematiğimin dizinin kararlı olduğunu düşmesi beklenmedik bir dizi yeniden oluşturmak için 13 * 2TB okuma başarısız eğer kararlı olduğunu söylüyor. Raid 6 tabii ki daha iyidir, eğer yeniden inşa çift hatayla karşılaşma ihtimalinin düşük olması durumunda stabildir. - MSalters
With this configuration the disks of the SAN are failing and failing, and each time the SAN cannot recover the RAID because another disk fails in the meanwhile. We lost the RAID like 4 times in the last few months. Bu tam olarak, TomTom'un dediği gibi disklerin RAID5 için çok büyük olmasından dolayıdır. Muhtemelen RAID 6 da FWIW. Başarılı bir yeniden inşa etme ihtimaliniz hiçbir zaman% 100'e yakın değildir ve bunu biliyorsunuz çünkü siz kendiniz, aylar içinde "4 gibi" başarısız yeniden inşa ettiğinizi belirttiniz. RAID yapılandırmanız aptaldır ve satıcınız bu kadar basit, yetersizdir. - HopelessN00b


Cevaplar:


Anlattığınız şeyden, asıl sorun, RAID5'i böyle bir büyük dizi için kullanmaya karar vermiş olmalarıdır ki bu, tam olarak nedeniniz için bu kurulum için oldukça kötü bir seçimdir: Kurtarma sırasında 2. disk başarısız olursa, her şey bozulur. ve bu ikinci başarısızlığın bu riski alması çok muhtemeldir.

Örneğin, RAID6 yerine, kurtarma sırasında 2. disk başarısız olursa başarısız bir diziye yol açmaz ve kurtarma, bir disk maliyetinin net depolama kapasitesine ve belirli bir performans etkisine göre normal şekilde ilerleyebilir.

% 15 boş alandan ayrılmanın bu sorunla nasıl yardımcı olacağını göremiyorum ve bu, dosya sistemi için performans görünüm noktasından iyi bir fikir olsa da, başarısız olan RAID ile açıkça ilgili değil. Ben buna saçmalık derim.

Tüm söylediklerim, şaşkınlığa yardımcı olamıyorum: Birkaç ay boyunca birden çok kez olmak, bir RAID5 sistemi için bile çok fazla gibi görünüyor. Kullanılan disk tiplerine bakmanızı öneririm - sadece satıcınız böyle bir sistemde kullanılmak üzere onaylanmış 7/24 sürücü yerine ucuz masaüstü sürücüleri kullanıyor olabilir.


10
2018-02-11 09:04



Girdiğin için teşekkürler. Disk türünü ekleme sorusunu düzenledim. - z2k


Bunun tamamen eski bir yazı olduğunu anlıyorum, ancak üretimde büyük RAID5 dizilerini görmeye devam ederken, düşüncelerimi buraya eklemek isterim.

  • Çok sık başarısız olan diskler genellikle kötü tasarlanmış sistemlerde veya kötü konumlarda bulunan aşırı ısınma ve / veya çok fazla titreşimdir.

  • böyle büyük RAID5 dizileri olmalıdır şiddetle kaçındı. Genel bir kural olarak çok RAID5 + hotspare bir yerine bir RAID6 dizisine sahip olmak daha iyidir. OP durumunda, 2x global hotspar'lar ile 1x parite diskine sahip olmak yerine, RAID6 konfigürasyonunda 2x eşlik diskine sahip olmak çok daha iyiydi;

  • Hata ve durum raporlaması için güvenilir bir sisteme sahip olmanın anahtarıdır: bilinmeyen şekilde bozulmuş, izlenmeyen bir dizi, felaket için bir reçetedir.


2
2018-02-03 17:46



Üretimde büyük RAID5 dizileri görmeye devam "Daha büyük olmalı!", Değil mi? Ben de böyle büyük diziler var KORKUNÇ Genel olarak zayıf geometri nedeniyle performans ve Diziler RAID6 ile oluşturulmuş olsa bile, aynı diziden paylaşılan birden çok LUN arasındaki çekişme. IME sadece tavsiye ederim en büyük diziler 4 + 1 RAID5 ve 8 + 2 RAID6. Bazı üst düzey kontrolörler, bazı performans sorunlarını daha büyük dizilerle gizleyebilir, ancak şimdiye kadarki en iyi denetleyici, yeniden oluşturma sürelerine yardımcı olmayacaktır. - Andrew Henle