Soru Bir web uygulaması için% 100 çalışma zamanı


Bugün bir müşteriden ilginç bir "gereksinim" aldık.

% 100 çalışma zamanı istiyorlar Site dışı Bir web uygulamasında yük devretme. Web uygulamamızın bakış açısından, bu bir sorun değil. Birden fazla veritabanı sunucusunda vb. Ölçeklendirilebilecek şekilde tasarlanmıştır.

Ancak, bir ağ sorunundan, nasıl çalışacağını anlayamıyorum.

Özetle, uygulama müşterinin ağındaki sunucularda yaşayacaktır. Hem iç hem de dış insan tarafından erişilebilir. Sistemin yerinde olmayan bir kopyasını sürdürmemizi istiyorlar ki, tesislerinde ciddi bir başarısızlık olması halinde hemen alınıp devralacaklar.

Şimdi biliyoruz ki içsel insanlar için onu çözmenin hiçbir yolu yoktur (taşıyıcı güvercin?), Fakat dış kullanıcıların fark etmelerini bile istemezler.

Açıkçası, bunun nasıl mümkün olabileceğine dair en ateşli fikrim yok. Öyle görünüyor ki, internet bağlantısını kaybederlerse, dış makinelere giden trafiği yönlendirmek için bir DNS değişimi yapmamız gerekecek ... Elbette, zaman alacak.

Fikirler?

GÜNCELLEŞTİRME

Bugün müşteriyle bir tartışma yaptım ve konuya açıklık getirdiler.

Uygulamanın, bir sel durumunda bile etkin kalması gerektiğini söyleyerek% 100'lük sayıyla sıkıştılar. Ancak, bu gereklilik sadece onlar için onları barındırırsak başlıyor. Uygulama tamamen kendi sunucularında yaşıyorsa, çalışma zamanı gereksinimlerini karşılayacaklarını söylediler. Cevabımı tahmin edebilirsin.


310
2017-09-29 00:31


Menşei


Korsanlıktan kaynaklanan devasa kesintileri hafife alma, Sony ve PlayStation ağına bakma. Aynı% 100 çalışma zamanı fikrini ve parayı / donanımı yedeklemelerini garanti edebilirsiniz. Müşteri ile% 100 çalışma zamanının makul bir beklenti olmadığını açıkça belirterek, Google tekniklerinin bile "% 100 çalışma zamanı" nı kasıp tereddüt etmeyeceğini belirttik. bir ipucu, dinamik DNS kullanarak bakmaktır, sadece 60 saniye önbelleğe alınır, bu işletim sistemi ve yerel DNS sunucularını içermelidir. - Silverfire
Ben şahsen olurum KOŞMAK Bu müşteriden olabildiğince hızlı. Bu durumun sahip olabileceği son çılgın fikir olmayacağından şüpheleniyorum (teknoloji açısından). - GregD
Keşke müşterini reddedebilseydim. - joeqwerty
Eğer% 100 çalışma zamanını anlarsan, bana haber ver. Onunla bir iş oluşturacağım ve google'a satacağım. % 100 garanti etmek imkansız. Microsoft, amazon veya google gibi şirketler bile bu kadar yüksek olmayacak çünkü onlar imkansız olduğunu biliyorlar. Gördüğüm en iyi% 99.999 ve hatta bu bir streç (bir yılda 5 dakika). Muhtemelen yapabileceğiniz en iyi şey 99.99% güvenilirdir. - Matt
Sadece onların deli isteğini koymak için delicesine yüksek bir fiyat etiketi oluşturun. Bu muhtemelen onları duyularına geri getirecektir. Ya, ya da onlara yalan söylemeye istekli birini aramaya gönderecekler. - Nate C-K


Cevaplar:


Burada VikipediDokuzun peşinde olan kullanışlı şema:

enter image description here

İlginçtir, sadece İlk 20 sitenin 3'ü 2007 yılında efsanevi 5 dokuza veya% 99,999 çalışma süresine ulaşabildiler. Onlar Yahoo, AOL ve Comcast idi. 2008'in ilk 4 ayında, en çok popüler sosyal ağlarBuna bile yaklaşmadım.

Grafikten,% 100 çalışma süresinin takibinin ne kadar saçma olduğu belli olmalı ...


363
2017-09-29 01:03



Pingdom da her saniye kontrol etmiyor. Bunun da ötesinde, beş taneyle karşılaşmış olanlar, Pingdom'in tespit edemeyeceği aksaklıklar veya hâlâ ping'lere yanıt verirken bazı servislerin kullanılmadığını belirten aksaklıklar yaşatmıştı. - ceejayoz
İçinde beş tane şüpheli olan ... - GregD
Tam. Ve çalışmak için milyarlarca dolar var! - ceejayoz
Sohbetin devam etmesini üzdüğüm için özür dilerim, ancak OP'nin sorusu, teknik düzeyde% 100 kesintisiz çalışma hedefine yönelik olarak nasıl çaba gösterileceğiydi. Eminim ki, donanımda meydana gelen doğal olaylar nedeniyle her zaman mümkün olmadığını biliyor. ve çevre. Ona yardım edebilir miyiz? - David d C e Freitas
OP'ye: "Normal bakımın dışında" çalışma süresi garantileyen SLA'ları gördüm. Normal bakım, ayın en az yoğun olduğu günlerde genellikle ayın en yoğun günlerinde (genellikle gecenin ortasında) gerçekleşen güncellemeler, yamalar vb. İçin aylık tarifeli kesinti süresidir. İşletmeleriyle ilgili olarak işleriyle ilgili bazı ölçüm türlerine sahip olmaları gerekir. Sen could onlar için daha iyi çalışma süresi (4 dokuz) sadece bu zamanlarda. - GregD


Onlardan% 100 tanımlamaları ve bunun nasıl ölçüleceğini sorun. Muhtemelen, karşılayabilecekleri kadar% 100'e yakındırlar. Onlara masrafları ver.

Detaylandırmak için. Müşterilerle sözde gülünç gereklilikleri olan görüşmelerde bulundum. Her durumda, aslında sadece doğru olmayan bir dil kullanıyorlardı.

Çoğu zaman, şeyleri mutlak görünen şekillerde çerçevelerler -% 100 gibi ama aslında daha derin araştırmalar için risk azaltma verilerine yönelik maliyetlerle sunulduğunda gerekli olan maliyet / fayda analizlerini yapmak için yeterince mantıklıdırlar. Onlara kullanılabilirliği nasıl ölçeceklerini sormak çok önemli bir sorudur. Eğer bunu bilmiyorlarsa, önce bunun tanımlanması gerektiğini onlara öneren bir pozisyondasınız.

İstemciden, aşağıdaki durumlarda sitenin kullanımdan kaldırılması durumunda, işletme etkisi / maliyetleri açısından ne olacağını tanımlamasını isterim:

  • X saat için en yoğun saatlerinde
  • En az yoğun saatlerde x saat

Ve bunu nasıl ölçecekleri de.

Bu şekilde, '% 100' doğru seviyesini belirlemek için onlarla çalışabilirsiniz. Bu tür soruları sorarak onların diğer gereksinimlerinin önceliklerini daha iyi belirleyebileceklerinden şüpheleniyorum. Örneğin, bunu başarmak için belirli seviyelerde SLA ödemek ve diğer işlevleri ödün vermek isteyebilirler.


186
2017-09-29 09:45



Kabul. Oldukça sağlam bir yük devretme stratejisi ile "çok yüksek" çalışma süresi (90'ların üst kısmı) anlamına gelebilir. Aksi takdirde, ilgili maliyet ölçeğinin bir açıklaması onları umutlu olarak ikna ederdi. - Martin Dow
Sonuçlara atlamamak için +1 ve bunun yerine müşteriye neleri akılda tuttuklarını açıklamalarını istemek. - sleske
Müşterinin% 100 çalışma zamanı (eksi planlı bakım) anlamına gelmesi durumunda, "sonuçlara atlama" ifadesini ekliyorum. Mayıs ayı Makul bir gereklilikten daha fazlası. - Tim Reddy
Đşletme etkisi ile ilgili olarak, işlerini tam olarak biliyor ve anlıyoruz ve sitenin aşağıya inmesiyle ilgili maliyetler mali değil. Yılanlar, potansiyel asmalar, vb. İle gösterilen yerlilerin çizgileri boyunca daha fazla.) Ön kapınıza çığlık attığınız sırada 40.000 kişi hayal edin. Tutkuyla kaçınmak istedikleri şey bu. - NotMe
@ChrisLively O zaman olgun bir risk anlayışına sahip olmanın daha fazla sebebi o zaman. Güvenlik mühendisliği için baskın paradigma olasılıksal risk değerlendirmesi. Binlerce insanı öldürecek (sadece sinir bozucu değil) ve hala düşük, ümitle iyi anlaşılmış ama sıfır başarısızlık ihtimali olan sistemler var. - poolie


Müşterilerin çıldırmış. % 100 çalışma zamanı imkansız Ne kadar para harcarsın, önemli değil. Sade ve basit - imkansız. Google, Amazon, vs.'ye bakın. Altyapısına atmak için neredeyse sonsuz miktarda paraya sahipler ve yine de kesinti yaşamalarını sağlıyorlar. Bu mesajı onlara teslim etmelisiniz ve makul talepler sundukları konusunda ısrar etmeye devam ederse. Bunu tanımıyorlarsa bazı kesinti miktarı kaçınılmazdır, o zaman çukurlar.

Bu, uygulamanın kendisini ölçekleme / dağıtma mekaniğine sahip gibi görünüyor. Ağ kısmının, farklı ISP'lere fazladan yükseltmeleri, bir ASN ve IP tahsisi almasını ve BGP'de ve gerçek yönlendirme tertibatında boyun derinliği almasını, böylece İP'lerin ihtiyaç duyulması halinde İSS'ler arasında hareket edebilmesini sağlaması gerekecektir.

Bu oldukça açık bir şekilde, çok kısa bir cevap. Bu derece çalışma süresi gerektiren uygulamalarla ilgili deneyiminiz olmadı, bu nedenle efsanevi% 100 çalışma zamanına yakın bir yere gitmek istiyorsanız profesyonel bir görev almanız gerekiyor.


141
2017-09-29 00:39



Kabul. Tamamen. Çılgın. - jdw
onlar için kullanılır? - Sirex
@Sirex Neutrinos'un ışıktan daha hızlı ilerlediği tespit edilen son deney @ CERN'e gönderme yapıyor. Ancak henüz bağımsız bilim adamları tarafından onaylanmış sonuçlar. - TC1
@ TC1 Sana bahse girerim $200 dolar Bu tava değil. - dpatchery
@ErikA% 100 çalışma zamanı talebi, sistemlerin teknik özelliklerinin ihmal edildiğini gösterir. Tamam, çünkü müşterinin işi ne yaparsa yapsın. Senin işin BT sistemlerini mühendis etmektir. Bunun gibi zorlu müşteriler kabuslar olabilir, ama aynı zamanda en iyi müşterileriniz olabilirler. - duffbeer703


Bu kesinlikle ilginç bir şey. Kendimi sözleşmeyle% 100 kesintisiz çalışma yükümlülüğüne ulaştırmak isteyeceğime emin değilim, ama sanırsam böyle bir şeye benzeyeceğini düşünürdüm:

Tamamen ağ üzerinden bir yük dengeleyici üzerinde halka açık IP ile başlayın ve en az iki tane oluşturun, böylece biri diğerine geçemez. Heatbeart gibi bir program, bunların otomatik olarak yüklenmesine yardımcı olabilir.

Vernik öncelikle önbellekleme çözümü olarak bilinir, ancak bazı çok iyi yük dengeleme de yapar. Belki de bu yük dengelemenin üstesinden gelmek için iyi bir seçim olurdu. İsteğe bağlı olarak, rasgele veya yuvarlak robin dengesini yükleyecek olan yönetmenlerde gruplandırılmış 1'den n'ye kadar arkaya sahip olacak şekilde ayarlanabilir. Vernik, her arka ucun sağlığını kontrol etmek için yeterince akıllı hale getirilebilir ve sağlıksız arka uçları çevrim dışı olana kadar döngüden çıkarılabilir. Arka tarafların aynı ağda olması gerekmez.

Bu günlerde Amazon EC2'deki Elastic IP'lere aşığım, bu yüzden muhtemelen farklı bölgelerdeki EC2'deki yük dengeleyicilerimi veya en azından aynı bölgedeki farklı kullanılabilirlik bölgelerini inşa ediyorum. Bu, mevcut A kayıt IP'sini yeni kutuya taşımak ve taşımak zorunda kalmanız durumunda, manuel olarak (god forbid) yeni bir yük dengeleyici döndürme seçeneği sunar.

Vernik, SSL'yi sonlandıramaz, bu yüzden bir endişe varsa, bunun yerine Nginx gibi bir şeye bakmak isteyebilirsiniz.

Arka uçlarınızın çoğunu istemcilerinizin ağında ve ağlarının bir veya daha fazlasında olabilirsiniz. Eminim ki,% 100 emin değilim, arka uçları önceliklendirebilirsiniz, böylece müşterilerinizin makineleri sağlıksız hale gelene kadar öncelik kazanırlar.

Bu görevi yaparsam baştan başlayacağım ve şüphesiz ben ilerlediğimde onu da hassaslaştıracağım.

Ancak, ErikA'nın belirttiği gibi, bu İnternet ve her zaman kontrolünüzün dışında olan ağın parçaları olacak. Yasallığınızın yalnızca sizin kontrolünüz altındaki şeylerle bağlandığından emin olmak istersiniz.


54
2017-09-29 00:47



Bir süredir bir bulut dağıtımı için Amazon ve MS'yi düşünüyordum ama her ikisinin de son birkaç ay içinde büyük kesintileri oldu. SSL kritik. - NotMe
Amazon kullanacak olsaydınız, kesinlikle makinelerinizi 5 müsaitlik bölgesi etrafında yaymak isterdiniz. Tüm bölgelerinin aynı zamanda dışarı çıkması pek olası değil. - jdw
OP'nin asıl sorusunu gerçekten ele almak için +1. - Phil
Zincirde dağılmamış bir şey olduğu sürece her zaman bir başarısızlık noktasına sahip olacaksınız (durumda kalp atışlarınızda, eğer uzak makinelerde çalışanların birbirlerini izleyebilmeniz için birden fazla örneğiniz varsa) Yönlendirme boyunca ağ sorunlarından herhangi birinin görebileceği veya göremeyeceği sunucular. Bu bizi "duruşa" getiriyor. Sunucular, yönlendirme yolunda değilse, hiç bir zaman kalp atışı yapmayan istemciye erişemeyebilir ve çalışmaya devam edebilir. - jwenting
Kabul. HERKESİNİN başkalarının işaret ettiği gibi,% 100 çalışma zamanı diye bir şey yoktur. Tek yapabileceğiniz şey denemek ve anlattığım şey denemeye nasıl başlayacağım. - jdw


Sorun değil - biraz gözden geçirilmiş kontrat ifadesi olsa:

...% 100'lük çalışma süresini (sıfır ondalık basamağa yuvarlanır) garanti eder.


29
2017-09-29 10:13



Bildirim için +1,% 100,% 100,0 veya% 100.000 vb değil. Ondalık basamak önemlidir, hassasiyeti gösterir;) - Danubian Sailor
Bazı sözleşmelerde, "% 100" ün sadece bir anlamlı rakamı vardır, böylece bir buçuk ile bir arasındaki tüm sayılar "% 100" e yuvarlanır; % 50'si% 100'e varacaktır. - Thomas Levine
Sayım için standartlara bağlı olarak,% 50'nin% 100'ün üç meral sayıya sahip olduğu iki meening sayısının olduğu söylenir. 50,5 ve 100 tam olarak ön plana çıkıyor. Diğerleri ondalık noktadan sonra rakamları sayar. Daha sonra 50,5 ve 100,4 aynı derecede doğru olacaktır. Başka bir şey belirtilmediyse,% 100'ün% 99,5 ve daha yukarı olduğunu kabul ediyorum. % 100,0,% 99.95 ve üstüdür. - Tillebeck


Eklemek oconnore'un cevabı Hacker'dan Haberler

Sorunun ne olduğunu anlamıyorum. Müşteri felaket için plan yapmanı istiyor ve matematik odaklı değil, bu yüzden% 100 olasılık istemek mantıklı geliyor. Mühendisler, mühendislerin yapmaya eğilimli olduğu gibi, müşterinin bunu yapamayacağı düşüncesiyle, prob & stat 101'in ilk gününü hatırladı. Bunu söylediklerinde, nükleer kış hakkında düşünmüyorlar, Fred'in kahveyi ofis sunucusuna, bir diskin çökmesine ya da bir ISS'nin batmasına neden olduğunu düşünüyorlar. Dahası, bunu başarabilirsin. Coğrafi olarak farklı, bağımsız, kendi kendini izleme sunucuları ile, temelde kesinti yaşamayacaksınız. Bağımsız (1) üç 9 güvenilirlikte çalışan 3 sunucu ile, iyi yük devretme modları ile, beklenen kesinti süreniz saniyenin altındadır (2). Bu hemen gerçekleşse bile, web bağlantıları için hala makul bir SLA içinde olursunuz ve bu nedenle kesinti pratik olarak mevcut değildir. Müşteri hala kıyamet senaryoları ile uğraşmak zorunda, ama Godzilla hariç, "her zaman" bir hizmete sahip olacak.

(1) Los Angeles'taki bir sunucu, Boston'daki sunucudan makul bir şekilde bağımsızdır, ancak evet, nükleer savaşın, korsanların elektrik şebekesini çökertmesi gibi bir takım kavşakların var olduğunu anlıyorum. Müşterinin sizi rahatsız etmeyeceğini düşünüyorum. bu.

(2) DNS yük devretme birkaç saniye ekleyebilir. İstemcinin yılda bir kez bir isteği yeniden denemesi gereken bir senaryodasınız, ki bu yine makul bir SLA dahilinde ve tipik olarak "kesinti süresi" ile aynı vesile olarak değerlendirilmiyor. Hata durumunda mevcut bir düğüme otomatik olarak yeniden yönlendiren bir uygulama ile, bu farkedilemez olabilir.


25
2017-09-30 15:49



Sorun şu ki, sözleşmeli olarak söylüyorlar. Bir felaket olursa anlamı yapar gerçekleşir ve siteyi dava açmak için ayakta kalabilecekleri yedeklerle tekrar çevrimiçi hale getirmek için on saniyeden fazla zamana ihtiyacınız vardır. - Shadur
@Shadur: Onlar Gerçekten mi onu istiyorum, o zaman yapmalısın Gerçekten mi onları şarj et. Sunucuları coğrafi olarak geniş ve geniş bir alana yayıyoruz, umarım heryerde felaket olmayacaktır. - Jungle Hunter
% 100 uptime garantileri veya paranızı geri ödeyen bir site gördüm. Hile, bir yük gemisi yüklüydü ve aylara bölünmüştü. Bu yüzden bazı aylar ödenmemiş oluyorlar ve bunun etrafındaki her şeyi planlıyorsunuz ve bu da kayıpların tamamlandığı aylarla örtüşüyor. - jldugger


Facebook ve Amazon bunu yapamazsa yapamazsın. Bu kadar basit.


25
2017-09-29 01:10



Tüm insanlardan daha akıllı olabilirdi, kim bilir: p - Matt
% 100 çalışma zamanı çok basit insanlar olmak zorunda değildir - bunun anlamı: İhtiyaç duyulduğu sürede% 100 kullanılabilir. Örneğin, banka sistemleri her zaman mevcut olmalı ve oldukça iyi durumdalar. Sadece yılda 1 saniyeliğine bakım için gittikleri için% 100 çalışma zamanı hedeflerinde başarısız oldukları anlamına gelmez. - David d C e Freitas
@DavidFreitas - Ben sözleşmelerde genellikle oldukça literal olduğunu düşünüyorum ... - UpTheCreek
@Matt Facebook / Amazon bunu yapamadığı için daha küçük bir site bunu yapamaz anlamına gelmez. Bir çok büyük web sitesi, daha küçük bir siteden daha üstesinden gelmek için çok daha fazla zorlukla karşılaşıyor. - Xorlev
Yani ne demek istiyorsun,% 100 çalışma zamanı olmadı, çünkü bazı müşterilerinizde hatalar vardı. Ayrıca kısa süreli TTL'leri göz ardı eden ISS'leriniz olduğu için dns anında bir anahtara dönüşmez - Mike