Soru eth0 NIC Bağlantısı çekirdek günlüğünde yinelenen mesajdır


Birkaç gün önce aynı tekrarlanan mesajların meydana geldiğini fark ettim ve bu süre zarfında hiçbir şeyin kasıtlı olarak değiştirilmediğini (yüklü / kaldırılmış) olduğunu söyleyebilirim.

işte örnek /var/log/kern.log mesaj:

Mar 30 06:32:45 aurora kernel: [566322.867110] e1000e: eth0 NIC Link is Down

Mar 30 06:32:47 aurora kernel: [566325.313634] e1000e: eth0 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: Rx/Tx

Mar 30 06:32:59 aurora kernel: [566337.632930] e1000e: eth0 NIC Link is Down

Mar 30 06:33:18 aurora kernel: [566356.543664] e1000e: eth0 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: None

Mar 30 11:05:47 aurora kernel: [582689.779752] e1000e: eth0 NIC Link is Down

Mar 30 11:05:50 aurora kernel: [582692.174337] e1000e: eth0 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: Rx/Tx

tam günlük dosyasından - tüm günlük mesajını bu tür saymaya başladığınızda - sonuca varabilirim:

  • eth0 her birkaç saatte bir başarısız olur
  • eth0 ilk durumda iki, ikinci saniyede 19 saniyede başarısız olur

Buradaki üretim sunucusundan bahsediyorum.

Bu problemi nasıl çözebilirim, posta sunucusu üretimde ve ağ arızalarında 19 saniyelik süreye kadar tahammül edemiyorum?


13
2018-03-30 11:16


Menşei


Şimdiye kadar ne kontrol ettin? Kablo doğru şekilde takılmamış ve zarar görmemiş durumda mı? Diğer uçtaki anahtar da aşağı inen bağlantıyı gözlemliyor mu? Dikkat edilmesi gereken, tespit edilen bağlantının farklı zamanlarda farklı olmasıdır (akış kontrolü, günlüğünüzde farklılık gösterir). Belki de özerkleme başarısız olur? 1000Mbps FD Rx / Tx'i zorlarsanız sorun giderilir mi? - Håkan Lindqvist
@ HåkanLindqvist Sunucuya fiziksel olarak yakın olmadığından, kabloyu kontrol etme seçeneğim yok. Bu kontrol etmek için sunucu çiftliği teknik malzeme sormam gereken bir şey mi? 1000Mbps FD Rx / Tx'yi nasıl zorlayabilirim? Ve akış kontrolünün farklı zamanlarda farklı olması, bu meseledir? - Miloš Đakonović
Zamanla değişen “tip” bağlantı bana bir şeyin doğru olmadığını, ancak asıl sebebi bulmanın elbette tamamen ayrı bir soru olduğunu ileri sürüyor. Teknik personele sormak iyi bir fikir olabilir. - Håkan Lindqvist
Sunucu sonunda otomatik olarak görüşme durumunu kontrol etmek için ethtool veya mii aracını kullanabilirsiniz. Sunucunuzun geçiş yapacak şekilde ayarlandığından emin olmanız gerekir. Bu bir donanım problemi gibi geliyor - sunucu adaptörü, kablo veya anahtar olabilir. Ne olduğunu düşündüğünü görmek için anahtarın durumuna bakmanızı öneriyorum. - Paul Haldane


Cevaplar:


  1. kablodaki hataları kontrol edin, çıktıdaki "hatalar" alanına bakın. ifconfig. Sıfır değilse, donanım (kablo, NIC kartı veya hub / anahtar) ile ilgili sorunlar vardır. Güvenilir olmayan bir Ethernet kablosu da bu alanda hatalar verecektir.
  2. 1. adımdan bağımsız olarak Ethernet kablosunu değiştirin. Bu hızlı, ucuz ve kolaydır ve bağlantınız rastgele aralıklarla yukarı ve aşağı gittiğinde yapılmalıdır.
  3. kullanım ethtool ve ağ ayarlarının (dupleks vb.) anahtardakilerle eşleştiğinden emin olun. Anahtarın yöneticisi değilseniz, ağ yöneticisinden size ayarları sunmasını isteyin.
  4. Anahtar akış kontrolü etkinse, Linux kutunuzda etkin olduğundan emin olun. Aksi takdirde, devre dışı bırakın.

Bir yan not olarak, akış kontrolüne ihtiyacınız olup olmadığını değerlendirmelisiniz. HP'ye göre, sadece yüksek performanslı uygulamalar için gereklidir: bkz. Akış Kontrolü Ne Zaman Kullanılacağına İlişkin HP makalesi


9
2018-03-12 21:25



Tel hatasıydı. Hataları bildirdikten sonra sunucu grubu teknik malzeme işi yaptı. - Miloš Đakonović
'ifconfig' hata gösteriyordu? - Michael Martinez


İşte benim fikrim. Bu sorun, belirli bir donanıma (NIC üzerindeki 2 bağlantı noktasından yalnızca birindeki bir makinede), her zaman e1000e sürücüsüyle, çekirdek 3.9 ya da öylesine gerçekleşir. Bu dosya centos7 içindir, içeri girer /etc/init.d/ ve ile etkinleştirilmesi gerekiyor chkconfig --add <name>. Arabirim adı sabit kodlanmış ... ayarladığınızdan emin olun.

#!/bin/sh

### BEGIN INIT INFO
# Provides:          pm-e1000e-fix
# Required-Start:    $network
# Required-Stop:     $network
# Default-Start:     2 3 4 5
# Default-Stop:      0 6
# Short-Description: workaround for e1000e issue
# Description:       e1000e fix
### END INIT INFO

################################################################################
# Give Usage Information                                                       #
################################################################################
usage() {
    echo "Usage: $0 start|restart" >&2
    exit 1
}

################################################################################
# E X E C U T I O N    B E G I N S   H E R E                                   #
################################################################################
command="$1"
shift

interface="eth0"

case "$command" in
    start)
        ethtool -K "$interface" gso off gro off tso off
        ;;
    restart)
        ethtool -K "$interface" gso off gro off tso off
        ;;
    *)
        usage
        ;;
esac

1
2018-03-21 16:23