Wir bemerken, dass einige Kunden Probleme beim durchführen von Vollbackups mit Bareos hatten.
Auf den Systemen stoppten laufende Backups ohne erkennbaren Grund mitten während der Datenübertragung, manchmal am Anfang der Sicherung, manchmal nach einigen Stunden Laufzeit. Die beobachteten Fehler waren immer:
24-Apr 18:22 backup01-dir JobId 615: Fatal error: Director's comm line to SD dropped.
24-Apr 18:22 backup01-dir JobId 615: Error: Bareos backup01-dir 19.2.7 (16Apr20):
Nachdem wir
- Link-Errors und flappende Netzwerkinterfaces ausgeschlossen haben
- Auf Backup-Server, Virtualisierungshosts und Gastsystemen / Agenten die Energiesparfunktionen deaktiviert hatten
- Das "Keepalive Timeout" auf 60 Sekunden gestellt haben (wie der bareos-/bacula-Dokumentation zu entnehmen)
lenkte sich das Augenmerk auf die Netzwerkkartentreiber. Die Hostsysteme nutzten den Intel E1000e-Treiber, da in den Serversystemen (Fujitsy Primergy TX150 S8) Intel-Netzwerkkarten verbaut wurden.
Wir beobachteten, dass der Netzwerkkartentreiber die Links genau zum Zeitpunkt des Verbindungsabbruches einen reset-Fehler im Debian-syslog des Virtualisierungssystems protokollierte, auf dem der Backup-Server (bareos-director) betrieben wird.
Die Abhilfe wurde geschaffen durch das deaktivieren der Segment-Offloading-Funktionen und durch das deaktivieren der Hardware-RX/TX-Warteschlangen:
ethtool -K enp7s0 gso off gro off tso off tx off rx off
bzw. durch permanenten Eintrag in die /etc/network/interfaces des Virtualisierungshosts:
iface enp7s0 inet static address x.x.x.x/yy post-up ethtool -K enp7s0 gso off gro off tso off tx off rx off
Weitere Hilfe
Benörigen Sie weitere Hilfe, so kontaktieren Sie uns gerne telefonisch unter +49 951 29909716. Für komplett verwalteten Backup-Service weisen wir Sie auch gerne auf unseren Managed Backup Service hin.