Cluster Manager

Ein Cluster Manager ist eine Software für das Management eines Computerclusters (Verbund aus mehreren Rechnern). Er steht für Verwaltungsvorgänge im Cluster zur Verfügung und automatisiert meist Vorgänge wie den Failover vom Primärsystem zum Standby-System im Fehlerfall sowie Switchover für Wartungszwecke. Als Synonym ist auch der Begriff Clusterware gebräuchlich.

Für die Erkennung eines Ausfalls eines Rechners im Cluster wird meist der sogenannte Cluster Heartbeat in Verbindung bzw. in Ergänzung mit einem Quorum verwendet, ein Signal, das über eine Netzwerkverbindung zwischen den Clusterknoten (einzelne Rechner im Cluster) ausgetauscht wird. Verstummt der Heartbeat eines Rechners, wird ein Ausfall desselben angenommen und ein Failover (eine Übernahme der Dienste wie Datenbanken, Webserver oder Application Server) eingeleitet.

Einige Cluster Manager bieten die Möglichkeit, eigene Agenten zu entwickeln. Diese Variante deckt den Fall ab, dass ein Rechner zwar verfügbar ist und sein Cluster Heartbeat weiter über das Cluster-Netzwerk gesandt wird, jedoch der Applikationsdienst (zum Beispiel ein Datenbankservice) nicht mehr zur Verfügung steht. So kann ein Cluster Agent prüfen, ob eine Datenbankverbindung möglich ist. Sofern diese nicht erfolgreich ist, kann ebenfalls mittels des Agents ein Failover initiiert werden.

Typische Cluster Manager sind

Siehe auch

Literatur

  • Charles Bookmann: Linux Clustering. SAMS (2002), ISBN 1-57870-274-7
  • Joseph D. Sloan: High Performance Linux Clusters with OSCAR, Rocks, openMosix, and MPI. O’Reilly & Associates (2004), ISBN 0-596-00570-9
  • Andrea Held: Oracle 10g Hochverfügbarkeit mit Real Application Cluster. Addison-Wesley (2004), ISBN 3-8273-2163-8
  • Evan Marcus, Hal Stern: Blueprints for High Availability. John Wiley & Sons Inc (2004), ISBN 0-471-35601-8
  • Heiko Bauke, Stephan Mertens: Cluster Computing. Springer (2005), ISBN 3-540-42299-4
  • Michael Soltau: Unix/Linux Hochverfügbarkeit. MITP (2002), ISBN 3-8266-0775-9
  • Matthew Hart, Scott Jesse: Oracle Database 10g High Availability with RAC, Flashback & Data Guard. McGraw-Hill (2004), ISBN 0-07-225428-9
  • Alex Vrenios: Linux Cluster Architectur. SAMS (2002), ISBN 0-672-32368-0
  • Pankaj Jalote: Fault Tolerance in Distributed Systems. Prentice Hall (1994), ISBN 0-13-301367-7
  • Volker Herminghaus, Albrecht Scriba: Veritas Storage Foundation. Springer (2006), ISBN 3-540-34610-4
  • Joseph Bianco, Peter Lees, Kevin Rabito: Sun Cluster 3 Programming. Prentice Hall (2004), ISBN 0-13-047975-6
  • William Gropp, Ewing Lusk, Thomas L. Sterling: Beowolf Cluster Computing with Linux. MIT Press (2003), ISBN 0-262-69292-9

Weblinks