LFBS Home Lehrstuhl für Betriebssysteme RWTH
Disclaimer/
Haftungsausschluss
Webmaster
(admin@lfbs...)
Home > Bachelor- / Masterarbeiten > Diplom-/Masterarbeiten > Kollektive Kommunikation in speichergekoppelten Netzen  

Kollektive Kommunikation in speichergekoppelten Hochgeschwindigkeitsnetzen mit unterschiedlichen Topologien

This page in english

Am Lehrstuhl für Betriebssysteme (Univ.-Prof. Dr. habil. Th. Bemmerl) wurde die folgende Diplomarbeit vergeben:

Kollektive Kommunikation in speichergekoppelten Hochgeschwindigkeitsnetzen mit unterschiedlichen Topologien

Hintergrund

Rechenintensive Anwendungen werden gewöhnlich auf Parallelrechnern ausgeführt, z.B. Clustern (Verbundsystemen) aus PCs oder Servern, die über ein lokales Hochgeschwindigkeitsnetz miteinander verbunden sind. Eine weitverbreitete Schnittstelle zur Parallelisierung solcher Anwendungen ist das Message Passing Interface (MPI), das auf dem Paradigma des Nachrichtenaustauschs basiert. Der grundlegende Kommunikationsmechanismus zwischen den Prozessen, aus denen eine parallele MPI-Applikation besteht, ist der Punkt-zu-Punkt-Datenaustausch, d.h. zwei Prozesse tauschen miteinander Daten aus. Zusätzlich bietet MPI aber auch sog. kollektive Operationen an. Bei einer kollektiven Operation wird ein bestimmtes Kommunikationsschema innerhalb einer Gruppe von Prozessen realisiert. Optimierte kollektive Kommunikationsoperationen werden allgemein als sehr wichtig für die Leistung einer MPI-Applikation erachtet.

Speichergekoppelte Netze bilden eine besondere Klasse innerhalb der lokalen Netze: in ihnen kann ein Knoten direkt durch gewöhnliche Lese- und Schreiboperationen einer CPU auf den Hauptspeicher eines anderen Knotens zugreifen. Ein Beispiel eines solchen Netzwerktyps ist das Scalable Coherent Interface (SCI), ein anderes das bereits angekündigte, auf einer direkten Kopplung via PCI-Express basierende, Hochgeschwindigkeitsnetz von Dolphin Interconnect Solutions. Beide bieten geringere Latenzzeiten und höhere Bandbreiten als ein Standard-LAN. Außerdem ermöglicht SCI den Aufbau von Clustern mit unterschiedlichen Topologien (Ring, Torus, Stern). Für die nächste Generation der Dolphin-Hardware wird erwartet, dass sie auf Switches basiert (d.h. auf einer Stern-Topologie). Der Lehrstuhl für Betriebssysteme verfügt derzeit über drei SCI-Cluster, einer aufgebaut als ein einfacher Ring, die anderen als ein 2D-Torus.

Aufgabenstellung

  • Evaluation bereits existierender sowie Entwicklung neuer Algorithmen für kollektive Kommunikation, die für SCI- und PCIe-basierte Cluster geeignet sind
  • Entwurf und Implementation einer Bibliothek/eines Rahmenwerks, das kollektive Kommunikation auf speichergekoppelten Clustern bereitstellt
  • Entwurf und Implementation von Adapter-Schichten, um diese kollektiven Algorithmen über User-Level-Bibliotheken (MPI-Implementationen) für Anwendungen nutzbar zu machen

Ziele

Das Hauptziel dieser Arbeit ist die Entwicklung eines Rahmenwerks, das effiziente Operationen für kollektive Kommunikation auf bestimmten lokalen Netzen bereitstellt und mit Kommunikations-Bibliotheken für parallele Anwendungen verbunden werden kann. Die Implementation umfasst sowohl hardwarenahe Optimierungen als auch Arbeit auf höheren Ebenen der verwendeten Algorithmen. Wissenschaftlich interessant sind hierbei vor allem Untersuchungen zur Ausnutzung besonderer Hardwareeigenschaften, wie des entfernten Speicherzugriffs, und von Algorithmen, die besonders für Torus-Topologien geeignet sind. Die Arbeit baut auf bereits durchgeführter Forschung im Bereich SCI, Torus-Topologien und kollektiver Kommunikation auf.

Weitere Informationen

Kontakt

Dipl.-Inform. Boris Bierbaum
Lehrstuhl für Betriebssysteme (LfBS), RWTH Aachen
Kopernikusstraße 16, D-52056 Aachen
Tel.: +49-241-80-27805, Fax: +49-241-80-22339
E-Mail: boris@lfbs.rwth-aachen.de
Print Version