Benchmarkstudie: Optimierte Falltests mit Dell, Intel und Altair

Die Seite wird erstellt Lorenz Köhler
 
WEITER LESEN
Benchmarkstudie: Optimierte Falltests mit Dell, Intel und Altair
Benchmarkstudie:
Optimierte Falltests mit Dell, Intel und Altair

Fredrik Nordgren, Master of Science im Maschinenbau, Application Engineer, Altair
Eric Lequiniou, Director High Performance Computing, Altair
Martin Hilgeman, HPC Consultant, Dell

© Dell | Abschnitt 1
Benchmarkstudie: Optimierte Falltests mit Dell, Intel und Altair
1
Benchmarkstudie: Optimierte Falltests mit Dell, Intel und Altair
Einleitung
Stoßanalysen oder Falltests gehören zu den wichtigsten Phasen der Produktentwicklung und des Produktdesigns.
Software kann diese Prüfungen akkurat simulieren, was den Herstellern enorme Vorteile hinsichtlich Kosten und
Markteinführungszeit bietet. Dell, Intel und Altair haben gemeinsam eine Lösung für virtuelle Falltests mit
integrierter Simulations- und Optimierungsanalyse analysiert, die nachweisliche Verbesserungen beim
Zeitaufwand und der Genauigkeit bietet. Mit dieser Lösung können Techniker mehr Designalternativen
untersuchen, um die Widerstandsfähigkeit und Zuverlässigkeit von Produkten zu verbessern. So können Hersteller
die Entwicklungszeit hochleistungsfähiger Designs erheblich verkürzen und die Produktqualität bei gleichzeitig
minimaler Vorlaufzeit erhöhen.

Problemstellung:
Schnellere Durchführung und höhere
Genauigkeit von Falltests
Ob bei Smartphones oder Autoteilen: Vor der endgültigen Produktion müssen die Produkte hinsichtlich ihres
Stoßverhaltens getestet werden. Dem Hersteller fällt die Aufgabe zu, Produkte zu entwickeln, die nach dem
Aufprall beim Fallenlassen, bei Stößen oder in anderen Situationen, in denen die Gefahr einer dauerhaften
Beschädigung besteht, bestmöglich funktionieren.

Simulationssoftware für Falltests unterstützt Hersteller dadurch, dass Produkttests weniger Zeit benötigen, was
höhere Designqualität ermöglicht und die Notwendigkeit physikalischer Tests verringert. Derartige Software bildet
die Komplexität der physischen Umgebung und der Materialien nach, simuliert den Stoß bzw. Fall und liefert
detaillierte technische Angaben darüber, wie sich das Produkt bei diesem Ereignis verhält.

Allgemein steht, wegen der Nachfrage nach Falltests, ausgereifte Software für derartige Problemstellungen zur
Verfügung, wobei entsprechende Lösungen auf Crashsimulationen im Automobilbau zurückreichen. Speziell im
Zusammenhang mit Falltests für Mobiltelefone gibt es jedoch besondere Herausforderungen, weil beispielsweise
mehr Einzelteile mit vielen verschiedenen Materialien und Montageverfahren involviert sind, die alle sorgsam
modelliert werden müssen, um mögliche Schäden durch Stöße zu bewerten. Dazu kommt, dass die Techniker
das Modell und das Postprocessing manuell aufsetzen müssen, was alles viel Zeit in Anspruch nimmt.

Das Endziel ist ein robustes Produkt, das einen Aufprall unter allen Winkeln sowie andere Belastungen (Druck auf
die Glasfläche, Biegung, Torsion usw.) übersteht. Dafür ist eine Vielzahl von Simulationen erforderlich und
infolgedessen eine schnelle, skalierbare Datenverarbeitung sowie eine Softwareumgebung, die es den Technikern
erlaubt, mehr Designalternativen zu untersuchen, um ein besseres Verständnis der physikalischen Vorgänge
während des Stoßes zu erlangen. Außerdem brauchen die Techniker integrierte, automatisierte Lösungen mit
Schlüsselelementen wie der eingebauten Optimierung, damit die Prozesse reibungslos ablaufen und Fehlerrisiken
reduziert werden.

© Dell | Abschnitt 1
Benchmarkstudie: Optimierte Falltests mit Dell, Intel und Altair
2
Benchmarkstudie: Optimierte Falltests mit Dell, Intel und Altair
Lösung: Schnellere Falltestsimulation
mit Dell, Intel und Altair
Bei dieser Studie haben Dell, Intel und Altair kooperiert, um die
Software für Falltestsimulationen von Altair auf einem Dell-Cluster mit
Prozessoren von Intel zu testen. Die von Dell und Intel bereitgestellte
Infrastruktur beschleunigt die Simulation durch die Steigerung der
Leistung des Stoßanalyse-Solvers RADIOSS, wenn dieser auf einem
High-End-Cluster von Dell mit den neuesten Intel® Xeon® E5-v2-
Prozessoren läuft. Dieser „Solver“ – die entscheidende rechenintensive
Komponente in der Falltestlösung von Altair – führt gerade jene
komplexen Simulationen aus, bei denen besonders effiziente Hardware
und schnelle Prozessoren vorteilhaft sind.

Falltestlösung von Altair
Altairs automatisierte Lösung für Falltests besteht aus einem Paket integrierter Softwaretools, die mit Blick auf die
Optimierung von Leistung, Durchsatz und Nutzwert entwickelt wurden:

   HyperWorks ist eine Softwaresammlung für das Modellieren, die Analyse und die Optimierung; sie vereint die
    folgenden Komponenten zu einer kompletten Lösung für Falltests:
        o Hochleistungsfähiger Finite-Elemente-Präprozessor (HyperMesh), der selbst größte Modelle
            vorbereiten kann; mit einem umfassenden Satz von Tools für die Geometriebearbeitung zur
            effizienten Vorbereitung von Modellen für die Gittererzeugung (Meshing)
        o Strukturanalyse-Solver (RADIOSS) – mit höchster Qualität, Robustheit und Skalierbarkeit seit mehr
            als 20 Jahren als Standard für Crash- und Stoßtests im Automobilbau etabliert. Mit der
            RADIOSS-eigenen „Advanced Mass Scaling“-Technik (AMS) können die Benutzer noch bessere
            Softwareleistung erzielen.
        o Hochentwickelte eingebettete Software für Designuntersuchung (Design-Exploration),
            -Approximation und -Optimierung (HyperStudy) mit Formoptimierung, direkter Parametrisierung,
            Data Mining und direkten Lesefunktionen für RADIOSS-Ergebnisse
   PBS Professional – Workload-Management-Software für das Job-Scheduling im High-Performance-
    Computing (HPC), mit hoher Skalierbarkeit und Benutzerfreundlichkeit, seit mehr als 20 Jahren bewährt bei
    Tausenden von Kunden.
Vorherige Tests von Altair haben gezeigt, dass diese Lösung mit aktiviertem RADIOSS-AMS die Laufzeiten für
Falltests von 65 auf 36 Minuten verkürzen kann (Verbesserung von 45 %), im Vergleich zur 64-minütiger Laufzeit
mit einem führenden alternativen Solver.

Dell-HPC-Lösungen mit Intel-Technik
Dell bietet HPC-Komponenten und schlüsselfertige Lösungen an, die es Unternehmen und anderen
Einrichtungen ermöglichen, die Potenziale der HPC-Technik auszuschöpfen und ihre Produktinnovation
und -entwicklung zu optimieren. In Zusammenarbeit mit Intel und Altair können ausgereifte Lösungen für die
Produktentwicklung auf den Markt gebracht werden, die zur Produktivitätssteigerung und Kostensenkung
beitragen und das Management komplexer Cluster-Umgebungen vereinfachen.

Für die hier durchgeführte Falltest-Analyse wurden Dell-Bladeserver des Typs PowerEdge M620 mit Intel®
Xeon® Prozessoren der Produktfamilie E5-2600 v2 ausgewählt. Diese leistungsstarken und energieeffizienten
Prozessoren verfügen über 50 % mehr Kerne und Cache als die vorige Prozessorgeneration; dazu kommen
schnellerer Arbeitsspeicher und weitere Hardware-Verbesserungen gegenüber der vorangegangenen
Servergeneration mit Intel Xeon Prozessoren.

Eine Leistungssteigerung bei HPC-Anwendungen kann durch die Intel® Advanced Vector Extensions (Intel® AVX)
erreicht werden. Die Intel® AVX beschleunigen Vektor- und Fließkommaberechnungen mit Unterstützung von
256-bit-Vektoren und beschleunigter 32/64-bit-Datenkonvertierung. Die Reihe der Intel® Xeon® E5-v2-
Prozessoren bietet – von der Anzahl der Kerne bis zu Modellen mit höherer Taktfrequenz – ein breites Spektrum
verschiedener Prozessordaten, um den Anforderungen der jeweiligen Anwendung des Benutzers zu entsprechen.

© Dell | Abschnitt 1
Benchmarkstudie: Optimierte Falltests mit Dell, Intel und Altair
3
Benchmarkstudie: Optimierte Falltests mit Dell, Intel und Altair
Überblick Über das Benchmarking-projekt

 Einlegen einer Dämpfung zwischen der Steuerplatine und dem
 LCD-Modul, um Deformationen bei einem Fall auf die Rückseite
 zu verringern – zwei verschiedene Formen sind rechts dargestellt.

Für den Leistungstest der Dell-Intel-Altair-Lösung konzentrierten sich die Techniker auf einen bestimmten
Anwendungsfall, bei dem getestet werden sollte, ob eine zusätzliche Dämpfungsschicht die
Materialbeanspruchung bei einem Handydesign verringern könnte.

In diesem Szenario führt der Abstand zwischen der Abschirmung und der Platine des Mobiltelefons bei einem
Falltest auf dessen Rückseite zu einer Verbiegung und zu starker Beanspruchung im LCD-Modul. Das Ziel war
eine optimierte Ausführung der Dämpfung mit idealen Eigenschaften (Dicke, Größe, Flexibilität usw.), um die
Belastung in den Kantenelementen des LCDs zu minimieren.

     1.    Design: In der ersten Projektphase wurde das Konzept in HyperMesh modelliert und Designvariablen
           wurden mit Morphingtechnik sowie Parametrisierung der Eingabedatei erzeugt.

     2.    Optimierung: Eine statistische Versuchsplanung wurde durchgeführt, um einen „Response-Surface“-
           Plan zu erhalten. Dann erfolgte eine Optimierung nach der Response-Surface-Methode, anstelle der
           Anwendung eines Finite-Elemente-Modells.

     3.    Verifizierung: Das optimierte Modell wurde mit Finite-Elemente-Analyse (FEA) evaluiert/simuliert und die
           Leistungsresultate wurden verifiziert.

Diese Simulationen wurden auf Systemen mit den folgenden Komponenten durchgeführt:
 16 x Dell-Bladeserver PowerEdge M620 mit Intel Xeon Prozessoren E5-2680 v2, E5-2667 v2 und E5-2697 v2,
   128 GB Arbeitsspeicher pro Knoten, mit Mellanox-FDR-InfiniBand-Schnittstellen.

Titreşim azaltıcı şerit alanı ve kalınlık sonucu ortaya çıkan LCD
baskıları yüzeyi

© Dell | Abschnitt 1
Benchmarkstudie: Optimierte Falltests mit Dell, Intel und Altair
4
Benchmarkstudie: Optimierte Falltests mit Dell, Intel und Altair
Ergebnisse der Leistungstests
Mit der RADIOSS-Software von Altair auf einem Dell-Bladesystem PowerEdge M620 konnten die Techniker die 21
für diese Optimierungsstudie erforderlichen Falltestsimulationen durchführen und Benchmarks für 3
verschiedene Intel-Prozessoren (Intel Xeon Prozessoren E5-2690 v2, E5-2667 v2 und E5-2697 v2) in 2-Knoten-
Konfigurationen mit den folgenden Kern- und reinen Leistungsdaten messen:

                       CPU           Kerne bei 2              Reine              Einzelner Durchlauf          Gesamtzeit
                                       Knoten          Fließkommaleistung        Durchschn. Zeit (s)     für 21 Durchläufe (s)
                                     insgesamt               GFLOP/s

 E5-2680 v2                      40                896                          719                    15110

 E5-2667 v2                      32                845                          742                    15598

 E5-2697 v2                      48                1037                         660                    13868

Abbildung 1: Leistungsübersicht

Mit niedrigerer Taktfrequenz, aber mehr Kernen geht der E5-2697 v2 aus dem Vergleich der Durchlaufzeiten als
klarer Sieger hervor. Diese Leistungsergebnisse werden durch die hervorragende Skalierbarkeit von RADIOSS
möglich, da die geringere Taktfrequenz bzw. Rechenleistung pro Kern die mit der großen Anzahl von Kernen
insgesamt erzielte Leistung nicht beeinträchtigt.

                       900

                       800

                       700

                       600
   Durchlaufzeit (s)

                       500
                                                                                                                       E5-2680v2
                       400
                                                                                                                       E5-2667v2
                       300                                                                                             E5-2697v2

                       200

                       100

                         0
                             1   2     3   4   5   6    7   8   9 10 11 12 13 14 15 16 17 18 19 20 21
                                                                Simulationslauf-Nr.

Abbildung 2: Einzelheiten zu den Leistungseigenschaften

© Dell | Abschnitt 1
Benchmarkstudie: Optimierte Falltests mit Dell, Intel und Altair
5
Im Vergleich zur Referenzzeit von 65 Minuten (3900 Sekunden), die mit einem einzelnen Rechenknoten mit Intel
Xeon Prozessor X5570 bei 2,93 GHz (mit insgesamt 8 Kernen) erzielt wurden, sind 2 Knoten mit E5-2697-v2-
Prozessoren ungefähr 6-mal so schnell (nur 660 Sekunden für einen Durchlauf). Dies ermöglicht den Abschluss
der gesamten Optimierung (21 Simulationsläufe) in weniger als 4 Stunden (13 868 Sekunden).

Darüber hinaus können die Benutzer mit der AMS-Option (Advanced Mass Scaling) von RADIOSS die Zeitdauer bis
zur Lösung noch weiter verkürzen und dabei gleich genaue Ergebnisse erhalten. AMS stellt eine fortgeschrittene
Lösung für quasistatische Probleme dar und ist eine Alternative zu impliziten nichtlinearen Simulationen, bei
denen es teilweise schwierig ist, eine Konvergenz zu erhalten, zum Beispiel wegen zu hoher Nichtlinearität bei
Kontakten, komplexem Verhalten von Materialien und bei Bruchmodellen.

Bei der schnellsten Konfiguration mit Intel Xeon Prozessoren E5-2697 v2 dürfte die Optimierung mit AMS 1,7-mal
schneller abgeschlossen sein, also in weniger als 2,5 Stunden (weniger als 400 Sekunden für einen einzelnen
Simulationslauf).

Als weiterer wichtiger Aspekt bei der Optimierung von Konfigurationen ist die Skalierbarkeit natürlich nicht nur
vom ausgewählten Intel Xeon Prozessor und der Anzahl der Kerne abhängig, sondern auch von der Zahl der
eingesetzten Rechenknoten. In Anbetracht der parallelen Charakteristik dieser Simulationen kann man davon
ausgehen, dass bei einer Verteilung von ungefähr der Hälfte der Simulationsläufe auf die ersten beiden Knoten
und des Rests auf weitere zwei Knoten, eine Verkürzung der Simulationszeit auf etwa die Hälfte möglich wäre. Mit
dieser Logik können tatsächlich gemessene Ergebnisse auf Systeme mit mehr Rechenknoten extrapoliert werden,
um zur gewünschten Simulationszeit zu kommen – zum Beispiel für ein 8-Knoten-Cluster für Simulationen. Ein
solcher Ansatz könnte mithilfe eines Tools wie PBS Professional vereinfacht werden, das die Simulationsjobs
automatisch auf die verfügbaren Ressourcen verteilt, um die Recheneffizienz und die Auslastung von Ressourcen
zu optimieren.

Energieeffizienz und Leistung
Bei den heutigen Geschäftsstrategien und Planungsvorgängen spielen Energieverbrauch und Kühlung eine
wichtige Rolle für Kaufentscheidungen. Deshalb kann die Energieeffizienz von Systemkonfigurationen für
Simulationen in Unternehmen bzw. Einrichtungen, die Wert auf optimale Nutzung der Energie und zugleich
optimale Leistungseigenschaften legen, von essentieller Bedeutung sein.

Bei der Durchführung der Simulationstests auf dem Dell-PowerEdge-Bladesystem wurde die Leistungsaufnahme
in Watt bei jedem Simulationslauf erfasst (siehe folgendes Diagramm). Während die Gesamtleistungsaufnahme
bei den 21 Simulationsläufen mit den Intel Xeon Prozessoren E5-2667 v2 und E5-2697 v2 ungefähr auf gleichem
Pegel verläuft, ist die Leistungsaufnahme des Intel Xeon Prozessors E5-2680 v2 deutlich geringer.

Aus anderer Sicht betrachtet: In einer Produktivumgebung im Dauerbetrieb (24x7) hat der Intel Xeon Prozessor
E5-2680 v2 eine um 21,3 % geringere durchschnittliche Leistungsaufnahme pro Knoten als der Intel Xeon
Prozessor E5-2697 v2, was mehr als die TDP-Differenz (115 W gegenüber 135 W) von 17 % ist.

© Dell | Abschnitt 1
Benchmarkstudie: Optimierte Falltests mit Dell, Intel und Altair
6
Empfohlene Konfigurationen
Berücksichtigt man Gesamtleistung, Preis-Leistungs-Verhältnis und Energieeffizienz, dann kann man bezüglich
der erforderlichen Rechenknoten für die Einrichtung einer Simulationsumgebung die folgenden Empfehlungen
geben, wenn man das Szenario für den Falltest zugrunde legt. Die tatsächliche Anzahl von Knoten hängt dann
von den Anforderungen durch das Gesamtvolumen der Aufgaben ab.

Maximale Leistung:
Rechenknoten Dell PowerEdge mit Intel Xeon Prozessoren E5-2697 v2 (insgesamt 24 Kerne pro Knoten),
  64 GB Arbeitsspeicher und Mellanox-ConnectIB-Karte
  Minimalkonfiguration: 2 Knoten

High-End-Leistung, maximale Energieeffizienz:
Rechenknoten Dell PowerEdge R720 mit Intel Xeon Prozessoren E5-2680 v2 (insgesamt 20 Kerne pro Knoten),
  64 GB Arbeitsspeicher und Mellanox-ConnectIB-Karte
  Minimalkonfiguration: 2 Knoten

Einstiegssystem:
Rechenknoten Dell PowerEdge R620 mit Intel Xeon Prozessoren E5-2667 v2 (insgesamt 16 Kerne pro Knoten),
  32 GB Arbeitsspeicher, NetEffect X520 iWARP-Karte
  Minimalkonfiguration: 2 Knoten

© Dell | Abschnitt 1
Benchmarkstudie: Optimierte Falltests mit Dell, Intel und Altair
7
Zusammenfassung der Ergebnisse
Die wichtigsten Ergebnisse dieser Studie lassen sich wie folgt zusammenfassen:

    Das Dell-Intel-Cluster war im Vergleich zur Referenzkonfiguration bei der RADIOSS-Falltest-Simulation
     sechsmal so schnell.
      o Der Intel Xeon Prozessor E5-2697 v2 erzielte die beste Zeitverkürzung der 3 getesteten Prozessoren:
      o weniger als 4 Std. für 21 Simulationsläufe

    Das AMS (Advanced Mass Scaling) von RADIOSS kann den Vorgang zusätzlich um das 1,7fache
     beschleunigen.
      o Geschätzt 1,7-mal schneller mit aktiviertem AMS
      o Zeit bis zum Abschluss weniger als 2,5 Std. (weniger als 400 Sekunden für einen einzelnen Durchlauf)

    Der Intel Xeon Prozessor E5-2680 v2 bietet optimale Energieeffizienz
      o Der Intel Xeon Prozessor E5-2680 v2 hat in diesem Test bei der Ausführung der 21 Simulationen einen
          geringeren Energieverbrauch
      o In einer Produktivumgebung im Dauerbetrieb (24x7) hat der Intel Xeon Prozessor E5-2680 v2 eine um
          21,3 % geringere durchschnittliche Leistungsaufnahme als der Intel Xeon Prozessor E5-2697 v2, was
          mehr als die TDP-Differenz (115 W gegenüber 135 W) von 17 % ist.

Mit der Falltestlösung von Altair auf Dell/Intel-Systemen kann die Stabilität von Mobiltelefonen bei Stößen
optimiert und sichergestellt werden, dass die Anforderungen bezüglich der Garantie und der Kundenzufriedenheit
erfüllt werden. Weiterhin ermöglicht das System eine Verbesserung der Designqualität durch die Untersuchung
der Effekte bei Veränderungen und die Gewinnung von Einblicken in das dynamische Verhalten bei realen
Falltests, mit detaillierten Daten über das Verhalten der Produktkomponenten. Durch reduzierte Zeitrahmen und
Kosten für die Produktentwicklung erhalten die Hersteller mehr Zeit, um sich auf Designverbesserungen zu
konzentrieren, was letzten Endes in besseren Endprodukten resultiert.

Neben dem Falltest gibt es in der HyperWorks-Simulation-Suite von Altair noch eine Reihe anderer Technical-
Computing-Anwendungen, die von den High-End-Clustern von Dell mit den neuesten Intel-Prozessoren
profitieren können, zum Beispiel bei Pressvorgängen, NVH-Simulationen (Noise, Vibration, Harshness),
Simulationen in der numerischen Strömungsmechanik usw.

Weitere Informationen
        Mehr über Altair-Software:
            o HyperWorks-Suite: www.altairhyperworks.com
            o PBS-Works-Suite: www.pbsworks.com
        Demo anfordern: www.altair.com/dell-intel-drop-test
        Mehr über Dell: www.dell.com und www.dell.de
        Mehr über Intel:
            o newsroom.intel.com
            o blogs.intel.com.
            o www.intel.com/products/server/processor/xeonE5/index.htm

        Kontakt:
             o Altair: www.altair.com/PageAllLocations.aspx
             o Dell: www.dell.com und www.dell.de/hpc
             o Intel: www.intel.com

© Dell | Abschnitt 1
Benchmarkstudie: Optimierte Falltests mit Dell, Intel und Altair
8
Sie können auch lesen