Benchmarkstudie: Optimierte Falltests mit Dell, Intel und Altair
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
Benchmarkstudie: Optimierte Falltests mit Dell, Intel und Altair Fredrik Nordgren, Master of Science im Maschinenbau, Application Engineer, Altair Eric Lequiniou, Director High Performance Computing, Altair Martin Hilgeman, HPC Consultant, Dell © Dell | Abschnitt 1 Benchmarkstudie: Optimierte Falltests mit Dell, Intel und Altair 1
Einleitung Stoßanalysen oder Falltests gehören zu den wichtigsten Phasen der Produktentwicklung und des Produktdesigns. Software kann diese Prüfungen akkurat simulieren, was den Herstellern enorme Vorteile hinsichtlich Kosten und Markteinführungszeit bietet. Dell, Intel und Altair haben gemeinsam eine Lösung für virtuelle Falltests mit integrierter Simulations- und Optimierungsanalyse analysiert, die nachweisliche Verbesserungen beim Zeitaufwand und der Genauigkeit bietet. Mit dieser Lösung können Techniker mehr Designalternativen untersuchen, um die Widerstandsfähigkeit und Zuverlässigkeit von Produkten zu verbessern. So können Hersteller die Entwicklungszeit hochleistungsfähiger Designs erheblich verkürzen und die Produktqualität bei gleichzeitig minimaler Vorlaufzeit erhöhen. Problemstellung: Schnellere Durchführung und höhere Genauigkeit von Falltests Ob bei Smartphones oder Autoteilen: Vor der endgültigen Produktion müssen die Produkte hinsichtlich ihres Stoßverhaltens getestet werden. Dem Hersteller fällt die Aufgabe zu, Produkte zu entwickeln, die nach dem Aufprall beim Fallenlassen, bei Stößen oder in anderen Situationen, in denen die Gefahr einer dauerhaften Beschädigung besteht, bestmöglich funktionieren. Simulationssoftware für Falltests unterstützt Hersteller dadurch, dass Produkttests weniger Zeit benötigen, was höhere Designqualität ermöglicht und die Notwendigkeit physikalischer Tests verringert. Derartige Software bildet die Komplexität der physischen Umgebung und der Materialien nach, simuliert den Stoß bzw. Fall und liefert detaillierte technische Angaben darüber, wie sich das Produkt bei diesem Ereignis verhält. Allgemein steht, wegen der Nachfrage nach Falltests, ausgereifte Software für derartige Problemstellungen zur Verfügung, wobei entsprechende Lösungen auf Crashsimulationen im Automobilbau zurückreichen. Speziell im Zusammenhang mit Falltests für Mobiltelefone gibt es jedoch besondere Herausforderungen, weil beispielsweise mehr Einzelteile mit vielen verschiedenen Materialien und Montageverfahren involviert sind, die alle sorgsam modelliert werden müssen, um mögliche Schäden durch Stöße zu bewerten. Dazu kommt, dass die Techniker das Modell und das Postprocessing manuell aufsetzen müssen, was alles viel Zeit in Anspruch nimmt. Das Endziel ist ein robustes Produkt, das einen Aufprall unter allen Winkeln sowie andere Belastungen (Druck auf die Glasfläche, Biegung, Torsion usw.) übersteht. Dafür ist eine Vielzahl von Simulationen erforderlich und infolgedessen eine schnelle, skalierbare Datenverarbeitung sowie eine Softwareumgebung, die es den Technikern erlaubt, mehr Designalternativen zu untersuchen, um ein besseres Verständnis der physikalischen Vorgänge während des Stoßes zu erlangen. Außerdem brauchen die Techniker integrierte, automatisierte Lösungen mit Schlüsselelementen wie der eingebauten Optimierung, damit die Prozesse reibungslos ablaufen und Fehlerrisiken reduziert werden. © Dell | Abschnitt 1 Benchmarkstudie: Optimierte Falltests mit Dell, Intel und Altair 2
Lösung: Schnellere Falltestsimulation mit Dell, Intel und Altair Bei dieser Studie haben Dell, Intel und Altair kooperiert, um die Software für Falltestsimulationen von Altair auf einem Dell-Cluster mit Prozessoren von Intel zu testen. Die von Dell und Intel bereitgestellte Infrastruktur beschleunigt die Simulation durch die Steigerung der Leistung des Stoßanalyse-Solvers RADIOSS, wenn dieser auf einem High-End-Cluster von Dell mit den neuesten Intel® Xeon® E5-v2- Prozessoren läuft. Dieser „Solver“ – die entscheidende rechenintensive Komponente in der Falltestlösung von Altair – führt gerade jene komplexen Simulationen aus, bei denen besonders effiziente Hardware und schnelle Prozessoren vorteilhaft sind. Falltestlösung von Altair Altairs automatisierte Lösung für Falltests besteht aus einem Paket integrierter Softwaretools, die mit Blick auf die Optimierung von Leistung, Durchsatz und Nutzwert entwickelt wurden: HyperWorks ist eine Softwaresammlung für das Modellieren, die Analyse und die Optimierung; sie vereint die folgenden Komponenten zu einer kompletten Lösung für Falltests: o Hochleistungsfähiger Finite-Elemente-Präprozessor (HyperMesh), der selbst größte Modelle vorbereiten kann; mit einem umfassenden Satz von Tools für die Geometriebearbeitung zur effizienten Vorbereitung von Modellen für die Gittererzeugung (Meshing) o Strukturanalyse-Solver (RADIOSS) – mit höchster Qualität, Robustheit und Skalierbarkeit seit mehr als 20 Jahren als Standard für Crash- und Stoßtests im Automobilbau etabliert. Mit der RADIOSS-eigenen „Advanced Mass Scaling“-Technik (AMS) können die Benutzer noch bessere Softwareleistung erzielen. o Hochentwickelte eingebettete Software für Designuntersuchung (Design-Exploration), -Approximation und -Optimierung (HyperStudy) mit Formoptimierung, direkter Parametrisierung, Data Mining und direkten Lesefunktionen für RADIOSS-Ergebnisse PBS Professional – Workload-Management-Software für das Job-Scheduling im High-Performance- Computing (HPC), mit hoher Skalierbarkeit und Benutzerfreundlichkeit, seit mehr als 20 Jahren bewährt bei Tausenden von Kunden. Vorherige Tests von Altair haben gezeigt, dass diese Lösung mit aktiviertem RADIOSS-AMS die Laufzeiten für Falltests von 65 auf 36 Minuten verkürzen kann (Verbesserung von 45 %), im Vergleich zur 64-minütiger Laufzeit mit einem führenden alternativen Solver. Dell-HPC-Lösungen mit Intel-Technik Dell bietet HPC-Komponenten und schlüsselfertige Lösungen an, die es Unternehmen und anderen Einrichtungen ermöglichen, die Potenziale der HPC-Technik auszuschöpfen und ihre Produktinnovation und -entwicklung zu optimieren. In Zusammenarbeit mit Intel und Altair können ausgereifte Lösungen für die Produktentwicklung auf den Markt gebracht werden, die zur Produktivitätssteigerung und Kostensenkung beitragen und das Management komplexer Cluster-Umgebungen vereinfachen. Für die hier durchgeführte Falltest-Analyse wurden Dell-Bladeserver des Typs PowerEdge M620 mit Intel® Xeon® Prozessoren der Produktfamilie E5-2600 v2 ausgewählt. Diese leistungsstarken und energieeffizienten Prozessoren verfügen über 50 % mehr Kerne und Cache als die vorige Prozessorgeneration; dazu kommen schnellerer Arbeitsspeicher und weitere Hardware-Verbesserungen gegenüber der vorangegangenen Servergeneration mit Intel Xeon Prozessoren. Eine Leistungssteigerung bei HPC-Anwendungen kann durch die Intel® Advanced Vector Extensions (Intel® AVX) erreicht werden. Die Intel® AVX beschleunigen Vektor- und Fließkommaberechnungen mit Unterstützung von 256-bit-Vektoren und beschleunigter 32/64-bit-Datenkonvertierung. Die Reihe der Intel® Xeon® E5-v2- Prozessoren bietet – von der Anzahl der Kerne bis zu Modellen mit höherer Taktfrequenz – ein breites Spektrum verschiedener Prozessordaten, um den Anforderungen der jeweiligen Anwendung des Benutzers zu entsprechen. © Dell | Abschnitt 1 Benchmarkstudie: Optimierte Falltests mit Dell, Intel und Altair 3
Überblick Über das Benchmarking-projekt Einlegen einer Dämpfung zwischen der Steuerplatine und dem LCD-Modul, um Deformationen bei einem Fall auf die Rückseite zu verringern – zwei verschiedene Formen sind rechts dargestellt. Für den Leistungstest der Dell-Intel-Altair-Lösung konzentrierten sich die Techniker auf einen bestimmten Anwendungsfall, bei dem getestet werden sollte, ob eine zusätzliche Dämpfungsschicht die Materialbeanspruchung bei einem Handydesign verringern könnte. In diesem Szenario führt der Abstand zwischen der Abschirmung und der Platine des Mobiltelefons bei einem Falltest auf dessen Rückseite zu einer Verbiegung und zu starker Beanspruchung im LCD-Modul. Das Ziel war eine optimierte Ausführung der Dämpfung mit idealen Eigenschaften (Dicke, Größe, Flexibilität usw.), um die Belastung in den Kantenelementen des LCDs zu minimieren. 1. Design: In der ersten Projektphase wurde das Konzept in HyperMesh modelliert und Designvariablen wurden mit Morphingtechnik sowie Parametrisierung der Eingabedatei erzeugt. 2. Optimierung: Eine statistische Versuchsplanung wurde durchgeführt, um einen „Response-Surface“- Plan zu erhalten. Dann erfolgte eine Optimierung nach der Response-Surface-Methode, anstelle der Anwendung eines Finite-Elemente-Modells. 3. Verifizierung: Das optimierte Modell wurde mit Finite-Elemente-Analyse (FEA) evaluiert/simuliert und die Leistungsresultate wurden verifiziert. Diese Simulationen wurden auf Systemen mit den folgenden Komponenten durchgeführt: 16 x Dell-Bladeserver PowerEdge M620 mit Intel Xeon Prozessoren E5-2680 v2, E5-2667 v2 und E5-2697 v2, 128 GB Arbeitsspeicher pro Knoten, mit Mellanox-FDR-InfiniBand-Schnittstellen. Titreşim azaltıcı şerit alanı ve kalınlık sonucu ortaya çıkan LCD baskıları yüzeyi © Dell | Abschnitt 1 Benchmarkstudie: Optimierte Falltests mit Dell, Intel und Altair 4
Ergebnisse der Leistungstests Mit der RADIOSS-Software von Altair auf einem Dell-Bladesystem PowerEdge M620 konnten die Techniker die 21 für diese Optimierungsstudie erforderlichen Falltestsimulationen durchführen und Benchmarks für 3 verschiedene Intel-Prozessoren (Intel Xeon Prozessoren E5-2690 v2, E5-2667 v2 und E5-2697 v2) in 2-Knoten- Konfigurationen mit den folgenden Kern- und reinen Leistungsdaten messen: CPU Kerne bei 2 Reine Einzelner Durchlauf Gesamtzeit Knoten Fließkommaleistung Durchschn. Zeit (s) für 21 Durchläufe (s) insgesamt GFLOP/s E5-2680 v2 40 896 719 15110 E5-2667 v2 32 845 742 15598 E5-2697 v2 48 1037 660 13868 Abbildung 1: Leistungsübersicht Mit niedrigerer Taktfrequenz, aber mehr Kernen geht der E5-2697 v2 aus dem Vergleich der Durchlaufzeiten als klarer Sieger hervor. Diese Leistungsergebnisse werden durch die hervorragende Skalierbarkeit von RADIOSS möglich, da die geringere Taktfrequenz bzw. Rechenleistung pro Kern die mit der großen Anzahl von Kernen insgesamt erzielte Leistung nicht beeinträchtigt. 900 800 700 600 Durchlaufzeit (s) 500 E5-2680v2 400 E5-2667v2 300 E5-2697v2 200 100 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 Simulationslauf-Nr. Abbildung 2: Einzelheiten zu den Leistungseigenschaften © Dell | Abschnitt 1 Benchmarkstudie: Optimierte Falltests mit Dell, Intel und Altair 5
Im Vergleich zur Referenzzeit von 65 Minuten (3900 Sekunden), die mit einem einzelnen Rechenknoten mit Intel Xeon Prozessor X5570 bei 2,93 GHz (mit insgesamt 8 Kernen) erzielt wurden, sind 2 Knoten mit E5-2697-v2- Prozessoren ungefähr 6-mal so schnell (nur 660 Sekunden für einen Durchlauf). Dies ermöglicht den Abschluss der gesamten Optimierung (21 Simulationsläufe) in weniger als 4 Stunden (13 868 Sekunden). Darüber hinaus können die Benutzer mit der AMS-Option (Advanced Mass Scaling) von RADIOSS die Zeitdauer bis zur Lösung noch weiter verkürzen und dabei gleich genaue Ergebnisse erhalten. AMS stellt eine fortgeschrittene Lösung für quasistatische Probleme dar und ist eine Alternative zu impliziten nichtlinearen Simulationen, bei denen es teilweise schwierig ist, eine Konvergenz zu erhalten, zum Beispiel wegen zu hoher Nichtlinearität bei Kontakten, komplexem Verhalten von Materialien und bei Bruchmodellen. Bei der schnellsten Konfiguration mit Intel Xeon Prozessoren E5-2697 v2 dürfte die Optimierung mit AMS 1,7-mal schneller abgeschlossen sein, also in weniger als 2,5 Stunden (weniger als 400 Sekunden für einen einzelnen Simulationslauf). Als weiterer wichtiger Aspekt bei der Optimierung von Konfigurationen ist die Skalierbarkeit natürlich nicht nur vom ausgewählten Intel Xeon Prozessor und der Anzahl der Kerne abhängig, sondern auch von der Zahl der eingesetzten Rechenknoten. In Anbetracht der parallelen Charakteristik dieser Simulationen kann man davon ausgehen, dass bei einer Verteilung von ungefähr der Hälfte der Simulationsläufe auf die ersten beiden Knoten und des Rests auf weitere zwei Knoten, eine Verkürzung der Simulationszeit auf etwa die Hälfte möglich wäre. Mit dieser Logik können tatsächlich gemessene Ergebnisse auf Systeme mit mehr Rechenknoten extrapoliert werden, um zur gewünschten Simulationszeit zu kommen – zum Beispiel für ein 8-Knoten-Cluster für Simulationen. Ein solcher Ansatz könnte mithilfe eines Tools wie PBS Professional vereinfacht werden, das die Simulationsjobs automatisch auf die verfügbaren Ressourcen verteilt, um die Recheneffizienz und die Auslastung von Ressourcen zu optimieren. Energieeffizienz und Leistung Bei den heutigen Geschäftsstrategien und Planungsvorgängen spielen Energieverbrauch und Kühlung eine wichtige Rolle für Kaufentscheidungen. Deshalb kann die Energieeffizienz von Systemkonfigurationen für Simulationen in Unternehmen bzw. Einrichtungen, die Wert auf optimale Nutzung der Energie und zugleich optimale Leistungseigenschaften legen, von essentieller Bedeutung sein. Bei der Durchführung der Simulationstests auf dem Dell-PowerEdge-Bladesystem wurde die Leistungsaufnahme in Watt bei jedem Simulationslauf erfasst (siehe folgendes Diagramm). Während die Gesamtleistungsaufnahme bei den 21 Simulationsläufen mit den Intel Xeon Prozessoren E5-2667 v2 und E5-2697 v2 ungefähr auf gleichem Pegel verläuft, ist die Leistungsaufnahme des Intel Xeon Prozessors E5-2680 v2 deutlich geringer. Aus anderer Sicht betrachtet: In einer Produktivumgebung im Dauerbetrieb (24x7) hat der Intel Xeon Prozessor E5-2680 v2 eine um 21,3 % geringere durchschnittliche Leistungsaufnahme pro Knoten als der Intel Xeon Prozessor E5-2697 v2, was mehr als die TDP-Differenz (115 W gegenüber 135 W) von 17 % ist. © Dell | Abschnitt 1 Benchmarkstudie: Optimierte Falltests mit Dell, Intel und Altair 6
Empfohlene Konfigurationen Berücksichtigt man Gesamtleistung, Preis-Leistungs-Verhältnis und Energieeffizienz, dann kann man bezüglich der erforderlichen Rechenknoten für die Einrichtung einer Simulationsumgebung die folgenden Empfehlungen geben, wenn man das Szenario für den Falltest zugrunde legt. Die tatsächliche Anzahl von Knoten hängt dann von den Anforderungen durch das Gesamtvolumen der Aufgaben ab. Maximale Leistung: Rechenknoten Dell PowerEdge mit Intel Xeon Prozessoren E5-2697 v2 (insgesamt 24 Kerne pro Knoten), 64 GB Arbeitsspeicher und Mellanox-ConnectIB-Karte Minimalkonfiguration: 2 Knoten High-End-Leistung, maximale Energieeffizienz: Rechenknoten Dell PowerEdge R720 mit Intel Xeon Prozessoren E5-2680 v2 (insgesamt 20 Kerne pro Knoten), 64 GB Arbeitsspeicher und Mellanox-ConnectIB-Karte Minimalkonfiguration: 2 Knoten Einstiegssystem: Rechenknoten Dell PowerEdge R620 mit Intel Xeon Prozessoren E5-2667 v2 (insgesamt 16 Kerne pro Knoten), 32 GB Arbeitsspeicher, NetEffect X520 iWARP-Karte Minimalkonfiguration: 2 Knoten © Dell | Abschnitt 1 Benchmarkstudie: Optimierte Falltests mit Dell, Intel und Altair 7
Zusammenfassung der Ergebnisse Die wichtigsten Ergebnisse dieser Studie lassen sich wie folgt zusammenfassen: Das Dell-Intel-Cluster war im Vergleich zur Referenzkonfiguration bei der RADIOSS-Falltest-Simulation sechsmal so schnell. o Der Intel Xeon Prozessor E5-2697 v2 erzielte die beste Zeitverkürzung der 3 getesteten Prozessoren: o weniger als 4 Std. für 21 Simulationsläufe Das AMS (Advanced Mass Scaling) von RADIOSS kann den Vorgang zusätzlich um das 1,7fache beschleunigen. o Geschätzt 1,7-mal schneller mit aktiviertem AMS o Zeit bis zum Abschluss weniger als 2,5 Std. (weniger als 400 Sekunden für einen einzelnen Durchlauf) Der Intel Xeon Prozessor E5-2680 v2 bietet optimale Energieeffizienz o Der Intel Xeon Prozessor E5-2680 v2 hat in diesem Test bei der Ausführung der 21 Simulationen einen geringeren Energieverbrauch o In einer Produktivumgebung im Dauerbetrieb (24x7) hat der Intel Xeon Prozessor E5-2680 v2 eine um 21,3 % geringere durchschnittliche Leistungsaufnahme als der Intel Xeon Prozessor E5-2697 v2, was mehr als die TDP-Differenz (115 W gegenüber 135 W) von 17 % ist. Mit der Falltestlösung von Altair auf Dell/Intel-Systemen kann die Stabilität von Mobiltelefonen bei Stößen optimiert und sichergestellt werden, dass die Anforderungen bezüglich der Garantie und der Kundenzufriedenheit erfüllt werden. Weiterhin ermöglicht das System eine Verbesserung der Designqualität durch die Untersuchung der Effekte bei Veränderungen und die Gewinnung von Einblicken in das dynamische Verhalten bei realen Falltests, mit detaillierten Daten über das Verhalten der Produktkomponenten. Durch reduzierte Zeitrahmen und Kosten für die Produktentwicklung erhalten die Hersteller mehr Zeit, um sich auf Designverbesserungen zu konzentrieren, was letzten Endes in besseren Endprodukten resultiert. Neben dem Falltest gibt es in der HyperWorks-Simulation-Suite von Altair noch eine Reihe anderer Technical- Computing-Anwendungen, die von den High-End-Clustern von Dell mit den neuesten Intel-Prozessoren profitieren können, zum Beispiel bei Pressvorgängen, NVH-Simulationen (Noise, Vibration, Harshness), Simulationen in der numerischen Strömungsmechanik usw. Weitere Informationen Mehr über Altair-Software: o HyperWorks-Suite: www.altairhyperworks.com o PBS-Works-Suite: www.pbsworks.com Demo anfordern: www.altair.com/dell-intel-drop-test Mehr über Dell: www.dell.com und www.dell.de Mehr über Intel: o newsroom.intel.com o blogs.intel.com. o www.intel.com/products/server/processor/xeonE5/index.htm Kontakt: o Altair: www.altair.com/PageAllLocations.aspx o Dell: www.dell.com und www.dell.de/hpc o Intel: www.intel.com © Dell | Abschnitt 1 Benchmarkstudie: Optimierte Falltests mit Dell, Intel und Altair 8
Sie können auch lesen