Speichertechnologien und ihre Nutzung - Hauptseminar Hochleistungsrechner: Aktuelle Trends und Entwicklungen Wintersemester 2017/2018

Die Seite wird erstellt Moritz Schütze
 
WEITER LESEN
Speichertechnologien und ihre Nutzung - Hauptseminar Hochleistungsrechner: Aktuelle Trends und Entwicklungen Wintersemester 2017/2018
Hauptseminar Hochleistungsrechner: Aktuelle Trends und
                          Entwicklungen
                     Wintersemester 2017/2018
          Speichertechnologien und ihre Nutzung
                                         Maurice Rang
                              Ludwig-Maximilians-Universität München
                                                 30.01.2018

Abstract                                                    einiger Experten Glauben soll sich der weltweite
                                                            Datenbestand im Jahre 2025 auf über 163 Zettabyte
Die Bedeutung von nicht-flüchtigen Speichertech-            (ZB) belaufen und damit nochmals um mehr als
nologien sowie deren Verwendung steigt nach wie             1000% im Vergleich zum Jahr 2016 anwachsen [13].
vor an.      Die vorliegende Seminararbeit liefert          Eine Begleiterscheinung, die durch diese rasante
einen kurzen Überblick über die in nicht-flüchtigen         Entwicklung entsteht, ist die immer größer wer-
Speichertechnologien verwendete Hardware und                dende Nachfrage nach neuen und verbesserten Spe-
kann als Einstieg in das Thema genutzt wer-                 ichertechnologien, um diese Menge an Daten ef-
den. Dazu wird zunächst deren grundlegender                 fizient und schnell verarbeiten zu können. Par-
Aufbau vorgestellt. Darüberhinaus werden Unter-             allel dazu ist die Weiterentwicklung und kon-
schiede zwischen den einzelnen Technologien er-             stante Verbesserung der benötigten Mikroprozes-
läutert und analysiert. Abschließend werden in              soren genauso unabdingbar, da die Verarbeitung
diesem Kapitel verschiedene Programmiermodelle              dieser Größenordnung an Daten ein hohes Maß an
und Einsatzmöglichkeiten für nicht-flüchtige Spe-           Rechenleistung benötigt. In Bezug auf die Entwick-
ichertechnologien aufgezeigt. Zum Ende dieser Ar-           lung von Mikroprozessoren stellte Gordon Moore
beit gibt es eine kurze Darstellung der Speichertech-       einer der Mitgründer von Intel im Jahr 1965 eine
nologie 3D Dram und dazu zwei passende Beispiele.           Theorie auf, die von da an als Mooresches Gesetz
                                                            bekannt wurde. Diese Theorie besagt, dass ”sich
                                                            die Anzahl der Komponenten, die sich auf einem
1    Einleitung                                             Chip befindet, jedes Jahr ungefähr um das Dop-
In den letzten Jahren ist die Datenmenge, die durch         pelte erhöht” [10].
die Menschheit produziert wurde, auf ein sehr ho-           Auf den nachfolgenden Seiten werden zunächst vier
hes Niveau angewachsen. Schaut man sich das Jahr            Speichertechnologien vorgestellt, die zur Familie
2007 an stellt man fest, dass sich hier die Kapaz-          der nicht flüchtigen Speicher gehören. Dabei wer-
ität des weltweiten Datenbestandes noch auf etwa            den von jeder Technologie die technischen Grund-
295 Exabyte (EB) beziffern ließ [14]. Circa 10              lagen und ihre Funktion dargelegt. Im Anschluss
Jahre später im Jahre 2016 ist dieser Bestand schon         daran wird auf die potenziellen Einsatzgebiete und
auf 16 Zettabyte (ZB) angewachsen und damit um              Programmiermodelle von nicht-flüchtigen Speich-
über 5000% angestiegen. Schenkt man Prognosen               ern eingegangen. Den Schlussteil der vorliegenden

                                                        1
Speichertechnologien und ihre Nutzung - Hauptseminar Hochleistungsrechner: Aktuelle Trends und Entwicklungen Wintersemester 2017/2018
Abb. 2: PCM im Vergleich [12]
Abb. 1: Aufbau eines Phase-Change Memory De-
vice [12]
                                                           einem Bereich von mehreren hundert Millisekunden
                                                           liegt, beträgt die Schreibzeit bei nicht-flüchtigen
Arbeit bildet das Kapitel 3D Stacked DRAM. Hier            Speichern wenige Nanosekunden. Dadurch eignet
wird wiederum zunächst die technsiche Funktional-          sich nicht-flüchtiger Speicher besonders für Situa-
ität dieser Technologie und dann deren Funktional-         tionen, in denen häufige Schreibvorgänge aufftreten
ität beschrieben.                                          [6].

2     NVRAM                                                2.2   Phase-Change Memory (PCM)
Im folgenden Kapitel werden vier unterschiedliche          Phase-Change Memory (PCM) ist eine Spe-
Speichertechnologien mit ihrem technischen Aufbau          ichertechnologie, die zur Familie der nicht-
und ihrer Funktion vorgestellt, die zur Familie der        flüchtigen Speicher gehört und ein sogenanntes
nicht-flüchtigen Speicher gehören.                         ”phase-change material” zur Sicherung von Daten
                                                           verwendet. Dieses Material kann zwei physische
                                                           Zustände annehmen: kristallin oder amorph. Der
2.1   Definition
                                                           Vorteil dieses Materials liegt darin, dass es seinen
NVRAM ist eine Form des neuen und revo-                    Zustand sehr zuverlässig, schnell und oft wechseln
lutionären Speichers, der auf der einen Seite              kann. Der amorphe Zustand hat eine geringe op-
Zugriffscharakteristiken    von     herkömmlichen          tische Reflexivität und einen hohen elektrischen
RAM Speichern wie DRAM oder SRAM bere-                     Widerstand. Der kristalline Zustand dagegen hat
itstellt und zum anderen die nicht-flüchtigen              eine hohe Reflexivität und einen geringen Wider-
Speichereigenschaften     von   Sekundärspeichern          stand. Abbildung 1 zeigt den Aufbau eines Phase-
wie Flash miteinander vereint. Da die Halbleit-            Change Memory Device’. Das Material befindet
ertechnologie sehr große Fortschritte macht ist            sich zwischen einer oberen und unteren Elektrode
davon auszugehen, dass NVRAM zukünftig ein                 mit einem Hitzelement, das die Erweiterung zur
fester Bestandteil von eingebetteten Systemen und          unteren Elektrode darstellt. Das Kristallisieren
Computern wird [6].                                        des Materials wird als sogenannte SET-Methode
                                                           bezeichnet. Diese Operation wird durch moderate
NVRAM weist im Vergleich zu anderen Spe-                   Leistung sowie eine längere Dauer von Elektroim-
ichertechnologien zahlreiche Vorteile auf, vor allem       pulsen kontrolliert. Dabei befindet sich die Spe-
gegenüber Flash-Speichern. Ein großer Vorteil, den         icherzelle in einem Zustand mit geringem Wider-
nicht-flüchtige Speicher im Gegensatz zu Flash-            stand. Die RESET-Methode dagegen zeichnet sich
Speichern haben ist ihre schnelle Zugriffszeit,            durch hohe Stromimpulse aus, die die Speicherzelle
die hauptsächlich auf Schreibzugriffe bezogen ist.         in einen Zustand mit hohem Widerstand verset-
Während die Zugriffszeit bei Flash-Speichern in            zen. Die gespeicherten Daten der Zelle können mit

                                                       2
Speichertechnologien und ihre Nutzung - Hauptseminar Hochleistungsrechner: Aktuelle Trends und Entwicklungen Wintersemester 2017/2018
Abb. 3: Magnetic Tunnel Junction (MTJ) [16]

Hilfe von einer sehr geringen Stromzuführung aus-
gelesen werden. In der oberen Tabelle wird die
Speichertechnolgie PCM mit anderen Technologien                    Abb. 4: STT-RAM im Vergleich [16]
in Bezug auf die Parameter Dichte, Lese-Latenz,
Schreibgeschwindigkeit, Standhaftigkeit und Spe-
icherung verglichen. Schaut man sich nun den Ver-
gleich an sieht man, dass PCM die vielversprechen-          kann. Die magnetische Ausrichtung zwischen den
sten Charakteristiken besitzt. In Bezug auf die             beiden Schichten erzeugt unterschiedliche Wider-
Dichte weist PCM (2X - 4X) ähnliche Werte auf               stände beim MTJ, die zum repräsentieren der in
wie sie bei NAND Flash (4X) zu finden sind. Sieht           den Zellen gespeicherten Daten genutzt werden.
man sich nun den Parameter Lese-Latenz an, stellt           Wenn das magnetische Feld zwischen den beiden
man fest, dass es hier Parallelen zu NOR Flash (300         Schichten parallel zueinander ist und der Wider-
ns) gibt, welche circa vier mal langsamer ist als die       stand des MTJ niedrig ist, repräsentiert dieser Zu-
Lese-Latenz bei DRAM (60 ns). Vergleicht man                stand eine logische 0. Sobald das Feld antiparallel
abschließend den Paramter Schreibgeschwindigkeit            ist und die MTJ einen hohen Widerstand hat, wird
ist zu erkennen, dass diese bei PCM mit circa 100           eine logische 1 repräsentiert (siehe Abbildung 3).
MB/s höher ist als die bei den zwei Flash-Speichern         Während des Lesevorgangs liegt eine kleine neg-
[12].                                                       ative Spannung zwischen der Bit und Word line
                                                            an. Um eine logische 0 schreiben zu können, wird
2.3   Spin-Transfer           Torque         RAM            eine positive Spannung zwischen der Bit und Word
      (STT-RAM)                                             line angelegt. Eine logische 1 wird durch eine neg-
                                                            ative Spannung geschrieben, die einen Strom in
Spin-Transfer Torque RAM (STT-RAM) ist eine                 die entgegengesetzte Richtung erzeugt [16]. Abbil-
entstehende nicht-flüchtige Speichertechnologie, die        dung 4 zeigt STT-RAM im Vergleich zu den Spe-
als Universalspeicher eingesetzt werden kann [15].          ichertechnologien SRAM und eDRAM hinsichtlich
Sie gehört zu den sogenannten magnetoresistiven             verschiedener Kriterien. Sieht man sich nun die
Speicherarten (MRAM). Wie bei herkömmlichen                 einzelnen Punkte an stellt man fest, dass STT-
magnetoresistiven Speicherarten nutzt eine STT-             RAM nicht viel schlechter abschneidet als die an-
RAM Zelle zum Speichern von binären Daten                   deren beiden Technologien. Ein wichtiger Vorteil,
eine Magnetic Tunnel Junction (MTJ). Eine MTJ               den STT-RAM gegenüber den anderen Technolo-
besteht aus zwei ferromagnetischen Schichten, dem           gien besitzt ist, dass die Eigenschaft des nicht
Reference Layer und Free Layer und zusätzlich aus           flüchtigen Speichers. Nachteile, die diese Tech-
einem Tunnel Barrier Layer (MgO). Die magnetis-             nologie im Vergleich zu SRAM und eDRAM den-
che Ausrichtung des Reference Layer ist beständig           noch aufweist sind eine lange Schreibzeit, ein hoher
und ändert sich nicht, wohingegen die magnetis-             Energieverbrauch beim Schreiben und eine geringe
che Ausrichtung des Free Layers geändert werden             Beständigkeit.

                                                        3
Speichertechnologien und ihre Nutzung - Hauptseminar Hochleistungsrechner: Aktuelle Trends und Entwicklungen Wintersemester 2017/2018
wird eine postive Spannung angelegt was zur Folge
                                                            hat, dass die Ionen zurück in die Elektrolyte fließen.
                                                            Der erzeugte ”Nanodraht” wird zerstört und der
                                                            Widerstand wieder erhöht [9].

                                                            2.5    3D XPoint
                                                            3D XPoint ist eine von Intel und Micron entwick-
                                                            elte nicht-flüchtige Speichertechnologie, die auf der
                                                            sogenannten CrossPoint-Architektur basiert. In
      Abb. 5: 3D-Crosspoint-Architektur [1]                 Abbildung 5 ist ein Querschnitt dieser Architek-
                                                            tur zu sehen. Die Besonderheit hierbei liegt in
                                                            der Adressierung und in der Kontroll-Architektur
2.4   Resistive Random Access Mem-                          der Speicherzellen. Der Einsatz von Silizium für
      ory (R-RAM)                                           die Herstellung der elektronischen Komponenten
                                                            ist nach wie vor gegeben. Der Unterschied zu
Resistive Random Access Memory (R-RAM) ist                  den anderen Technologien liegt jedoch darin, dass
ein weiteres Beispiel für eine nicht-flüchtige Spe-         nun keine Notwendigkeit mehr darin besteht für
ichertechnologie. Diese Technologie besteht im              jeden Bereich einer einzelnen Zelle oder mehrerer
Grunde aus zwei Operationen: Unipolares Switch-             Zellen einen Transistor einzusetzen. Dadurch wird
ing und bipolares Switching. Innerhalb dieses Kon-          es ermöglicht die Speicherdichte auf der einzel-
textes ist das unipolare Switching für das Ausführen        nen Fläche eines Chips um das Zehnfache zu er-
von Programmen und das Löschen zuständig. Dies              höhen. Jede einzelne Speicherzelle besteht aus
geschieht mit Hilfe von kurzen und langen Im-               einem Speicherwert-Selektor (in Abbildung 5 hell-
pulsen oder mit Hilfe von hoher und niedriger               grau markiert) und einem Speicher-Bit (in Ab-
Stromspannung mit der selben Spannungspolarität.            bildung 5 grün markiert).         Diese werden in
Im Gegensatz dazu werden bei bipolarem Switch-              mehreren Schichten gestapelt und von sogenan-
ing kurze Impulse mit einer umgekehrten Span-               nten Adressierungsleitungen miteinander verbun-
nungspolarität verwendet. Ein Beispiel für unipo-           den (in Abbildung 5 als graue Balken dargestellt).
lares Switching ist ein filament-basiertes R-RAM            Durch die Adressierungsleitungen liegt an jeder
Gerät. Ein Filament wird in Form eines isolierten           Speicherzelle eine Spannung an, die es ermöglicht
Dielektrikums erzeugt nachdem eine hohe Span-               zu bestimmen, ob es sich bei der auszuführen-
nung angesetzt wurde. Nachdem das Filament                  den Aktion um einen Lese- oder Schreibvorgang
geformt wurde, kann es durch angemessene Span-              handelt.     Das Weglassen der Transistoren für
nung gesetzt oder zurückgesetzt werden. Ein typis-          jede einzelne Zelle und das Zusammenschließen
ches Beispiel für bipolares Switching ist ein PCM           mehrerer Zellen hat zur Folge, dass die Architek-
Gerät, welches aus zwei metallischen Elektroden             tur des Speichers stabiler und langlebiger wird
besteht. Ein dünner Film aus Elektrolyten befindet          [2]. Setzt man 3D XPoint nun in Vergleich mit
sich zwischen den Elektroden. Wenn eine negative            NAND und DRAM Speichern ist festzustellen, dass
Spannung an der inaktiven Elektrode angelegt wird           3D XPoint ähnliche Werte in Sachen Lese- und
fließen metallische Ionen in die Elektrolyte und wer-       Schreibgeschwindigkeit aufweist wie sie bei DRAM
den durch die inaktive Elektrode vermindert. Ab-            vorkommen.        NAND Speicher sind bezüglich
schließend formen die Ionen einen kleinen ”Nan-             dieses Parameters langsamer als die beiden anderen
odraht” zwischen den Elektroden. Daraus resul-              Technologien. Einen Vorteil, den NAND sowie
tiert, dass der Widerstand zwischen den Elektroden          3D XPoint Speicher aufweisen sind die niedrigen
stark gesenkt wird. Soll die Zelle gelöscht werden          Kosten. Diese sind viel geringer als die bei DRAM

                                                        4
Speichertechnologien und ihre Nutzung - Hauptseminar Hochleistungsrechner: Aktuelle Trends und Entwicklungen Wintersemester 2017/2018
Speichern der Fall sind. Zu erwähnen ist jedoch,            gespeichert wird, wenn es zu einem Fehlerzustand
dass 3D XPoint Speicher immer noch ungefähr zehn            kommt. Bei einem Neustart des Systems werden die
mal teurer sind als NAND Speicher. Einen weit-              aktuellen Applikations- und OS-Stati durch einen
eren Vorteil, den 3D XPoint und NAND gegenüber              transparenten Checkpoint wieder hergestellt.
DRAM haben ist, dass sie nicht-flüchtig sind [3].           Zhao et al. haben eine Herangehenweise präsen-
                                                            tiert, die einen nicht-flüchtigen last-level cache und
                                                            nicht-flüchtigen Systemspeicher verwendet, um eine
3    Programmiermodelle                         für         persistente Speicherhierarchy schaffen zu können.
                                                            Hierbei ist es so, dass wenn eine Cache-line ak-
     NVRAM                                                  tualisiert wurde beinhaltet sie die aktuelle Version
                                                            während die Daten, die sich im nicht-flüchtigen Spe-
Die nicht-flüchtige Eigenschaft von Speichern               icher befinden noch die alte Version beinhalten.
erlaubt eine Vielzahl an unterschiedlichen Pro-             Wenn die ”dreckige” Cache-line bereinigt wurde,
grammiermodellen für nicht-flüchtige Speicher,              wird automatisch der alte Stand im nicht-flüchtigen
die diese gegen Programm- und auch gegen                    Speicher durch den neuen Stand ersetzt.
Systemabstürze sicher machen.     Einige dieser             Eine letzte Technik, die noch zu erwähnen bleibt
Programmiermodelle werden nun im Folgenden                  ist die von Condit et al. Sie beschäftigten sich
erläutert.                                                  mit einer Methodik, bei dem ein transaktionales
                                                            Filesystem zum Einsatz kommt, das die byte ad-
Ein erster Ansatz ist das sogenannte ”Mnemosyne”            dressierbarkeit von Speichern so beeinflusst, sodass
ein Interface, das von Volos et al. zum Program-            die Menge an Metadaten, die während einer Ak-
mieren von SCM’s entwickelt wurde. Dieses Inter-            tualisierung geschrieben wird, drastisch reduziert
face erlaubt es Applikationen statische Variablen           wird. Dieses Filesystem soll garantieren, dass das
zu deklarieren deren Werte selbst über einen Sys-           Schreiben im Filesystem dauerhaft wird und jede
temneustart hinaus bestehen bleiben. Darüber hin-           Operation des Filesystems automatisch in einer bes-
aus lässt es zu, dass Applikationen Speicher re-            timmten Reihenfolge ausgeführt wird [11].
servieren, der durch persistenten Speicher unter-
stützt wird. Die Schreibreihenfolge für persistente
Speicher wird hierbei durch eine Software geregelt,         4 Einsatzmöglichkeiten                         von
die non-cached Schreibmodi, cache-line flush An-              NVRAM
weisungen und Speicherbarrieren verwendet.
Ein weiterer Ansatz, der nach Coburn et al. be-             Da jede einzelne der vorgestellten Speichtech-
nannt wurde ist der NV-heap. Dies ist ein per-              nologien ihre Vor- und Nachteile besitzt haben
sistentes Objektsystem, das eine transaktionale Se-         sich einige Wissenschaftler gedacht, dass man die
mantik bereitstellt. Um sicherstellen zu können,            Vorteile besser nutzen könnte, wenn man die einzel-
dass die Anwendungen konsistent ausgeführt wer-             nen Technolgien miteinander kombiniert. Im fol-
den, werden bei NV-heap die Daten in flüchtige und          genden Abschnitt werden nun drei dieser Kombi-
nicht-flüchtige Daten separiert.                            nationen dargestellt [11].
Ein Ansatz, der sich von den beiden oben
Dargestellten differenziert wurde von Narayanan et
                                                            4.1    Flash + PCM
al. entwickelt. Dieser präsentierte eine Möglichkeit,
bei der der gesamte Systemspeicher nicht-flüchtig           Sun et al. hat die Kombination zwischen Flash-
ist. Dazu verwenden ein Prinzip, das als ”flush-on-         Speicher und PCM vorgeschlagen. Hierbei soll
fail” bezeichnet wird. Bei diesem Prinzip wird der          PCM als Protokollumgebung für den NAND Flash-
vorübergehende Status, der sich in den Registern            Speicher genutzt werden. Dieses Verfahren re-
der CPU und den Cache-lines befindet erst dann              duziert die Lese- sowie Löschoperationen für Flash,

                                                        5
Abb. 6: Architektur eines 3D Stacked DRAM Sys-                    Abb. 7: Architektur eines HMC [8]
tems [7]
                                                           auch eine höhere Performance pro Dollar hervor-
was die Lebenszeit, die Performance und Energieef-         rufen kann.
fizeienz des Flash-Speichers verbessert. Durch die
byte-addressierbarkeit von PCM wird zusätzlich die
Performance für Leseoperationen verbessert.                5 3D Stacked DRAM
                                                           3D Stacked DRAM ist eine Speichertechnologie,
4.2   DRAM + PCM                                           bei der mehrere DRAM Matrizen und logische
                                                           Schichten übereinander gestapelt werden und durch
Qureshi et al. haben einen Ansatz hervorgebracht,          sogenannte TSV’s (Through Silicon Vias) verbun-
der aus einem hybriden Hauptspeicher besteht, bei          den sind. Durch viele TSV Verbindungen ist eine
dem DRAM als ”Page Cache” genutzt wird, um                 Kommunikation mit hoher Bandbreite und geringer
die Vorteile in Bezug auf Latenz des DRAMs mit             Latenz zwischen den einzelnen Schichten möglich.
den Vorteilen der Kapazität von PCM kombinieren            Abbildung 6 zeigt den Aufbau einer 3D DRAM
zu können. Bei einem Seitenfehler wird die Seite,          Architektur. Hierbei ist zu erkennen, dass diese
die von der Hard Disk geholt wurde, nur auf den            Struktur aus mehreren DRAM Schichten besteht,
DRAM Speicher geschrieben. Die Seite wird nur              die an sich auch nochmal aus mehreren Teilstücken
dann auf auf den PCM Speicher geschrieben, wenn            (in der Abbildung als banks gekennzeichnet) beste-
sie aus dem DRAM Speicher entfernt wurde als               hen. Das vertikale Aufeinanderstapeln von banks
”dreckig” gekennzeichnet wurde.                            wird als vault bezeichnet. Jedes vault hat seine
                                                           eigene TSV-Verbindung und seinen eigenen Vault-
                                                           Controller. Die logische Schicht (in Abbildung 6
4.3   PCM + Flash + HDD
                                                           als Mem. Ctrl. Layer bezeichnet) besteht aus
Kim et al. haben das Potential von PCM in Spe-             dem Memory Controller, einem Crossbar Switch
icherhierarchien bezüglich Kosten und Performance          und aus Vault und Link Controllern. Diese Kon-
bewertet. Sie beobachteten, dass das Schreiben             trolleinheiten belegen nicht den gesamten Platz der
auf Flash-Speicher basierend auf dem materiellen           logischen Schicht, sondern lassen einen Raum für
Level wesentlich langsamer ist als das Schreiben           Erweiterungen [4].
auf PCM. Basierend auf dem Systemlevel ist das
Schreiben auf flash-basierte SSD’s schneller als das       5.1   Hybrid Memory Cube (HMC)
auf PCM-basierte SSD’s was durch den Stromver-
brauch bedingt ist. Weiterhin beobachteten sie,            Als Beispiel für die oben erläuterte Speichertech-
dass das Hinzunehmen von PCM die Performance               nologie wird die Technologie Hybrid Memory Cube
in einem abgestuften Speichsystem verbessert und           (HMC) gewählt. Die Architektur von HMC ist ähn-

                                                       6
lich der in Abbildung 6 dargestellten Struktur. Der
Cube besteht aus mehreren übereinander gestapel-
ten DRAM Schichten und einer logischen Schicht
am unteren Ende. Die einzelnen Schichten sind
durch TSV’s miteinander verbunden. Jede Spe-
icherschicht des Cubes ist in einzelne Segmente
aufgeteilt und das vertikale Zusammenschließen
mehrerer Segmente wird als Vault bezeichnet. Der
Prozessor kommuniziert mit dem HMC-seitigen                        Abb. 8: Architektur eines HBM [1]
Memory Controller indem er Nachrichten schickt,
die Speicheraktionen, wie Schreiben oder Lesen,
Speicheradressen und/oder Speicherdaten enthal-            der Fokus auf den technischen Aufbau dieser Tech-
ten sendet. Innerhalb der logischen Schicht wird           nologien und deren Verwendung gelegt. Jede der
zusätzlich ein Switch benötigt, um die verschiede-         dargelegten Technologien hat eine andere Funktion-
nen Vault Memory Controller und die I/O-Ports zu           sweise und ist in sich anders aufgebaut. Durch
verbinden [8].                                             diese Unterschiede weisen sie bezüglich der wichtig-
                                                           sten Parameter für Speichertechnologien Dichte,
                                                           Schreib- und Lesegeschwindigkeit sowie Dauer-
5.2   High  Bandwidth                   Memory             haftigkeit unterschiedliche Werte auf. Vergleicht
      (HBM)                                                man nun abschließend die vier Speichertechnolo-
Ein weiteres Beispeil für 3D DRAM Speicher ist             gien untereinander in Bezug auf die zuvor genan-
High Bandwidth Memory (HBM). Diese Technolo-               nten Parameter stellt man fest, dass jede einzelne
gie wird vorwiegend von Graphikprozessoren und             Speichertechnologie ihre Vor- und auch Nachteile
als Nachdolger für GDDR5 verwendet. HBM wird               besitzt. Beispielsweise weist STT-RAM in Bezug
von AMD, Nvidia und Hynix entwickelt. Dieser               auf die Lesegeschwindigkeit excellente Werte auf
Standard zielt auf leistungsstarke Grafikanwendun-         wohingegen die Lesegeschwindigkeit bei PCM eine
gen und Netzwerkanwendungen ab, die eine hohe              Dauer von 200 bis 300 ns hat. Abschließend werden
Performance benötigen. HBM hat einen niedri-               in diesem Kapitel unterschiedliche Programmier-
gen Stromverbrauch, ultra-weite Kommunikation-             modelle und Einsatzmöglichkeiten für NVRAM er-
sleitungen und eine neuartige Stapelstruktur. Es ist       läutert. In Abschnitt 5 wurde zunächst der grundle-
vorgesehen, dass bis zu 8 Speicherchips übereinan-         gende Aufbau von 3D DRAM Speichern dargelegt.
der gestapelt werden und mit Hilfe von TSV’s ver-          Hierbei lag der Fokus wiederum auf dem hardware-
bunden werden. Die Prozessoranordnung bei HBM              seitigen Aufbau und dessen Funktionalität. Ab-
besteht aus einem Kernprozessor und vier Speich-           schließend wurden zwei Beispiele aufgeführt, die
erstapeln. Die Speicherstapel an sich befinden sich        die Verwendung von 3D DRAM Speichern verdeut-
auf einer logischen Schicht. Der Silizium Interposer       lichen sollten. Die Bedeutung von nicht-flüchtigen
ist ein Chip mit metallischen Schichten, die keine         Speichertechnologien wird in Zukunft noch mehr an
Logik besitzen. Der Aufbau von HBM ist nochmals            Bedeutung gewinnen, da sie universell und vielseitig
detailiert in Abbildung 8 dargestellt [1].                 einsetzbar sind.

6     Zusammenfassung
Im vorliegenden Paper wurden zu Beginn vier Spe-
ichertechnologien vorgestellt, die zur Familie der
nicht-flüchtigen Speicher gehören. Hierbei wurde

                                                       7
Literatur                                                      tools and architectures. Technical report, Al-
                                                               ternative Technology Group Seagate Technol-
[1] Amd high bandwidth memory (hbm).                           ogy LLC, 2009.
    http://www.semiconductorscentral.com/
    memory_page.html.                                     [10] C. Mack. Fifty years of moore’s law, 2011.

[2] 3d xpoint technologie: 1000mal schneller als [11] S. Mittal and J. Vetter. A survey of software
    ssd. https://www.krollontrack.de/blog/            techniques for using non-volatile memories for
    3d-xpoint-technologie-1000mal-schneller-als-ssd/  storage and main memory systems. Technical
    4928/, December 2015.                             report, IEEE, 2015.

[3] Intel® optane™: Die revolution mit ultra-             [12] M. Qureshi, V. Srinivasan, and J. Rivers. Scal-
    schneller speichertechnik beginnt 2016. https:             able high performance main memory system
    //www.intel.de/content/www/de/de/                          using phase-change memory technology. Tech-
    it-managers/non-volatile-memory-idf.                       nical report, IBM Research, 2009.
    html, 2015.                                           [13] D. Reinsel, J. Gantz, and J. Rydning. Data
                                                               age 2025: The evolution of data to life-critical.
[4] B. Arkin, J. Hoe, and F. Franchetti. Hardware
                                                               Technical report, IDC Headquarter, 2017.
    accelerated memory layout transform within
    3d-stacked dram. Technical report, Electrical         [14] Christoph Schrader. Explosion des cyberspace.
    and Computer Engineering, Carnegie Mellon                  Süddeutsche Zeitung, 2011.
    University, Pittsburgh.
                                                          [15] C. Smullen, V. Mohan, A. Nigam, S. Gu-
[5] M. Chang, P. Rosenfeld, S. Lu, and B. Ja-                  rumurthi, and M. Stand.         Relaxing non-
    cob. Technology comparison for large last-level            volatility for fast and energy-efficient stt-ram
    caches (l3cs): Low-leakage sram, low write-                caches. Technical report, Department of Com-
    energy stt-ram, and refresh-optimized edram.               puter Science and Department of Electrical
    Technical report, University of Maryland.                  and Computer Engeneering University of Vir-
                                                               ginia.
[6] I. Doh, D. Lee, J. Choi, and S. Noh. Exploiting
    non-volatile ram to enhance flash file system         [16] P. Zhou, B. Zhao, J. Yang, and Y. Zhang. En-
    performance. Technical report, Hongik Uni-                 ergy reduction for stt-ram using early write
    versity and Dankook University, 2007.                      termination. Technical report, Department of
                                                               Electrical and Computer Engeneering, Depart-
[7] Q. Guo, N. Alachiotis, B. Akin, F. Sadi, G. Xu,            ment of Computer Science University of Pitts-
    T. Low, L. Pileggi, J. Hoe, and F. Franchetti.             burgh.
    3d-stacked memory-side acceleration: Acceler-
    ator and system design. Technical report, Elec-
    trical and Computer Engineering, Carnegie
    Mellon University, Pittsburgh.

[8] G. Kim, J. Kim, J. Ahn, and J. Kim. Memory-
    centric system interconnect design with hybrid
    memory cubes. Technical report, Seoul Na-
    tional University, KAIST, 2013.

[9] H. Li and Y. Chen. An overview of non-volatile
    memory technology and the implication for

                                                      8
Sie können auch lesen