Featurebasierte Strukturanalyse von Mammographien zur Abschätzung des individuellen Brustkrebsrisikos - opus4.kobv.de
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
Featurebasierte Strukturanalyse von Mammographien zur Abschätzung des individuellen Brustkrebsrisikos Der Medizinischen Fakultät der Friedrich-Alexander-Universität Erlangen-Nürnberg zur Erlangung des Doktorgrades Dr. med. vorgelegt von Freya Ilsabe Brunkhorst
Als Dissertation genehmigt von der Medizinischen Fakultät der Friedrich-Alexander-Universität Erlangen-Nürnberg Tag der mündlichen Prüfung: 25.05.2021 Vorsitzender des Promotionsorgans: Prof. Dr. med. Markus Neurath Gutachter: Prof. Dr. Alexander Josef Cavallaro Prof. Dr. Michael Uder
Inhalt 1) Abstract und Zusammenfassung.................................................................... 1 2) Einleitung ....................................................................................................... 4 3) Hintergrund .................................................................................................... 5 4) Stand der Technik .......................................................................................... 8 4.1) Verwandte Arbeiten ................................................................................. 8 4.2) MammoFeatureMap............................................................................... 11 5) Material ........................................................................................................ 13 6) Arbeitsschritte .............................................................................................. 15 6.1) Patientendaten anonymisieren............................................................... 15 6.2) Mammographien annotieren .................................................................. 15 6.3) Templates für die Feature Extraktion ..................................................... 16 6.4) Farbauswahl .......................................................................................... 18 6.5) Extraktion der Texture Features............................................................. 19 6.6) Methoden zur Auswertung ..................................................................... 21 7) Ergebnisse ................................................................................................... 24 7.1) Ergebnisse der Farbkartenauswertung .................................................. 24 7.2) Ergebnisse der möglichen Einflussfaktoren ........................................... 28 8) Diskussion .................................................................................................... 31 8.1) Vergleich mit anderen Projekten ............................................................ 31 8.2) Limitationen und methodische Einschränkungen ................................... 32 8.3) Ausblick ................................................................................................. 34 Literaturverzeichnis .......................................................................................... 37 Abbildungsverzeichnis ...................................................................................... 41
1) Abstract und Zusammenfassung Abstract Background and Aims: Breast cancer, being the leading cause of cancer-related deaths among women, is an increasingly relevant disease in our society. For a good prognosis, it is essential to find the cancer in a locally limited stadium. As part of this thesis, the computer program MammoFeatureMap was developed. This program presents a concept for an automated detection of architectural distortion of the breast tissue via feature extraction. Architectural distortion can serve as an early indicator for a developing breast cancer or an individually increased breast cancer risk and thus contribute to an earlier diagnosis and consequently improved prognosis. Methods: Mammograms of 53 patients with histologically ascertained breast cancer have been analyzed. In 38 cases, the mammograms at the point of the initial diagnosis were examined and in 15 cases additional mammograms at earlier points in time. Following the segmentation of the breast tissue and the registration, the features were extracted, and the results displayed as color- coded maps. The utilized features were CentralMoments::Mean, HistogramFeatures::Max with 256 or 10 Bins and BreastDensity::MeanROICompactness. Subsequently, the maps were interpreted, and possible influential factors evaluated. Results: Using the features CentralMoments::Mean and HistogramFeatures::Max with 256 Bins, it was possible to automatically display the density of different areas of the tissue relatively to each other as a color-coded map. Additionally, rough changes over time could be detected. Indications of an increased risk for breast cancer could not yet be found. The quality of the registration and the overall brightness of the mammograms were determined as important influential factors. 1
Conclusions: Generally, the analysis of the architecture of breast tissue via feature extraction seems feasible and could serve as a foundation for the automated prediction of the individual breast cancer risk. As a next step, several changes and additions to MammoFeatureMap seem beneficial. These could include a more accurate registration, standardization of the color-coded maps and the combination of different features. Zusammenfassung Hintergrund und Ziele: Brustkrebs ist, als häufigste krebsbedingte Todesursache von Frauen, eine zunehmend relevante Erkrankung in unserer Gesellschaft. Entscheidend für die Prognose ist dabei die Diagnose in einem lokal begrenzten Stadium. Das im Rahmen dieser Arbeit entwickelte Programm MammoFeatureMap soll ein Konzept für das automatische Erkennen verdächtiger Bruststruktur- veränderungen mittels Feature Extraktion sein. Diese können frühe Hinweise auf einen entstehenden Brustkrebs oder ein erhöhtes individuelles Brustkrebsrisiko geben und so zu einer früheren Diagnose und verbesserten Prognose beitragen. Methoden (Patienten, Material und Untersuchungsmethoden): Es wurden Mammographien von 53 Patientinnen mit histologisch gesichertem Brustkrebs mit MammoFeatureMap analysiert. Bei 38 Fällen wurden Mammographien am Zeitpunkt der Erstdiagnose verwendet und bei 15 Fällen zusätzlich Mammographien von früheren Zeitpunkten. Nach der Segmentierung des Brustgewebes und der Registrierung wurden die Features extrahiert und die Ergebnisse als Farbkarten dargestellt. Die verwendeten Features waren CentralMoments::Mean, HistogramFeatures::Max mit 256 oder 10 Histogrammklassen und BreastDensity::MeanROICompactness. Daraufhin folgten die Interpretation der Farbkarten und die Bewertung möglicher Einflussfaktoren. 2
Ergebnisse und Beobachtungen: Mit den Features CentralMoments::Mean und HistogramFeatures::Max mit 256 Histogrammklassen ist es gelungen, automatisch die Dichte des Gewebes in einzelnen Bereichen relativ zueinander mit Farbkarten darzustellen und grobe Veränderungen im zeitlichen Verlauf zu detektieren. Hinweise auf das individuelle Brustkrebsrisiko konnten daraus allerdings noch nicht abgeleitet werden. Als wichtige Einflussfaktoren wurden die Qualität der Registrierung und die Helligkeit der Ausgangsmammographie herausgearbeitet. (Praktische) Schlussfolgerungen: Grundsätzlich ist die Bruststrukturanalyse mittels Feature Extraktion ein denkbarer Ansatz auf dem Weg zur individuellen Prädiktion des Brustkrebsrisikos. Als nächster Schritt wären einige Veränderungen von MammoFeatureMap sinnvoll. Dazu gehören beispielsweise eine genauere Registrierung, eine Normierung der Farbkarten und die Verwendung von Kombinationen verschiedener Features. 3
2) Einleitung Brustkrebs ist ein politisch und emotional zunehmend bedeutsames Krankheitsbild. Das wird zum einen deutlich bei einem Blick auf die steigenden Fallzahlen von Brustkrebs in Deutschland (Bertz et al., 2010), zum anderen auf den gleichzeitig steigenden Anspruch an die Diagnostik und Therapie sowie die wachsenden Qualitätsanforderungen. Weiterhin ist eine zunehmende Individualisierung zu beobachten, welche für die einzelnen Patientinnen jeweils die bestmögliche Versorgung bieten soll. Demgegenüber steht eine nur unzureichend wachsende Zahl von ärztlich tätigen Medizinern (Bundesärztekammer, 2016). Insgesamt zeichnet sich demnach eine zunehmende Mehrbelastung von Ärzten und Gesundheitssystem ab. Um eine angemessene Behandlung bei gleichzeitiger wirtschaftlicher Effizienz zu gewährleisten, werden zunehmend Systeme zur computer-assisted-detection oder computer-aided-diagnosis (CAD) entwickelt. In Bezug auf Brustkrebs sollen diese Programme computergestützt Hilfe bei der Befundung von Mammographien leisten (Obenauer and Hermann, 2012). Angeknüpft an das Konzept der CAD-Systeme, wurde im Rahmen des Projektes Klinische Datenintelligenz (KDI) das Programm MammoFeatureMap vom Fraunhofer IIS entwickelt. Dieses Programm soll einen Baustein auf dem Weg zur automatischen Analyse von Strukturveränderungen des Brustgewebes in Mammographien darstellen. Einige dieser Strukturveränderungen könnten auf ein erhöhtes Erkrankungssrisiko für individuelle Patientinnen hinweisen und damit zu einer früheren Erkennung und Verbesserung der Prognose beitragen. Für die Analyse der Bruststruktur wurden sogenannte Texture Features aus den Bildern extrahiert. Im Rahmen dieser Dissertation wurde das Programm als ein mögliches Konzept getestet und evaluiert. 4
3) Hintergrund Brustkrebs ist der häufigste maligne Tumor bei Frauen. Pro Jahr erkranken in Deutschland etwa 70.000 Frauen neu an Brustkrebs und etwa 17.000 Frauen pro Jahr sterben daran (Kaatsch et al., 2015). Somit ist Brustkrebs seit Jahren die häufigste krebsbedingte Todesursache von Frauen (Bertz et al., 2010). Goldstandard für die Diagnose ist die Mammographie, wobei die früher verwendete analoge filmbasierte Technik immer weiter durch die digitale Mammographie ersetzt wird. Für die Prognose der einzelnen Patientinnen ist es außerordentlich wichtig, den Krebs in einem lokal begrenzten Stadium zu entdecken, da ein fernmetastasierter Brustkrebs immer noch als praktisch unheilbar gilt (Onkologie, 2012). Individualisierte Untersuchungszeiträume durch eine Risikostratifikation könnten zusätzlich dazu beitragen, den Krebs möglichst früh zu entdecken. Zur Früherkennung wurde in den Jahren 2005 bis 2009 das Mammographie Screening in Deutschland eingeführt. Jede Frau zwischen 50 und 69 Jahren darf hieran teilnehmen. Die Mammographien jeder Teilnehmerin werden im Rahmen der Doppelbefundung unabhängig voneinander von zwei Befundenden ausgewertet. Im Jahr 2013 nahmen ca. 2,9 Millionen Frauen an dieser Untersuchung teil (Malek and Kääb-Sanyal, 2016). Hier wird ein sehr hoher zeitlicher und personeller Aufwand deutlich. Weiterhin verursacht das Mammographie-Screening pro Jahr Kosten im dreistelligen Millionenbereich. Eine effizientere Gestaltung von Screening und Befundung könnten hier zur Kostensenkung beitragen (Mühlhauser, 2013). Zudem stellt eine Mammographie immer auch eine Strahlenbelastung für die Teilnehmerinnen dar. Abhängig von der Dicke der Brust beträgt die durchschnittliche mittlere Parenchymdosis pro Aufnahme 1-2 mGy (Bick, 2006). Im Hinblick darauf, dass bei den fast 2,9 Millionen gescreenten Frauen nur knapp 17.500 Fälle von Brustkrebs entdeckt wurden, bietet die Möglichkeit einer Individualisierung der Untersuchungszeiträume die Chance, die Strahlenbelastung bei gesunden Frauen zu verringern (Malek and Kääb-Sanyal, 2016). Zusätzlich kann das Mammographie-Screening auch eine psychische Belastung für die Frauen darstellen (Mühlhauser, 2013). Auch hier könnte eine 5
Verlängerung der Untersuchungszeiträume für Frauen mit geringem Erkrankungsrisiko die Belastung verringern. Neben der effizienteren Gestaltung des Screenings, bietet auch das Befunden von Mammographien als solches noch Verbesserungspotential. Die Sensitivität für das Erkennen von Brustkrebs liegt abhängig von Alter und Brustgewebe zwischen ca. 63% bei sehr dichtem Gewebe bis ca. 87% bei fast vollständiger Involution. In der Altersgruppe von 50 bis 69 Jahren, welche am Screening- Programm teilnimmt, liegt die Sensitivität bei etwa 75%. Die Spezifität beträgt je nach Dichte etwa 89 bis 97% (Carney et al., 2003). Des Weiteren leidet die Befundung von Mammographien unter einem hohen Maß an Subjektivität. Das gleiche Bild wird von verschiedenen Befundenden häufig unterschiedlich bewertet, im zeitlichen Abstand unterscheiden sich in einigen Fällen sogar die Befunde eines einzelnen Befundenden (Ciccone et al., 1992). Hier können CAD-Systeme einen zusätzlichen, objektiveren Blickwinkel eröffnen (Jiang et al., 2001). Nachdem nun dargelegt wurde, weshalb der Einsatz von CAD-Systemen im Rahmen der Befundung von Mammographien und des Screenings sinnvoll ist, soll im Folgenden auf die Brustgewebestruktur eingegangen werden. Diese mit Hilfe der Texture Features zu beschreiben und Veränderungen zu detektieren soll, wie zuvor erwähnt, der Kern des Programms MammoFeatureMap sein. Die weibliche Brust ist aus verschiedenen Gewebearten aufgebaut, im Wesentlichen aus Drüsen-, Fett- und Bindegewebe. Das Drüsengewebe wiederum, welches für die Produktion der Muttermilch verantwortlich ist, besteht aus den Azini, welche zu Lobuli und weiter zu Lobi zusammengefasst werden. Die 15 bis 20 Lobi besitzen jeweils Ausführungsgänge, welche über den Sinus lactiferi an die Oberfläche der Mamille münden. Diese Anteile bestimmen zusammen mit dem Verlauf von Nerven, Blut- und Lymphgefäßen die Struktur des Brustgewebes (Kaufmann and Zimpelmann, 2013). Im Laufe des Lebens ist das Gewebe einigen Veränderungen unterworfen, die durch wechselnde Hormonspiegel im Zuge des Zyklus oder einer Schwangerschaft sowie durch die Menopause verursacht werden (Gruber, 2009). Vereinfacht gesagt nimmt 6
der Anteil an Drüsengewebe mit dem Alter ab und der Anteil des Fettgewebes zu, was als Involution bezeichnet wird (Tscherne, 1999). Neben diesen natürlichen Veränderungen der Bruststruktur, finden sich auch eine Vielzahl von Veränderungen, die auf andere benigne oder maligne Ursachen zurückzuführen sind. Laut der Definition des Breast Imaging Reporting and Data System (BI-RADS) des American College of Radiology (ACR) gehen diese Architekturstörungen mit von einem Punkt ausstrahlenden Spiculae, fokalen Retraktionen oder Raffungen an den Parenchymrändern einher. Eine sichtbare Herdläsion fehlt jedoch. Neben benignen Ursachen, wie beispielsweise einer radiären Narbe, ist beim Vorhandsein einer Architekturstörung auch an einen malignen Tumor zu denken (Radiology, 2016). Tatsächlich tritt nicht tastbarer Brustkrebs mammographisch am dritthäufigsten als Architekturstörung auf und in der Hälfte der Brustkrebsfälle waren vor der Erstdiagnose Architekturstörungen in den Mammographien zu finden (Gaur et al., 2013). Das zeigt die große Bedeutung der Architekturstörung als Risikofaktor für die Entstehung von Brustkrebs. Trotzdem gilt sie als die am häufigsten übersehene Abnormität in Mammographien (Ayres and Rangayvan, 2005). Häufig fallen Bruststrukturveränderungen bei der Befundung heraus, da sie für Menschen schwer wahrzunehmen sind. Der Vorteil einer computergestützten Analyse mittels CAD-System liegt zum einen in einer höheren Genauigkeit und zum anderen darin, dass einmal ausgewertete Bruststrukturen auch von unterschiedlichen Befundenden immer wieder zum Vergleich herangezogen werden können. 7
4) Stand der Technik Wie in den vorherigen Abschnitten dargestellt, ist die Relevanz einer Verbesserung der Befundung von Mammographien unbestreitbar. Daher wird schon seit Jahren versucht, die Befundung durch Automatisierung effizienter und genauer zu gestalten. Hier kommen die sogenannten CAD-Systeme zum Einsatz. CAD steht, wie zuvor erwähnt, für computer-assisted-detection oder computer-aided-diagnosis. Grundsätzlich sollen diese Systeme als Interpretations- und Entscheidungshilfe bei der Befundung von medizinischem Bildmaterial fungieren. Schon in den 1990er Jahr entstanden die ersten CAD- Systeme für das Befunden von Mammographien (Vyborny and Giger, 1994). Seither wird stetig versucht, die Technik zu verbessern und neue Funktionen zu entwickeln. 4.1) Verwandte Arbeiten Bei der Entwicklung von CAD-Systemen für Mammographien gibt es verschiedene Ansätze. Zum einen werden auffällige Massen und/oder Verkalkungen detektiert und dem Befunder angezeigt. Mit verschiedensten mathematischen und informatischen Methoden, zum Beispiel der Analyse von Grauwerten, werden sogenannte regions of interest (ROI) detektiert und markiert. So soll der Befunder auf malignitätsverdächtige Massen beziehungsweise Karzinome hingewiesen werden. Dieser Ansatz wird schon seit den Anfängen der CAD- Systeme für Mammographien verfolgt. So zum Bespiel beim R2 Image Checker der Firma Hologic, einem der ersten CAD-Systeme für Mammographien, oder beim Secondlook von iCAD. Diese Art der CAD-Systeme findet etwa in den USA breite Anwendung, auch wenn noch nicht abschließend geklärt werden konnte, ob ihr Einsatz bessere Ergebnisse erzielt als die Doppelbefundung durch zwei Radiologen (Azavedo et al., 2012). Ein weiterer Ansatz ist die Bestimmung der mammographischen Dichte des Brustgewebes. Die mammographische Dichte stellt den wichtigsten Risikofaktor für die Entstehung von Brustkrebs dar, was bedeutet: je höher die Dichte, desto höher das Erkrankungsrisiko (Boyd et al., 1995). Die Dichte hat außerdem 8
großen Einfluss auf die frühzeitige Entdeckung von Brustkrebs. In dichtem Gewebe werden maligne Massen häufiger übersehen und damit oft erst in späteren Stadien entdeckt, was die Prognose der Patientinnen verschlechtert (Yaffe, 2008). Daher wurden Klassifikationen entwickelt, um Mammographien anhand ihrer Dichte einzuteilen und Hinweise auf das Brustkrebsrisiko zu geben. Die älteren Systeme basieren auf der subjektiven Einteilung durch den Radiologen, zum Beispiel die Klassifikation nach Wolfe (Wolfe, 1976) oder der des American College of Radiology (ACR) (Radiology, 2016). Um die Klassifikation zu automatisieren, wurden verschiedene Programme für die Bestimmung der Dichte entwickelt. Diese fußen beispielsweise auf der Einteilung anhand von Grauwerten (Byng et al., 1994) oder statistischen Methoden (Heine et al., 2008). Neben der mammographischen Dichte scheint das Brustkrebsrisiko jedoch zusätzlich von der Heterogenität des Brustgewebes und anderen, in den Mammographien enthaltenen Faktoren abhängig zu sein (Torres-Mejía et al., 2005). Daher besteht ein weiterer aktuell verfolgter Ansatz darin, das Brustgewebe mit sogenannten Texture Features zu analysieren. Diese Features stellen verschiedene Bildmerkmale dar, welche in den Mammographien enthalten sind. Die Ausprägung dieser Merkmale soll Hinweise auf das Vorhandensein oder das mögliche Entstehen von Brustkrebs liefern. So soll die Diagnose erleichtert und das Erkrankungsrisiko abgeschätzt werden können. Insgesamt gibt es mehrere hundert Texture Features, welche aus Mammographien extrahiert werden können. Für einen groben Überblick können diese in fünf verschiedene Gruppen unterteilt werden: • Statistische Features • Moment-basierte Features • Form-basierte Features • Spektrale Features • Strukturelle Features 9
Die statistischen Features werden aus Grauwerten berechnet und bestehen beispielsweise aus Histogrammen. Moment-basierte Features werden ebenfalls aus Grauwerten berechnet. Hier werden zum Beispiel die vier Central Moments genannten Features mean (Mittelwert), variance (Varianz), skewness (Schiefe) und kurtosis (Wölbung) verwendet. Form-basierte Features beschreiben die Form der ROI. Die spektralen Features zeigen Regionen auf, die eine ähnliche Textur aufweisen. Strukturelle Features geben Informationen über den Feinbau der Bruststruktur. Hierunter fallen beispielsweise run-length Features, welche die Grobheit der Bruststruktur messen, indem die Länge aufeinanderfolgender Pixel des gleichen Grauwertes gezählt wird (Häberle et al., 2012). Der Vollständigkeit halber sei erwähnt, dass auch andere Einteilungen der Features möglich sind (Gastounioti et al., 2016). In den letzten Jahren wurden verschiedene Studien zur Aussagekraft der Texture Features durchgeführt. Manduca et al. verglichen die mammographische Dichte mit verschiedenen Texture Features aus unterschiedlichen Klassen im Zuge einer Fall-Kontroll-Studie. Die getesteten Features sagten die Entstehung von Brustkrebs so genau vorher wie die mammographische Dichte, allerdings auch nicht präziser. Auch die Kombination von mammographischer Dichte und Texture Features brachte keinen Vorteil (Manduca et al., 2009). Eine Studie von Wei et al. hingegen wies in eine andere Richtung. In einer Fall- Kontroll-Studie wurde die Brustgewebestruktur in einer retroaureolär gelegenen ROI untersucht. Dafür wurde ein Set aus einem region-size und zwei run-length Features im Vergleich mit der mammographischen Dichte verwendet. Im Hinblick auf das Krebsrisiko ergab sich, dass die Texture Features besser die Mammographien von gesunden Patientinnen von denen der Patientinnen unterscheiden konnten, welche später Brustkrebs entwickelten. Da die verwendeten Features außerdem scheinbar unabhängig von der mammographischen Dichte waren, könnten sie als zusätzliche Prädiktoren für das Brustkrebsrisiko verwendet werden (Wei et al., 2011). 10
Häberle et al. evaluierten im Rahmen einer Fall-Kontroll-Studie verschiedene Texture Features im Hinblick auf ihre Aussagekraft bezüglich des Brustkrebsrisikos und verglichen diese mit der mammographischen Dichte. Untersucht wurden statistische, Moment-basierte, Form-basierte, und spektrale Features, welche aus dem zuvor segmentierten Brustgewebe extrahiert wurden. 46 Features wurden schließlich ausgewählt und zeigten, dass das Brustkrebsrisiko mit Hilfe der verwendeten Features eingeschätzt werden kann. Dabei schienen einige Features die Dichte des Brustgewebes wiederzugeben; zusätzlich schienen aber noch andere Features das Brustkrebsrisiko zu beeinflussen (Häberle et al., 2012). Zheng et al. erarbeiteten eine Methode, in welcher die Feature Extraktion entlang eines Gitters erfolgte, welches über das zuvor segmentierte Brustgewebe gelegt wurde. Extrahiert wurde jeweils an den Kreuzungen des Gitters und im Gewebe darum herum, woraufhin die errechneten Werte über das gesamte Brustgewebe gemittelt wurden. Auch hier wurden Fälle und Kontrollen verwendet. Die Aussagekraft der extrahierten statistischen und strukturellen Features wurde mit der der mammographischen Dichte und der aus einzelnen ROIs innerhalb der Brust extrahierten Features verglichen. Die höchste Aussagekraft hatte eine Kombination aus mehreren Features. Außerdem stellte sich Extraktion entlang des Gitters über das gesamte Brustgewebe als überlegen über die Extraktion aus einem oder mehreren ROIs heraus. Des Weiteren lieferte ein enges Gitter aussagekräftigere Werte als ein Gitter mit weiten Zwischenräumen (Zheng et al., 2015). 4.2) MammoFeatureMap Das im Rahmen dieser Doktorarbeit verwendete Programm MammoFeatureMap knüpft an den Ansatz der Brustgewebeanalyse mittels Texture Features an. So sollen Strukturveränderungen automatisch detektiert und das Erkrankungsrisiko abgeschätzt werden. Zur Extraktion der Features wird zunächst das Brustgewebe segmentiert und ein Template mit ringförmigen Sektoren auf die Mammographie gelegt (Registrierung). Nun werden die ausgewählten Features extrahiert und als 11
Farbkarte dargestellt. Anstatt einer Fall-Kontroll-Studien wurden ausschließlich Mammographien von erkrankten Frauen verwendet und mit früheren Mammographien derselben Frauen verglichen. Ziel ist es, auf den Farbkarten Merkmale und Veränderungen zu erkennen, welche vorhandenen Brustkrebs oder ein erhöhtes Risiko hierfür zu finden. 12
5) Material Sämtliche Bilder und Daten stammen aus der Datenbank der Universitätsklinik Erlangen. Die Bilder wurden mittels Direktradiographie aufgenommen und im DICOM Format gespeichert und verarbeitet. Bei der Sichtung der Daten wurden aus mehreren tausend Patientinnen zunächst nur diejenigen ausgewählt, bei denen digitale Mammographien angefertigt wurden. Analoge, konventionelle Mammographien wurden ausgeschlossen. Aus diesem Pool wiederum wurden nur erkrankte Patientinnen ausgewählt. Von den erkrankten Patientinnen wurden zuletzt noch diejenigen mit Brustimplantaten ausgeschlossen. Schließlich wurden für das Projekt 53 Patientinnen ausgewählt, bei denen Brustkrebs mammographisch diagnostiziert und histologisch gesichert wurde. Es wurden Mammographien von der rechten und linken Brust im cranio-caudalen (CC) und im mediolateral-obliquen Strahlengang (MLO) verwendet, entsprechend den gängigen Standards für Mammographien (Bick, 2006). Die Gesamtzahl der untersuchten Mammographien belief sich auf 296. Die ausgewählten Mammographien stammen von Frauen unterschiedlichen Alters mit zum Teil sehr unterschiedlichem Brustaufbau und Gewebedichten. Somit konnten die Texturen unter verschiedenen Ausgangsbedingungen getestet werden. Bei 38 Patientinnen wurden jeweils die Bilder am Zeitpunkt der Erstdiagnose verwendet (Gruppe 1). Diese Gruppe bestand aus 152 Mammographien. Hier sollte analysiert werden, welche Eigenschaften das gesunde und das kranke Gewebe hat. Bei 15 Patientinnen wurden zusätzlich Mammographien aus früheren Jahren verwendet, bevor das Karzinom entdeckt wurde (Gruppe 2). Damit sollte getestet werden, ob sich schon vor Erstdiagnose des Karzinoms Gewebeveränderungen detektieren lassen, die auf die Entstehung von Brustkrebs hinweisen könnten. Es wurden zehn Verläufe mit Aufnahmen an zwei Zeitpunkten erstellt, vier Verläufe mit Aufnahmen an drei Zeitpunkten und ein Verlauf mit Aufnahmen an vier Zeitpunkten. Die Gesamtzahl der untersuchten Mammographien in dieser Gruppe belief sich auf 144. 13
Mit dem Programm MammoFeatureMap wurden drei verschiedene Features aus jeder Mammographie extrahiert. Eines der Features wurde in zwei Einstellungen verwendet, woraus sich eine Gesamtanzahl von 1.184 untersuchten Farbkarten ergibt. Zusätzlich wurden die Registrierungen aus jeder Extraktion beurteilt, deren Anzahl sich auf ebenfalls 1.184 beläuft. 14
6) Arbeitsschritte Nach der Auswahl der Fälle wurden die Daten anonymisiert. Darauf folgten das Annotieren der Mammographien sowie die Erstellung eines Standardschemas (Template) für die Extraktion der Features und die Auswahl passender Farben für die Darstellung der Features. Anschließend wurden die Features extrahiert und ausgewertet. 6.1) Patientendaten anonymisieren Um eine datenschutzkonforme Weiterverarbeitung zu gewährleisten, wurden die Mammographien und Patientendaten anonymisiert. Hierfür wurde das Programm Incognito 1.2 der Siemens IKM CKS Group verwendet. 6.2) Mammographien annotieren Die ausgewählten und anonymisierten Mammographien wurden in das MammoKDI Programm, welches vom Fraunhofer IIS entwickelt wurde, hochgeladen und mit Hilfe eines Wacom-Boards der Firma Wacom annotiert. Zuvor wurden Kategorien mit entsprechenden Farben festgelegt. Wie in den untenstehenden Abbildungen zu sehen, wurde das Brustgewebe in orange dargestellt, Verkalkungen in blau, Karzinome in grün und Sonstiges (z.B. Ports) in pink. Beispiele für annotierte Mammographien finden sich in Abbildung 1. Ein wichtiger Schritt hin zur Extraktion der Texture Features ist das Segmentieren des Brustgewebes. Dies geschah zunächst automatisch. Zusammengefasst wird hierfür eine Kombination aus morphologischen Operatoren und einem KMeans Filter verwendet, um das Brustgewebe anhand von Grauwertunterschieden als größte verbundene Komponente zu segmentieren. Eventuelle Fehler wurden nachträglich per Hand verbessert und der Pectoralismuskel ebenfalls händisch entfernt. Verkalkungen, Karzinome und sonstiges Strukturen wurden ebenfalls per Hand annotiert. Die so bearbeiteten Mammographien wurden als Projekte gespeichert. 15
Abbildung 1. Annotierte Mammographien 6.3) Templates für die Feature Extraktion Im nächsten Schritt wurde jeweils ein Template für CC- und MLO-Aufnahmen für die Extraktion der Features angefertigt. Für das Erstellen der Templates wurden die frei zugänglichen Graphikprogramme GIMP (GNU Image Manipulation Program) und ImageJ verwendet. Für das CC-Schema wurde der Umriss einer Brust als halbiertes Oval angenommen. Wie in Abbildung 2 zu sehen, wurde die Brust beginnend vom äußeren Rand in zehn gleich dicke Ringe aufgeteilt und die Mamille zur Orientierung eingezeichnet. Abbildung 2. CC-Template Das MLO-Schema wurde nach der Broschüre Mammographien regelgerecht erstellen der Kassenärztlichen Bundesvereinigung (KBV) angefertigt. Danach 16
soll der Pectoralismuskel in einem Winkel von mindestens 20° schräg vom seitlichen zum oberen Bildrand verlaufen und zusätzlich die Pectoralis-Nippel- Linie im rechten Winkel auf dem Pectoralismuskel stehen. Die inframammäre Falte wurde nicht in das Schema miteinbezogen, da sie nicht Teil des eigentlichen Brustgewebes ist (Wülfing et al., 2011). Auch im MLO-Schema wurde die Mamille zur Orientierung eingezeichnet (vgl. Abbildung 3). Abbildung 3. MLO-Template Weiterhin wurden die Schichten der Templates in Grauwerten von 1 bis 11 eingefärbt. Der innersten Schicht wurde hierbei der Wert 1 und der äußersten der Wert 10 zugeteilt. Für die Mamille wurde jeweils der Wert 11 festgelegt. Die Verwendung von Grauwerten vereinfacht einerseits die maschinelle Verarbeitung der Templates und dient andererseits als Index für die Schichten (z. B. Schicht 1 hat den Grauwert 1). Für die hier verwendeten Abbildungen wurden die Grauwerte so verändert, dass die Schichten sichtbar sind. Das Verhältnis der Grauwerte zueinander wurde jedoch beibehalten. Die ringförmige Aufteilung der Templates wurde gewählt, um in den Sektoren, entsprechend der Anatomie einer durchschnittlichen Brust, vorrangig einen Gewebetyp, nämlich Fett- oder Drüsengewebe, abzubilden. MammoFeatureMap extrahiert die Features aus den separaten Sektoren, wobei die Genauigkeit der Berechnungen durch einheitliches Gewebe in einem Sektor zunimmt. 17
Das Template wird für die Feature Extraktion auf die Original-Mammographie umgeformt, da die Extraktion auf der unverzerrten mammographischen Textur erfolgen soll, um die Ergebnisse nicht zu verfälschen. Zum besseren Vergleichen wurden die Farbkarten wiederum in der Standardform dargestellt. Genaueres zur Umformung wird in Abschnitt 6.5 besprochen. 6.4) Farbauswahl Zur Darstellung der extrahierten Features wurde die Heatmap Hot colormap verwendet, welche vom Insight Segmentation and Registration Toolkit (ITK) der US National Library of Medicine bereitgestellt wird (s. Abb. 4). Die errechneten Werte wurden dabei als Farbverlauf von schwarz über rot, orange und gelb zu weiß visualisiert. So können die Daten von Betrachter schnell und intuitiv erfasst werden. Abbildung 4. Hot colormap 18
6.5) Extraktion der Texture Features Nun wurden die Texture Features mit Hilfe des Programms MammoFeatureMap aus den vorbereiteten Mammographien extrahiert. Dies erfolgte in mehreren Schritten (vgl. Abbildung 5). MammoKDI Brustgewebe segmentieren Annotationen MammoFeatureMap Mammographien (segmentiert und annotiert) Bruststandardschema (Template) Registrierung Feature Extraktion Farbkarte Anzeige und Auswertung Abbildung 5. Ablauf der Feature Extraktion Zunächst wurden hierfür die zuvor segmentierten, annotierten und als Projekte gespeicherten Mammographien in das Programm geladen. Nun wurde das unter 5.3 beschriebene Template auf das segmentierte Brustgewebe umgeformt, was als Registrierung bezeichnet wird. Für die Registrierung wurden die Templates mit Hilfe einer perspektivischen Transformation umgeformt. Dafür wurden im CC und im MLO jeweils vier Punkte festgelegt, die als Referenzpunkte dienen. Im CC-Schema sind das die beiden Ecken, eine Annäherung an die Mamille, beziehungsweise der am weitesten vorgewölbte Punkt der Brust und der Schwerpunkt der Fläche des Brustgewebes. Im MLO wurden analog dazu die folgenden Punkte ausgewählt: am oberen Rand die Mitte des Brustgewebes, unten die Ecke, am hinteren Rand der Beginn des Pectoralismuskels und wie im CC die Annäherung an die Mamille. Nach der erfolgreichen Registrierung wurden drei verschiedene Features aus den Mammographien extrahiert und einzeln als Farbkarten dargestellt. Das Feature CentralMoments::Mean gehört zu den in Abschnitt 3.1 beschriebenen 19
Moment-basierten Features und ermittelt den Mittelwert der Grauwerte pro Sektor. Das Feature HistogramFeatures::Max gehört zu den statistischen Features und ermittelt das Maximum der Grauwerte eines Sektors anhand des entsprechenden Histogramms. Es wurde in zwei unterschiedlichen Einstellungen verwendet, genauer gesagt mit 256 oder 10 Histogrammklassen (oder „Bins“). Die Bins sind als Kategorien zu verstehen, in welche die Pixel nach ihren Grauwerten eingeteilt werden. Eine kleinere Anzahl an Bins bedeutet demnach mehr Mittelung der Werte. Außerdem wurde das Feature BreastDensity::MeanROICompactness mit den Parametern iGrowThresh 50 und iMinArea 4 verwendet. MeanROICompactness ist die mittlere Kompaktheit der ROIs. Dabei wird die Kompaktheit eines Gebietes gemessen als Verhältnis der Fläche unter der Konvexen Hülle des Gebietes und der Fläche des Gebietes an sich. Vereinfacht betrachtet bedeutet Konvexe Hülle in diesem Zusammenhang, dass sie das komplette Gebiet umschließt, ohne Einstülpungen zu betrachten (vgl. Abbildung 6). Das Feature nimmt umso größere Werte an, umso mehr ein Gebiet seiner Konvexen Hülle gleicht. Abbildung 6. Beispiel einer Konvexen Hülle (rote Linien) Pro Sektor beziehungsweise Schicht wurde somit ein Wert errechnet und mit Hilfe der Heatmap farbig dargestellt. So ergab sich für jede Mammographie eine Farbkarte, welche zusammen mit den übrigen Farbkarten der dazugehörigen Mammographien der einzelnen Patientinnen angezeigt wurde. Zudem wurden die Farbkarten nun in der Standardform dargestellt, um ein besseres Vergleichen zu ermöglichen. Abbildung 7 zeigt beispielhaft die Farbkarten einer 20
Patientin im zeitlichen Verlauf. Die oberste Reihe entspricht hierbei dem ältesten Zeitpunkt und die unterste dem aktuellsten, an welchem der Brustkrebs zuerst diagnostiziert wurde. Abbildung 7. Farbkarten einer Patientin 6.6) Methoden zur Auswertung Im Folgenden Abschnitt wird die Auswertungsstrategie für die Farbkarten erläutert. Außerdem werden mögliche Einflussfaktoren benannt und Bewertungsstrategien für diese vorgeschlagen, womit die Interpretation der Ergebnisse erleichtert werden soll. Um die Farbkarten zu interpretieren, wurden zunächst die Mammographien untersucht. In der Gruppe mit Mammographien ausschließlich am Zeitpunkt der Diagnose (Gruppe 1) lag das Augenmerk auf dem Vergleich zwischen der gesunden und kranken Seite. In der anderen Gruppe (Gruppe 2) wurden die Mammographien im zeitlichen Verlauf visuell auf Veränderungen untersucht. Es wurden jeweils die rechten CC-Aufnahmen untereinander verglichen und analog dazu auch die linken CC-, die rechten MLO- und die linken MLO- Aufnahmen. Das Augenmerk lag hierbei auf einer Zu- oder Abnahme der 21
Gewebedichte und auf dem Erscheinen von sichtbaren Massen bzw. dem diagnostizierten Karzinom. Nun wurden die Farbkarten folgendermaßen ausgewertet: Es wurde jeweils an einem Zeitpunkt die rechte und linke Seite der CC-Aufnahmen und die rechte und linke Seite der MLO-Aufnahmen visuell verglichen. Zudem wurden die CC- und MLO-Aufnahmen im zeitlichen Verlauf verglichen und auf Veränderungen der Farbkarten hin untersucht. Nachdem die Veränderungen in den Mammographien und Farbkarten unabhängig voneinander untersucht wurden, wurde in Zusammenschau versucht, einen Zusammenhang zwischen beiden herzustellen. Zunächst wurde untersucht, ob die Farbkarten die mit den Features errechneten Merkmale visuell wiedergeben. War das der Fall, wurde im nächsten Schritt analysiert, ob die Farbkarten Aussagen über die Bruststruktur und gegebenenfalls deren Auffälligkeiten oder Veränderungen treffen können. Außerdem wurde geprüft, in wie weit die Farbkarten Hinweise auf das Brustkrebsrisiko der einzelnen Patientin geben und ob das Karzinom selbst detektiert wurde. Im Folgenden werden nun einige mögliche Einflussfaktoren auf die Aussagekraft der Farbkarten beschrieben. Wie in Abschnitt 6.5 beschrieben, handelt es sich bei der Registrierung um einen zentralen Aspekt des Programms. Für die Auswertung wurde die Registrierung jeder Aufnahme einer Kategorie zugeordnet: leichte Ungenauigkeit oder deutliche Ungenauigkeit. Wie sich die Qualität der Registrierung auf die Feature Extraktion auswirkt, wurde im Zusammenhang mit der Auswertung der Farbkarten erarbeitet. Abbildung 8 zeigt beispielhaft jeweils zwei Registrierungen mit leichter (links) und zwei mit deutlicher Ungenauigkeit (rechts). 22
Abbildung 8. Registrierungen Weiterhin wurde die Qualität der verwendeten Mammographien als möglicher Einflussfaktor betrachtet. Im Allgemeinen bestehen Mängel in der Qualität bei etwa 12% der Mammographien und sind damit kein seltenes Problem. Am häufigsten werden die fehlerhafte Darstellung der inframammären Falte, des Pectoralismuskels, der Mamille und der Brust beanstandet (Pfandzelter et al., 2010). Um eine mangelhafte Qualität als mögliche Fehlerquelle in die Bewertung der Ergebnisse miteinzubeziehen, wurden die verwendeten Mammographien in vier Gruppen eingeteilt: A) keine bedeutsamen Mängel, B) übermäßig dunkle/helle Grauwerte C) Hautfalten über dem Brustgewebe und D) eine sich auf das Brustgewebe projizierende Mamille. Als nicht bedeutsame Mängel der Gruppe A wurden solche eingestuft, die die Funktion der Feature Extraktion vermutlich nicht oder wenig beeinflussen, da sie das dargestellte Brustgewebe nicht verändern oder verzerren. Hierzu gehörten zum Beispiel die mangelhafte Darstellung der inframammären Falte und die ungenügende Darstellung des Pectoralismuskels. Mängel der Gruppe B, C und D hingegen waren solche, die die Darstellung des Brustgewebes verändern und damit potentiell bedeutsam für die Qualität der Feature Extraktion sein könnten. Dieselben Mammographien beziehungsweise Verläufe konnten in mehrere Kategorien fallen. 23
7) Ergebnisse In diesem Abschnitt werden zunächst die Ergebnisse der Farbkartenauswertung im Zusammenhang mit den entsprechenden Mammographien dargestellt. Weiterhin werden die Ergebnisse der untersuchten möglichen Einflussfaktoren beschrieben und erläutert. 7.1) Ergebnisse der Farbkartenauswertung Die Auswertung der Farbkarten der verwendeten Features im Zusammenhang mit den Original-Mammographien und den jeweiligen Registrierungen ergab Folgendes: Mit dem Feature CentralMoments::Mean konnten über beide Gruppen bei durchschnittlich 84% der untersuchten Farbkarten visuell Zusammenhänge mit den entsprechenden Mammographien gefunden werden (alle Prozentzahlen wurden gerundet). In Gruppe 1 wurden bei 80% Zusammenhänge gefunden, in Gruppe 2 bei 89%. Sektoren wurden relativ zu den anderen hell dargestellt, wenn sich hier in der Mammographie ein relativ strahlendichter Bereich befand. Umgekehrt wurden Sektoren dunkler dargestellt, wenn sich in der Mammographie hier eher strahlentransparente Bereiche befanden. In Mammographien zeigen sich dichtere Gewebeanteile, also Drüsengewebe und Verkalkungen, relativ zum restlichen Brustgewebe strahlendichter. Daraus lässt sich folgern, dass Bereiche mit dichterem Gewebe relativ zum restlichen Gewebe in den Farbkarten heller dargestellt wurden. Fettgewebe, welches relativ zu den anderen Brustgewebearten eher strahlentransparent ist, stellte sich auf den Farbkarten somit eher dunkel dar. Gleiches galt jedoch auch für die Helligkeit der Mammographien insgesamt. Helle bzw. scheinbar strahlendichtere Mammographien ergaben hellere Farbkarten. Auch ergaben insgesamt dunklere bzw. scheinbar strahlentransparentere Mammographien dunklere Farbkarten. Bei 16% der Farbkarten konnte dieser Zusammenhang nicht einwandfrei hergestellt werden. Die betroffenen Mammographien waren zu 68% rechte CC-Aufnahmen, zu 15% linke MLO-Aufnahmen, zu 11% rechte MLO-Aufnahmen und zu 6% linke CC-Aufnahmen. Auffällig war außerdem, 24
dass der äußerste Sektor in einigen Farbkarten deutlich von den restlichen Sektoren abwich. In Gruppe 1, in der vorrangig die gesunde mit der erkrankten Seite verglichen wurde, konnten keine Eigenschaften in den Farbkarten gefunden werden, welche auf das Vorhandensein eines malignen Tumors hinweisen. Zusätzlich wurde in Gruppe 2 untersucht, ob sich in den Mammographien entdeckte Veränderungen auch in den Farbkarten wiederspiegelten. Zunächst wurden dafür die Aufnahmen aus der Bewertung genommen, bei denen sich im zeitlichen Verlauf früher oder später unbrauchbare Farbkarten fanden. Zeigten sich in den Mammographien im Verlauf deutliche Veränderungen in der Ausdehnung strahlendichter Bereiche, so wurde dies bei 87% der verwendeten Verläufe richtig detektiert und in den Farbkarten dargestellt (s. Abbildung 9). Bei 13 % der Verläufe hingegen wurde dies nicht richtig detektiert. Exakte Veränderungen der Bruststruktur, oder das Auftauchen des Karzinoms wurde in keinem Fall zweifelsfrei detektiert. Zusammenfassend lässt sich für das Feature CentralMoments::Mean sagen, dass Farbkarten berechnet werden, welche innerhalb einer Mammographie Hinweise auf die Dichte des Gewebes in den einzelnen Sektoren relativ zueinander geben können. Im Verlauf können Veränderungen in den Mammographien grundsätzlich detektiert werden. Eine zuverlässige Detektion neu entstandener malignitätsverdächtiger Massen bzw. Karzinome konnte nicht erreicht werden. Anzeichen für ein erhöhtes Brustkrebsrisiko in früheren Mammographien konnten ebenfalls nicht gefunden werden. 25
Abbildung 9. Mammographien und Farbkarten (CentralMoments::Mean) im zeitlichen Verlauf Das Feature HistogramFeatures::Max wurde zunächst in der Einstellung mit 256 Bins ausgewertet. Schon vor dem Vergleichen mit den entsprechenden Mammographien fiel auf, dass bei 75% der Farbkarten einer oder mehrere Sektoren vom äußeren oder inneren Rand schwarz blieben beziehungsweise nicht sichtbar waren. Im darauffolgenden visuellen Vergleich mit den Mammographien zeigte sich, dass bei insgesamt 57% der Farbkarten dennoch ein Zusammenhang zu den Mammographien hergestellt werden konnte. In Gruppe 1 waren es 54 % und in Gruppe 2 60%. Innerhalb der einzelnen Farbkarten zeigten sich Sektoren relativ zu anderen heller, wenn sich hier auf den Mammographien überwiegend strahlendichtere Bereiche befanden. Umgekehrt fanden sich bei relativ gesehen dunkleren Sektoren strahlentransparentere Bereiche (s. Abbildung 10). Erwähnenswert ist hier die Ähnlichkeit dieser Farbkarten zu denen des Features CentralMoments::Mean. Im Seitenvergleich zeigten die Farbkarten sich jedoch zum Teil sehr unterschiedlich. Bei 43% Farbkarten konnte kein sinnvoller Zusammenhang zu den Mammographien hergestellt werden. 26
Abbildung 10. Mammographien und Farbkarten (HistogramFeatures::Max 256) im zeitlichen Verlauf Im nächsten Schritt wurde das Feature HistogramFeatures::Max mit 10 Bins ausgewertet. Zwischen den einzelnen Farbkarten und den entsprechenden Mammographien ließen sich jedoch keine verwertbaren Zusammenhänge herstellen. Für das Feature HistogramFeatures::Max lässt sich zusammenfassend sagen, dass die Einstellung mit 256 Bins grobe Hinweise auf die Dichte des Gewebes in verschiedenen Bereichen innerhalb einer Mammographie gibt, ähnlich wie CentralMoments::Mean. Im Hinblick auf die Tumorentstehung und das Krebsrisiko konnten auch hier keine Hinweise gefunden werden. Das Feature BreastDensity::MeanROICompactness ergab bei visueller Auswertung keine verwertbaren Zusammenhänge mit den Mammographien, Hinweise auf Bruststrukturveränderungen oder Krebsrisiko der einzelnen Patientinnen. 27
7.2) Ergebnisse der möglichen Einflussfaktoren Nach Auswertung der Farbkarten wurden die Registrierungen der Features untersucht. Insgesamt belief sich die Zahl der untersuchten Registrierungen auf 1.184. Die Kategorisierung und Auswertung der Registrierungen im Zusammenhang mit dem Feature CentralMoments::Mean zeigte insgesamt bei 78% der Registrierungen eine leichte, bei 22% eine deutliche Ungenauigkeit. Wurden die Gruppen einzeln betrachtet, ergab sich folgendes Bild: In Gruppe 1 zeigten 68% der Registrierungen leichte Ungenauigkeit und 32% deutliche Ungenauigkeit. Unter den Registrierungen mit deutlicher Ungenauigkeit befanden sich zu 56% rechte MLO-Aufnahmen, zu 29% linke MLO-Aufnahmen, zu 13% rechte CC- Aufnahmen und zu 2% linke CC-Aufnahmen. In Gruppe 2 zeigten sich bei 88% der Registrierungen leichte Ungenauigkeiten. Hier konnten die Mammographien dieser Verläufe mit den entsprechenden Farbkarten gut in Einklang gebracht werden. Lediglich bei 2% der Registrierungen mit leichter Ungenauigkeit passten die Farbkarten nicht zu den Mammographien. Im Gegensatz dazu zeigten sich bei 12% der Registrierungen deutliche Ungenauigkeiten. Das betraf zu 39% rechte und ebenfalls zu 39% linke MLO-Aufnahmen, sowie zu 22% rechte CC-Aufnahmen. Bei 50% dieser Aufnahmen (ausschließlich MLO) erbrachte die Feature Extraktion dennoch relativ brauchbare Farbkarten. Hingegen konnten die anderen 50% der Farbkarten überhaupt nicht in Einklang mit den Mammographien gebracht werden. Dies betraf zu 45% rechte CC- Aufnahmen, zu 33% linke MLO-Aufnahmen und zu 22% rechte MLO- Aufnahmen. Auffallend war hier, dass die Registrierung im Falle der noch brauchbaren Farbkarten noch etwas genauer war als im Falle der unbrauchbaren. Weiterhin zeigte sich, dass selbst bei lediglich leichter Ungenauigkeit der äußere Rand des Brustgewebes meist nicht richtig registriert wurde. Das würde erklären, warum der äußerste Sektor der Farbkarten teilweise stark von den anderen Sektoren abweicht. Die Registrierungen bei Verwendung des Features HistogramFeatures::Max mit 256 Bins zeigte bei insgesamt 76% leichte Ungenauigkeit und bei 24% 28
deutliche Ungenauigkeit. In Gruppe 1 zeigten 68% der Registrierungen leichte Ungenauigkeit und 32% deutliche Ungenauigkeit. Unter den Registrierungen mit deutlicher Ungenauigkeit befanden sich zu 56% rechte MLO-Aufnahmen, zu 29% linke MLO-Aufnahmen, zu 13% rechte CC-Aufnahmen und zu 2% linke CC-Aufnahmen. In Gruppe 2 wurden bei 83% leichte Ungenauigkeit und bei 17% der Registrierungen deutliche Ungenauigkeit festgestellt. Hierbei handelte es sich zu 66% um linke MLO-Aufnahmen, zu 21% um rechte CC-Aufnahmen und zu 13% um rechte MLO-Aufnahmen. 88% dieser Registrierungen brachten unbrauchbare Farbkarten hervor; 12% resultierten jedoch in Farbkarten, die mit den entsprechenden Mammographien in Einklang gebracht werden konnten. Hierbei handelte es sich ausschließlich um MLO-Aufnahmen. Die Beurteilung der Registrierungen von HistogramFeatures::Max mit 10 Bins zeigte exakt die gleiche Verteilung wie HistogramFeatures::Max mit 256 Bins. Ein eindeutiger Zusammenhang zur Qualität der Farbkarten konnte aufgrund deren schlechter Verwertbarkeit jedoch nicht hergestellt werden. Die Registrierungen des Features BreastDensity::MeanROICompactness fielen insgesamt zu 77% in die Kategorie leichte Ungenauigkeit und zu 23% in die Kategorie deutliche Ungenauigkeit. Bei den Registrierungen mit deutlicher Ungenauigkeit handelte es sich bei 43% um rechte MLO-Aufnahmen, bei 27% um linke MLO-Aufnahmen, bei ebenfalls 27% um rechte CC-Aufnahmen und bei 3% um linke CC-Aufnahmen. Ein eindeutiger Zusammenhang zur Qualität der Farbkarten konnte auch hier aufgrund deren schlechter Verwertbarkeit nicht hergestellt werden. Zusammenfassend lässt sich schließen: Je genauer das Template während der Registrierung auf die Mammographie übertragen wurde, desto genauer und besser vergleichbar waren auch die Ergebnisse. Unbrauchbare Farbkarten konnten zum Teil mit sehr fehlerhaften Registrierungen in Zusammenhang gebracht werden. Weiterhin schien die Registrierung bei MLO-Aufnahmen komplexer zu sein, denn die Anzahl der MLO-Aufnahmen mit deutlicher Ungenauigkeit bei der Registrierung war deutlich höher als die der CC- 29
Aufnahmen. Zusätzlich ist zu bemerken, dass rechte CC-Aufnahmen deutlich öfter deutliche Ungenauigkeit bei der Registrierung zeigten als linke. Im Hinblick auf die Qualität der Mammographien fielen 51% der Fälle in die Gruppe A und zeigten damit keine bedeutsamen Mängel. Bei 30% der Fälle fanden sich übermäßig dunkle/helle Grauwerte (Gruppe B), wobei hiervon 94% übermäßig hell und 6% übermäßig dunkel erschienen. 32% der Fälle zeigten Hautfalten und fielen damit in Gruppe C. In die Gruppe D fielen 2% der Fälle, da sich die Mamille auf das Brustgewebe projizierte. In Zusammenschau mit den entsprechenden Farbkarten fiel auf, dass vor allem übermäßig helle Grauwerte Einfluss Ergebnisse hatte. Mammographien mit sehr hellen Grauwerten ergaben sehr helle Farbkarten, auf denen eine Differenzierung der Sektoren deutlich erschwert wurde (vgl. Abbildung 11). Abbildung 11. Beispiel für übermäßig helle Grauwerte 30
8) Diskussion Im Rahmen dieser Doktorarbeit wurde das Programm MammoFeatureMap entwickelt. Das Ziel war es, ein Konzept zu entwickeln und zu testen, mit dem durch die Extraktion von Texture Features automatisch Mammographien auf Strukturveränderungen des Brustgewebes hin analysiert werden können. Wenn möglich, sollten darüber hinaus Aussagen über vorhandene Karzinome und das Brustkrebsrisiko der einzelnen Patientinnen getroffen werden können. Die Farbkarten von CentralMoments::Mean und HistogramFeatures::Max (256 Bins) gaben Hinweise auf die Dichte des Gewebes in einzelnen Sektoren relativ zueinander. Außerdem konnten grobe Veränderungen oft detektiert werden. Auch wenn mit den verwendeten Features noch kein eindeutiger Hinweis auf die Tumorentstehung und das Brustkrebsrisiko gefunden wurde, zeigt sich dennoch, dass die Darstellung von Gewebeeigenschaften mit Hilfe von Farbkarten möglich ist. Im Hinblick auf die Registrierung, scheint diese ein sehr wichtiger Faktor für die Qualität der Farbkarten zu sein. Des Weiteren wird das Interpretieren der Farbkarten Grauwert-basierter Features wie CentralMoments::Mean wesentlich von insgesamt übermäßig hellen Grauwerten in den Mammographien erschwert. Gleichzeitig müssen jedoch darüber hinaus noch andere Ursachen ausschlaggebend sein, denn nicht alle nicht verwertbaren Farbkarten ließen sich durch deutlich ungenaue Registrierungen oder Mängel in den entsprechenden Mammographien erklären. 8.1) Vergleich mit anderen Projekten Um die Ergebnisse dieses Projektes in einen größeren Zusammenhang einzuordnen, werden sie im Folgenden mit Projekten ähnlicher Zielsetzung verglichen. Die in Abschnitt 3.1 beschriebenen Projekte von Wei et al., Häberle et al. und Zheng et al. verwendeten Fall-Kontroll-Studien und ihr Fokus lag eher auf der Auswertung von Texture Features im Hinblick auf die Aussagekraft des Brustkrebsrisikos als auf der Visualisierung durch Farbkarten. Es gelang ihnen zu zeigen, dass Texture Features die Bruststruktur genauer beschreiben und das Brustkrebsrisiko besser vorhersagen können als die mammographische Dichte. Auch wenn das Programm MammoFeatureMap nicht bis zu diesem 31
Punkt gelangt ist, konnte auch hier bestätigt werden, dass Features wie beispielsweise CentralMoments::Mean oder HistogramFeatures::Max (256 Bins) erfolgreich aus den Mammographien extrahiert werden können und sie außerdem die Brustgewebestruktur beschreiben können. Vor allem konnten die Features mit dem hier verwendeten Programm für menschliche Betrachter verwertbar abgebildet werden. Ein weiterer Unterschied zwischen MammoFeatureMap und anderen Projekten scheint die Menge der getesteten Features zu sein. Im Zuge dieser Projekte wurden große Anzahlen von Features mit Hilfe mathematisch-statistischer Methoden ausgewertet und so die aussagekräftigsten Features und Kombinationen herausgearbeitet. Es zeigte sich, dass Kombinationen von mehreren Features aus den verscheiden Gruppen (statistisch, Moment-basiert, Form-basiert, spektral und strukturell) die höchste Aussagekraft haben. Nachdem MammoFeatureMap grundsätzlich gezeigt hat, dass die Feature Extraktion gelingt, scheint die Testung von neuen Features daher sinnvoll. Von der technischen Seite her zeigt ein Vergleich mit den anderen Projekten außerdem, dass eine solide Segmentierung des Brustgewebes ohne den Pectoralismuskel eine sinnvolle Grundlage für die weitere Analyse des Brustgewebes darstellt. Zusätzlich zeigte sich eine Überlegenheit der Feature Extraktion aus dem gesamten segmentierten Brustgewebe gegenüber der Extraktion aus einzelnen ROIs, wobei kleinere Sektoren genauere Ergebnisse erzielten. Das Programm MammoFeatureMap sollte demnach auch weiterhin die Feature Extraktion aus dem gesamten segmentierten Brustgewebe enthalten. 8.2) Limitationen und methodische Einschränkungen Bezüglich der Limitationen sollte zunächst erwähnt werden, dass die Mammographien und daraus resultierenden Farbkarten visuell und damit zu einem gewissen Grad subjektiv ausgewertet wurden. Daraus resultieren mögliche Ungenauigkeiten und Schwierigkeiten bei der Reproduktion. Weiterhin ist technisch bedingt eine gewisse Variabilität beim Einspannen der Brust für die Aufnahme festzustellen. Die daraus resultierende 32
Sie können auch lesen