COMPUTERIZED ADAPTIVE TESTING IN GEOGEBRA - JKU ...
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
Eingereicht von Florian Mühlburger Angefertigt am Institut für Wirtschaftsinformatik – Communications Engineering COMPUTERIZED Betreuer ADAPTIVE TESTING IN Univ.-Prof. Dipl.-Ing. Dr. Stefan Oppl, MBA GEOGEBRA Juli 2021 Masterarbeit zur Erlangung des akademischen Grades Master of Science im Masterstudium Wirtschaftsinformatik JOHANNES KEPLER UNIVERSITÄT LINZ Altenberger Straße 69 4040 Linz, Österreich www.jku.at DVR 0093696
EIDESSTATTLICHE ERKLÄRUNG Ich erkläre an Eides statt, dass ich die vorliegende Masterarbeit selbstständig und ohne fremde Hilfe verfasst, andere als die angegebenen Quellen und Hilfsmittel nicht benutzt bzw. die wörtlich oder sinngemäß entnommenen Stellen als solche kenntlich gemacht habe. Die vorliegende Masterarbeit ist mit dem elektronisch übermittelten Textdokument identisch. Ort, Datum Linz, 22.07.2021 Unterschrift 22. Juli 2021 Florian Mühlburger 2/64
INHALTSVERZEICHNIS Abstract ....................................................................................................................................... 6 1. Einleitung ............................................................................................................................. 7 2. Background – CAT ............................................................................................................... 9 2.1. CAT - Begriffe ............................................................................................................... 9 2.2. CAT - Prozess............................................................................................................. 11 2.3. Zusammenfassung Kapitel 2 ....................................................................................... 12 3. Architektur CAT-Modul ....................................................................................................... 14 3.1. Szenario...................................................................................................................... 14 3.2. Anforderungen ............................................................................................................ 16 3.2.1. Funktionale Anforderungen .............................................................................. 16 Prüfungslogik ................................................................................................... 16 Datenadministration (Zusatzinfos zu Fragen speichern) ................................... 19 3.2.2. Generelle nicht funktionale Anforderungen ...................................................... 20 Performance Efficiency .................................................................................... 21 Compatibility .................................................................................................... 21 Usability .......................................................................................................... 21 Reliability ......................................................................................................... 21 Security .......................................................................................................... 22 Maintainability .................................................................................................. 22 Portability ......................................................................................................... 23 3.2.3. GeoGebra-spezifische nicht funktionale Anforderungen ................................... 23 Performance Efficiency .................................................................................... 24 Reliability ......................................................................................................... 24 Security .......................................................................................................... 24 Maintainability .................................................................................................. 24 3.3. Related Work .............................................................................................................. 25 3.3.1. Bestehende CAT-Plattformen & Libraries......................................................... 25 3.3.2. Analyse bisheriger Prototyp ............................................................................. 27 3.3.3. Zusammenfassung........................................................................................... 28 3.4. Globale Architektur und Kommunikation ..................................................................... 30 3.4.1. Globale Architektur........................................................................................... 30 3.4.2. Kommunikationskonzept .................................................................................. 31 3.5. Architekturkonzept ...................................................................................................... 32 22. Juli 2021 Florian Mühlburger 3/64
3.5.1. Architekturmuster ............................................................................................. 32 Component Based Architecture (CBA) ............................................................. 33 Service Orientierte Architektur (SOA) ............................................................... 33 Microservice Architecture ................................................................................. 33 Layers Architecture (Schichten-Architektur) ..................................................... 34 Microkernel Architecture................................................................................... 34 Space Based Architecture ................................................................................ 35 Auswahl .......................................................................................................... 35 3.5.2. Architektur CAT-Modul ..................................................................................... 36 3.6. Zusammenfassung Kapitel 3 – Beantwortung Forschungsfrage 1 ............................... 38 4. Implementierung CAT-Modul.............................................................................................. 40 4.1. Datenhaltungsschicht .................................................................................................. 40 4.2. REST-Interface ........................................................................................................... 43 4.2.1. Kommunikation REST-Interface ....................................................................... 44 4.2.2. Adaptive Prüfung ............................................................................................. 45 Prüfung vorbereiten.......................................................................................... 45 Prüfung erstellen .............................................................................................. 46 Nächste Prüfungsfrage auswählen ................................................................... 47 Prüfungsergebnis übermitteln .......................................................................... 47 Prüfung löschen ............................................................................................... 48 4.2.3. Datenbankwartung ........................................................................................... 48 4.3. Logikschicht ................................................................................................................ 48 4.3.1. Administrativer Kern (Microkernel) ................................................................... 48 4.3.2. Logik Prüfungstypen (Plugins) ......................................................................... 49 AdaptiveQuiz.................................................................................................... 49 4.4. Zusammenfassung Kapitel 4 – Beantwortung Forschungsfrage 2 ............................... 51 5. Evaluierung CAT-Modul ..................................................................................................... 52 5.1. Funktionale Anforderungen ......................................................................................... 52 5.1.1. Erstellung von Prüfungsentitäten (1.1.1) .......................................................... 52 5.1.2. Prüfungsdurchführung...................................................................................... 52 Abbruchkriterien überprüfen (1.2.1).................................................................. 52 nächste Prüfungsfrage bestimmen (1.2.2)........................................................ 53 5.1.3. Prüfungsbeendigung ........................................................................................ 53 Ergebnis berechnen (1.3.1) .............................................................................. 53 Prüfungsentität löschen (1.3.2)......................................................................... 53 22. Juli 2021 Florian Mühlburger 4/64
5.1.4. Datenadministration ......................................................................................... 53 5.2. Nicht funktionale Anforderungen ................................................................................. 54 5.2.1. Performance Efficiency & Reliability ................................................................. 54 Simulative Evaluierung ..................................................................................... 54 5.2.2. Security ............................................................................................................ 55 5.2.3. Maintainability .................................................................................................. 56 Praktische Evaluierung .................................................................................... 56 5.3. Diskussion – Beantwortung Forschungsfrage 3 .......................................................... 56 6. Konklusion ......................................................................................................................... 58 7. Abbildungsverzeichnis ........................................................................................................ 60 8. Literaturverzeichnis ............................................................................................................ 61 22. Juli 2021 Florian Mühlburger 5/64
Abstract Diese Arbeit beschäftigt sich mit der Entwicklung eines Computerized Adaptive Testing (CAT) Moduls für die Mathematik Lernplattform GeoGebra. CAT stellt eine moderne Lösung für digitale Prüfungen dar, die es ermöglicht Prüfungen automatisch zu erstellen und an die Kompetenz des Prüflings anzupassen. Dadurch bietet CAT Lernenden eine technische Basis für die Selbstevaluierung ihrer Kompetenzen sowie eine Alternative zu klassischen Prüfungsformaten. Allerdings gibt es bisher nur wenige technische Implementierungen von CAT-Plattformen, weshalb im Rahmen dieser Masterarbeit ein CAT-Modul für die Lernplattform GeoGebra konzipiert, entwickelt und evaluiert wurde. Dazu wurden zuerst die Anforderungen an das CAT- Modul festgelegt, wobei besonderer Fokus auf die GeoGebra-spezifischen nicht funktionalen Anforderungen gelegt wurde. Auf Basis dieser Anforderungen wurde eine Literaturreche zu geeigneten Architekturmustern durchgeführt und eine Architektur, auf Basis von 3 Architekturmustern entwickelt. Bei der Implementierung der Architektur wurde besonderes Augenmerk auf den Aufbau der CAT-Modul Datenbank, dem Kommunikationsmodell des REST- Interfaces sowie der Programmlogik gelegt. Die in Java implementierte Programmlogik des Moduls ermöglicht dabei, durch den Aufbau als Microkernel, eine einfache Wartung und Erweiterung des Moduls und implementiert die statistischen Kernfunktionalitäten einer adaptiven Prüfung mittels der Einbindung der R-Library „catR“. Genau diese Integration von R in Java stellte sich bei der Evaluierung des CAT-Moduls als wesentliche Problemstellung heraus, da die Berechnung der nächsten Prüfungsfrage hohe Antwortzeiten bedingt. 22. Juli 2021 Florian Mühlburger 6/64
1. Einleitung Digitale Lehrformate sind schon seit einiger Zeit ein fester Bestandteil moderner Bildung, das zeigt sich unter anderem durch die vielen Softwarelösungen die hierfür angeboten werden und zahlreiche Forschungsarbeiten auf diesem Gebiet (Rodrigues et al., 2019). Ein aktuelles Forschungsgebiet ist dabei die Umsetzung von digitalen Prüfungen (Alseelawi et al., 2020; Oppl et al., 2017; Sahin et al., 2018; Seo & Choi, 2020; Triantafillou et al., 2008; Yuan et al., 2020). Werden digitale Prüfungen in bisherigen Softwarelösungen vorgesehen so sind dies meistens Prüfungen in einem klassischen Format, bei welchem der Lehrende eine Sequenz von Prüfungsfragen definiert, und die Prüflinge diese Sequenz abarbeiten (Triantafillou et al., 2008). Diese Art von Test ermöglicht das gleichzeitige Prüfen einer großen Anzahl von Personen, hat jedoch den wesentlichen Nachteil gegenüber mündlichen Prüfungen, dass der Lehrende nicht dazu in der Lage ist die nächste Frage auf Basis der vorhergehenden Antworten des Prüflings auszuwählen. Somit können die Fragen nicht an die Kompetenz eines Prüflings angepasst werden und das Prüfungsergebnis hat weniger Aussagekraft (Guzman & Conejo, 2005; Weiss, 2011). Computerized Adaptive Testing (CAT) verknüpft die Stärken beider Prüfungsformate und ermöglicht einerseits das simultane Prüfen einer Vielzahl von Personen und andererseits das automatische Anpassen des Fragenniveaus an die Kompetenz des Prüflings. Diese Anpassung wird durch statistische Berechnungen und objektive Fragenschwierigkeiten ermöglicht. Ein prominentes Beispiel für eine Online-Lernplattform im Bereich der Mathematik ist GeoGebra, welche Lehrenden und Lernenden eine Vielzahl von Unterlagen zur Verfügung stellt. Auf der Lernplattform gibt es bereits Ansätze für digitale Prüfungen, welche aber zurzeit nur klassische Prüfungen anbieten. Adaptive Prüfungen würden hier eine gute Ergänzung darstellen und den Lehrenden und Lernenden Mehrwert in unterschiedlichen Anwendungssettings bringen. Einerseits stellt CAT wie bereits zuvor erwähnt eine gute Alternative für klassische Prüfungen im Klassenzimmer dar, anderseits können Lernende mittels CAT ihr Kompetenzniveau zu Hause beliebig oft bestimmen, und sind nicht auf vordefinierte klassische Prüfungen angewiesen. Der Fokus dieser Masterarbeit liegt daher auf der Entwicklung einer in GeoGebra integrierten Testengine welche mittels CAT adaptive Prüfungen abhalten kann. Um Benutzern den Einstieg in die neue Prüfungsumgebung zu erleichtern und um die Plattform flexibler zu gestalten, soll die Testengine auch dazu in der Lage sein andere Arten von Prüfungen (etwa klassische Tests) abhalten zu können. Als weltweit genutzte Lernplattform hat GeoGebra spezifische nicht funktionale Anforderungen, welche berücksichtigt werden müssen. Im Rahmen der Entwicklung müssen daher folgende Fragen beantwortet werden: 1. Wie kann eine Architektur für ein in GeoGebra integriertes CAT-Modul konzipiert werden, um GeoGebra-spezifische nicht funktionale Anforderungen zu erfüllen? 2. Wie kann die in Forschungsfrage 1 definierte Architektur implementiert werden? 3. Inwieweit erfüllt das in Forschungsfrage 2 implementierte CAT-Modul die zuvor definierten Anforderungen? Die erste Forschungsfrage wird in Kapitel 3 bearbeitet und beschäftigt sich mit der Konzeption der Architektur, besonderes Augenmerk wird dabei auf die funktionalen und nicht funktionalen Anforderungen and das CAT-Modul gelegt. Um ein angemessenes Architekturkonzept erstellen zu können, werden daher die Anforderungen an das CAT-Modul definiert. Dazu wird zuerst das Anwendungs-Szenario des CAT-Moduls beschrieben, um anschließend funktionale Anforderungen daraus abzuleiten. Darüber hinaus werden allgemeine nicht funktionale Anforderungen (lt. ISO 25010) beschrieben und auf deren Basis in einen Interview mit GeoGebra 22. Juli 2021 Florian Mühlburger 7/64
die spezifischen nicht funktionalen Anforderungen erhoben und anschließend strukturiert aufbereitet. Im dritten Unterkapitel wird Related Work zu bestehenden CAT-Softwaresystemen aufbereitet und anhand der zuvor definierten Anforderungen näher betrachtet. Im vierten Unterkapitel wird die globale Architektur in der das CAT-Modul eingebettet erläutert und ein Konzept für die Kommunikation mit GeoGebra entwickelt, dazu werden zuerst Technologievorgaben von GeoGebra erhoben und auf deren Basis ein Kommunikationsmodell ausgearbeitet. Auf Basis der definierten Anforderungen und des Kommunikationsmodells mit GeoGebra wird anschließend im fünften Unterkapitel die Architektur konzipiert. Das Unterkapitel startet mit einer Literaturrecherche zu Architekturmustern. Auf Basis der daraus gewonnenen Erkenntnisse wird anschließend ein Architekturkonzept entworfen, Designentscheidungen begründet und eine UML-Repräsentation der Architektur erstellt. Das darauffolgende Kapitel beschäftigt sich mit der Implementierung der in Kapitel 3.5. beschriebenen Architektur, die Kapitelstruktur orientiert sich dabei an einer 3 Schichtenarchitektur. Das erste Unterkapitel beschreibt kurz die Datenhaltung des CAT Moduls, hierbei liegt der Fokus auf der Entscheidung welche Daten bei GeoGebra und welche im CAT Modul abgespeichert werden. Im zweiten Unterkapitel wird die Spring Boot-Implementierung des für die Präsentationsschicht zur Verfügung gestellten REST Interfaces beschrieben und anhand einer adaptiven Prüfung detailliert beschrieben. Das dritte Unterkapitel beschreibt die Implementierung der Logik des CAT Moduls welche mittels Java umgesetzt wurde, auch hier wird wieder im Detail auf Designentscheidungen, Problemstellungen und für die Verfolgung der Zielsetzung der Arbeit besonders relevante Programmausschnitte eingegangen. Das nächste Kapitel beschäftigt sich mit der Evaluierung des in Kapitel 4. umgesetzten CAT- Moduls hinsichtlich der funktionalen und nicht funktionalen Anforderungen an das System. Dabei werden die in Kapitel 3.2. definierten Anforderungen herangezogen, die funktionalen Anforderungen werden dabei systematisch auf ihre (Nicht-) Erfüllung untersucht und auf relevante Code-Abschnitte eingegangen. Die nicht funktionalen Anforderungen werden einerseits mittels einer praktischen Evaluierung (durch das Hinzufügen eines neuen Prüfungstyps), sowie durch eine simulative Evaluierung (durch die Simulation mehrerer gleichzeitiger Prüfungen) überprüft und deren (Nicht-) Erfüllung begründet. Anschließend werden die Ergebnisse präsentiert, Problemstellungen erläutert und mögliche Lösungen vorgeschlagen. 22. Juli 2021 Florian Mühlburger 8/64
2. Background – CAT Computerized Adaptive Testing beschreibt ein Prüfungsformat, bei welchem sich die Prüfungsfragen an das Kompetenzniveau des Prüflings anpassen (Meijer & Nering, 1999). Diese Anpassung wird umgesetzt indem die nächste Prüfungsfrage, auf Basis der bereits beantworteten Prüfungsfragen, aus dem Item Pool ausgewählt wird (Guzman & Conejo, 2005). Genauer gesagt wird nach jeder beantworteten Frage das aktuelle Kompetenzniveau des Prüflings, mittels der Next Item Selection Method, geschätzt, und auf Basis des geschätzten Kompetenzniveaus die nächste Prüfungsfrage aus dem Item Pool ausgewählt. Mit jeder beantworteten Frage wird die statistische Schätzung genauer, daher wird dieser Prozess des Kompetenz-Schätzens und der Fragenauswahl so lange wiederholt bis eine gewisse Schätzgenauigkeit erreicht wurde und die Prüfung beendet wird (Triantafillou et al., 2008). Die Schätzgenauigkeit stellt dabei eines der definierten Abbruchkriterien da, alternativ kann die Prüfung auch nach dem Erreichen einer gewissen Fragenanzahl beendet werden. Dieses Prüfungsformat bringt im Vergleich zu klassischen Prüfungen einige Vorteile mit sich, so werden weniger Prüfungsfragen benötigt um ein statistisch aussagekräftiges Kompetenzniveau des Prüflings zu berechnen (Guzman & Conejo, 2005; Triantafillou et al., 2008), das Prüfungsergebnis (Kompetenzniveau) ist genauer (Guzman & Conejo, 2005; Weiss, 2011) und das Prüfungsergebnis steht sofort zur Verfügung (Triantafillou et al., 2008), ein weiterer wesentlicher Vorteil ist die Anpassung der Prüfung an die Kompetenz des Prüflings (Guzman & Conejo, 2005). Natürlich hat CAT auch gewisse Nachteile wie die hohen Kosten in der Entwicklung solcher Systeme und der Kalibrierung der Prüfungsfragen sowie dem kontinuierlichen Management der Prüfungsfragen welches durch die hohen Auswirkungen falsch kalibrierter Fragen notwendig wird (Meijer & Nering, 1999; Triantafillou et al., 2008). Die Fragenkalibrierung beinhaltet die durch das Response Model gewählten Parameter. In den folgenden Abschnitten werden einerseits die wichtigsten Begrifflichkeiten von CAT, sowie der CAT-Prozess beschrieben. 2.1. CAT - Begriffe Dieses Unterkapitel beschäftigt sich mit der Beschreibung der wichtigsten Begriffe im Computerized Adaptive Testing. Um den Lesern einen Überblick über CAT zu geben, werden die Begriffe einzeln beschrieben und auf deren mögliche Ausprägungen eingegangen. Response Model Das Response Model bildet das Herzstück eines CAT-Systems, da es für die Berechnung des Kompetenzniveaus sowie die Auswahl der nächsten Frage verantwortlich ist. Im Regelfall wird bei modernen CAT-Systemen die Item Response Theory (IRT) als Response Model verwendet (Guzman & Conejo, 2005). Dabei baut IRT auf der Annahme auf, dass die Leistung eines Prüflings durch eine Menge von unbekannten Faktoren erklärt werden kann und diese Faktoren messbar sind. Einer dieser unbekannten Faktoren ist dabei das Kompetenzniveau des Prüflings (ibid.). Ziel ist es dieses Kompetenzniveau zu schätzen und somit eine Verbindung zwischen Items und dem Kompetenzniveau eines Prüflings herzustellen. IRT bietet dafür einige Item Auswahl Algorithmen und Bewertungsverfahren (Jun Chen & Lei Wang, 2010). Dabei stellen drei logistische Modelle die am weitesten verbreiteten Ansätze da (Oppl et al., 2017): 22. Juli 2021 Florian Mühlburger 9/64
3-Parameter Modell Bei diesem Modell werden zu jeder Prüfungsfrage drei Faktoren abgespeichert: der Diskriminierungsfaktor, der Schwierigkeitsfaktor und der Ratefaktor. Der Diskriminierungsfaktor gibt an wieviel Informationen eine Frage zur Schätzung des Kompetenzniveaus beiträgt (Guzman & Conejo, 2005). Der Schwierigkeitsfaktor (Fragenschwierigkeit) entspricht dem Kompetenzniveau bei dem ein Prüfling eine Frage mit gleicher Wahrscheinlichkeit Richtig oder Falsch beantworten würde (Guzman & Conejo, 2005). Der Ratefaktor gibt die Wahrscheinlichkeit an mit welcher ein Prüfling das richtige Ergebnis erraten kann (Guzman & Conejo, 2005). 2-Parameter Modell Bei diesem Modell wird das Kompetenzniveau des Prüflings nur mittels dem zuvor beschriebenen Diskriminierungsfaktor und Schwierigkeitsfaktor geschätzt. Der Ratefaktor wird außer Acht gelassen was bedeutet, dass nicht berücksichtigt wird, ob ein Prüfling die Antwort auf die Prüfungsfrage erraten hat. Das nicht Beachten des Ratefaktors hat vor allem bei Prüfungsfragen mit offenen Fragestellungen wenig Einfluss. 1-Parameter Modell Dieses Modell ist das am weitesten verbreite IRT Modell (Oppl et al., 2017) und verwendet für die Schätzung des Kompetenzniveaus nur den zuvor beschriebenen Schwierigkeitsfaktor. Der Ratefaktor wird wie beim 2-Parameter Modell außer Acht gelassen, und auch der Diskriminierungsfaktor wird nicht beachtet. Durch das nicht Berücksichtigen des Diskriminierungsfaktors kann die nächste Prüfungsfrage nicht anhand des höchsten Informationsgewinns ausgewählt werden. Item Pool Der Item Pool ist eine wesentliche Komponente eines CAT-Systems da er die Sammlung aller möglichen Prüfungsfragen repräsentiert. Um die Funktionalität eines CAT-Systems zu gewährleisten, muss ein Item Pool gewisse Qualitätskriterien erfüllen: Einerseits muss der Item Pool über ausreichend Items verfügen um während der Prüfung durchgehend informative Items ausliefern zu können, andererseits müssen die Items im Pool mittels der gewählten IRT- Parameter kalibriert sein (Triantafillou et al., 2008). Im Idealfall beinhaltet der Item Pool eine Vielzahl von Fragen deren Schwierigkeit gleichmäßig verteilt ist (ibid.). Wie bereits zuvor erwähnt, stellen die Erstellung, Kalibrierung und Wartung des Item Pools wesentliche Herausforderungen eines CAT-Systems da (Meijer & Nering, 1999; Triantafillou et al., 2008). Input Proficiency Level Das Input Proficiency Level beschreibt das geschätzte Kompetenzniveau eines Prüflings zu Beginn der Prüfung. Im Idealfall wird dieses Input Proficiency Level tatsächlich individuell für jeden Prüfling gesetzt und so von Beginn an die Fragenschwierigkeit an den Prüfling angepasst. Das führt auch zu Prüfungen mit weniger Fragen, da schneller eine ausreichende Ergebnisgenauigkeit berechnet werden kann (Weiss & Kingsbury, 1984). Ansonsten wird im Regelfall zufällig eine mittlere Schwierigkeit gewählt (Veldkamp & Matteucci, 2013). 22. Juli 2021 Florian Mühlburger 10/64
Next Item Selection Method Die Next Item Selection Method ist dafür verantwortlich nach jedem beantworteten Item das nächste Item auszuwählen und stellt somit die Implementierung des Response Models da. Wie bereits beschrieben wird zuerst das aktuelle Kompetenzniveau des Prüflings berechnet, um anschließend auf dessen Basis das nächste Item auszuwählen. Unabhängig davon welches IRT- Modell gewählt wurde können mehrere Ansätze zur Berechnung des nächsten Items verwendet werden. Die zwei meistverwendeten Ansätze in der Item Response Theory sind dabei die Auswahl anhand der maximalen Information und mittels Bayes Item Auswahl (Meijer & Nering, 1999; Weiss & Kingsbury, 1984). Wird ein Item anhand der maximalen Information ausgewählt so wird das Item gewählt, das einerseits die meiste Information für das geschätzte Kompetenzniveau liefert und andererseits die Genauigkeit des Prüfungsergebnisses maximiert (ibid.). Wird das nächste Item mittels Bayes ausgewählt so wird das Item mit der geringsten posteriori Varianz zum aktuellen Kompetenzniveau ausgewählt (ibid.). Abbruchkriterien Die Abbruchkriterien definieren wann eine adaptive Prüfung beendet wird, und haben im Regelfall zwei Ausprägungen: Einerseits können Prüfungen nach einer gewissen Anzahl von beantworteten Fragen beendet werden, anderseits wenn eine gewisse Schätzgenauigkeit (MeasurementAccuracy) für das Ergebnis erreicht wurde (Triantafillou et al., 2008). Natürlich ist auch ein Kombination der beiden Kriterien möglich, wobei die Prüfung beendet wird, sobald das erste der beiden Kriterien eintrifft. Im Fall des CAT-Moduls wird eine Kombination der Kriterien verwendet. 2.2. CAT - Prozess In diesem Unterkapitel wird der CAT-Prozess im Detail beschrieben, und in Abbildung 1: CAT- Prozess dargestellt. Noch vor Start der Prüfung wird das Start-Kompetenzniveau (Input Proficiency Level) festgelegt. Dieses Kompetenzniveau orientiert sich im Idealfall an der tatsächlichen Kompetenz eines Prüflings, ist das aber nicht möglich wird im Regelfall ein mittleres Kompetenzniveau gewählt. Auf Basis dieses Kompetenzniveaus wird im nächsten Schritt die erste Prüfungsfrage berechnet und an den Prüfling ausgeliefert. Diese erste Prüfungsfrage wird aus dem Itempool gezogen und entspricht in etwa dem zuvor definierten Kompetenzniveau. Die Berechnung des neuen Kompetenzniveaus erfolgt nach der Beantwortung der Prüfungsfrage wobei das Kompetenzniveau steigt, wenn die Frage richtig beantwortet wurde und sinkt, wenn die Frage falsch beantwortet wurde. Anschließend werden die Abbruchkriterien der adaptiven Prüfung überprüft, sollte die gewünschte Schätzgenauigkeit bzw. die maximale Anzahl an Prüfungsfragen noch nicht erreicht sein, wird die Prüfung fortgeführt, und die nächste Prüfungsfrage anhand der aktuellen Kompetenz des Prüflings ausgewählt. Bei gestiegenen Kompetenzniveau wird dem Prüfling eine schwierigere Frage ausgespielt, während sich die Fragen bei gesunkenen Kompetenzniveau vereinfachen. Dieser Prozess des Kompetenzschätzens und Fragenbeantwortens wird so lange wiederholt bis eines der Abbruchkriterien der Prüfung erreicht wird. Bei Eintritt eines Abbruchkriteriums wird die Prüfung beendet und das Prüfungsergebnis dargestellt. Wichtig ist dabei zu erwähnen, dass das Prüfungsergebnis nicht von der Anzahl der richtig beantworteten Fragen abhängt, sondern von allen beantworteten Fragen und deren Schwierigkeit. So ist es möglich, dass Prüflinge die gleiche Anzahl an Fragen richtig bzw. falsch 22. Juli 2021 Florian Mühlburger 11/64
beantworten und dennoch unterschiedlich hohe Kompetenzniveaus haben, wenn ein Prüfling schwierigere Fragen richtig beantworten musste. Abbildung 1: CAT-Prozess 2.3. Zusammenfassung Kapitel 2 Dieses Kapitel diente der Vermittlung des nötigen Hintergrundwissens für CAT. Dazu wurde das adaptive Prüfungsformat zuerst grundlegend erklärt und die Bedeutung der Anpassung der Prüfungsfragen an das Kompetenzniveau des Prüflings erläutert. Diese Anpassung an das Kompetenzniveau führt einerseits zu Vorteilen wie genaueren Prüfungsergebnissen bei weniger Prüfungsfragen und andererseits zu neuen Problemstellungen wie den hohen Entwicklungskosten 22. Juli 2021 Florian Mühlburger 12/64
solcher Prüfungssysteme. Darauffolgend wurden die Begrifflichkeiten: „Response Model“, „Item Pool“, „Next Item Selection Method“ und „Abbruchkriterien“ erläutert. Anschließend wurde beschrieben wie im CAT-Prozess in jeder Iteration eine passende Prüfungsfrage ausgewählt und an den Prüfling ausgeliefert wird, um dann das Kompetenzniveau, auf Basis der Antwort des Prüflings, statistisch neu zu berechnen, damit dieses wieder als Grundlage für die Auswahl der nächsten Prüfungsfrage verwendet werden kann. Darüber hinaus wurde darauf eingegangen, wie am Ende einer jeden Iteration Abbruchkriterien überprüft werden um festzustellen, ob die Prüfung bereits als beendet gilt. 22. Juli 2021 Florian Mühlburger 13/64
3. Architektur CAT-Modul Dieses Kapitel befasst sich mit der Beantwortung der ersten Forschungsfrage, bei welcher es sich um die Konzeptionierung einer Architektur für das CAT-Modul handelt. Dazu wird im ersten Unterkapitel das Anwendungsszenario des CAT-Moduls beschrieben. Um eine ausreichende Qualität der Architektur zu gewährleisten, werden anschließend die genauen funktionalen Anforderungen an das CAT-Modul beschrieben und andererseits generelle nicht funktionale Anforderungen an Softwaresysteme erläutert. Auf Basis eines Interviews mit GeoGebra werden davon die relevantesten nicht funktionalen Anforderungen ausgewählt, damit darauf besonderes Augenmerk bei Erstellung der Architektur gelegt werden kann. Basierend auf dem Szenario und den Anforderungen werden im nächsten Unterkapitel CAT-Plattformen, CAT-Bibliotheken und der bestehende CAT-Prototyp analysiert. Anschließend wird kurz die Architektur beschrieben, in welche das CAT-Modul eingebettet wird und das Kommunikationsmodell des CAT-Moduls vorgestellt. Auf Basis der Anforderungen und des Kommunikationsmodells wird dann im fünften Unterkapitel eine Literaturrecherche zu Architekturmustern, welche die ausgewählten nicht funktionalen Anforderungen unterstützen, durchgeführt und eine Architektur für das neue CAT- Modul entwickelt und präsentiert. 3.1. Szenario Voraussetzung für das CAT-Modul ist einerseits eine ausreichende Anzahl an Prüfungsfragen inklusive deren Schwierigkeit, sowie das Vorhandensein eines User Interfaces zur Darstellung, Beantwortung und Überprüfung der Korrektheit der Fragen außerhalb des CAT-Moduls. Das Zusammenspiel des CAT-Moduls mit der GeoGebra-Lernplattform und den Usern ist in Abbildung 2 dargestellt und wird in diesem Kapitel genauer beschrieben. Aus dem Use-Case leitet sich folgende (grobe) Aufgabenaufteilung ab: User (Lehrende und Lernende) o Konfigurierung und Durchführung von Prüfungen GeoGebra (Lernplattform) o Speicherung und Überprüfung der Prüfungsfragen o Schnittstelle zwischen User und CAT-Modul CAT-Modul o Speicherung von Zusatzinformationen zu Fragen o Prüfungslogik 22. Juli 2021 Florian Mühlburger 14/64
Abbildung 2: Use-Case CAT-Modul GeoGebra ist eine Online-Lernplattformen für Mathematik, und bietet eine Vielzahl von Lernmaterialien sowie Lernunterstützung für über 30 Millionen Lehrende und Lernende aus 190 Ländern (Bichler, 2017). Das im Rahmen dieser Masterarbeit entwickelte CAT-Modul dient der Erweiterung der Produktpalette von GeoGebra und soll einerseits als Alternative für klassische Prüfungen innerhalb des Klassenzimmers dienen und andererseits den Lernenden die Selbstevaluierung des aktuellen Kompetenzniveaus ermöglichen. Um eine Prüfung zu erstellen, wählt der User im GeoGebra-Frontend die gewünschte Prüfungskonfiguration aus, welche anschließend von GeoGebra an das Modul übermittelt wird. Die Konfigurationsparameter für Adaptive Prüfungen beinhalten: Prüfungsthema Kompetenzniveau des Lernenden Maximale Anzahl an Fragen Minimale Genauigkeit des Prüfungsergebnisses Implementierung des Response Models 22. Juli 2021 Florian Mühlburger 15/64
Bei der Durchführung der Prüfung sendet der User seine Antwort an das GeoGebra-Frontend, dieses bewertet die Korrektheit der Frage und leitet das Ergebnis an das CAT-Modul weiter. In Folge prüft das CAT-Modul, ob die Prüfung als abgeschlossen gilt und sendet dementsprechend die nächste Prüfungsfrage oder die Information das die Prüfung abgeschlossen wurde. Die Auswahl der nächsten Prüfungsfrage hängt dabei von der Korrektheit und Schwierigkeit der vorhergehenden Fragen ab und wird statistisch berechnet. Ein weiterer wesentlicher Punkt ist, dass die bisherige GeoGebra-Lernplattform nicht alle Daten, welche zur Erstellung von adaptiven Prüfungen notwendig sind, abspeichert. Dazu zählen, die Fragenschwierigkeit, das Thema der Frage und weitere Konfigurationsparameter für adaptive Prüfungen. Die Architektur muss daher auch eine Trennung der Daten zwischen GeoGebra und CAT-Modul definieren wobei beachtet werden muss, dass die Daten wieder miteinander in Verbindung gesetzt werden können, darüber hinaus muss es die Datenadministration innerhalb des CAT-Moduls ermöglichen. 3.2. Anforderungen Aus dem zuvor beschriebenen Szenario und Problemstellungen ergeben sich nun einige Anforderungen an das System. Die funktionalen Anforderungen werden dabei direkt aus dem Szenario und der Problemstellung abgeleitet. Zur Ermittlung der nicht funktionalen Anforderungen, werden zuerst die Kriterien des ISO Standards 25010 für Softwarequalität aufgelistet, und anschließend aufgrund des Szenarios, sowie eines Interviews mit GeoGebra, die für das CAT- Modul relevantesten Qualitätskriterien, als nicht funktionale Anforderungen definiert. 3.2.1. Funktionale Anforderungen Das zuvor beschriebene Szenario zeigt zwei funktionale Aufgabenbereiche des CAT-Moduls, einerseits die Prüfungslogik und andererseits die Speicherung von Zusatzinformationen zu Fragen. Die aus dem Szenario resultierenden funktionalen Anforderungen werden im Folgenden zwei darauf basierenden Aufgabenbereichen zugeordnet, wobei zuerst die Inhalte der Aufgabenbereiche genauer bestimmt werden. Der Bereich der Prüfungslogik beinhaltet sämtliche funktionale Anforderungen für das Erstellen, Durchführen und Beenden von Prüfungen. Eine genauere Betrachtung der in Abbildung 2 angeführten „Speicherung von Zusatzinfos“ zu Fragen zeigt, dass sich dahinter mehrere Anforderungen verbergen, da diese Zusatzinfos auch administriert und mit der GeoGebra-Datenbank verknüpft werden müssen. Somit beinhaltet der zweite Aufgabenbereich Datenadministration sämtliche funktionale Anforderungen für das Erstellen, Lesen, Verändern und Löschen der in der CAT-Datenbank gespeicherten Zusatzinformationen zu Fragen der GeoGebra-Datenbank. Da es sich beim CAT-Modul um eine von der Lernplattform getrenntes Prüfungs-Backend handelt, muss diese alle Funktionalitäten mittels einer Schnittstelle zur Verfügung stellen. Konkret müssen die Funktionalitäten mittels eines Softwareinterfaces bereitgestellt werden, damit diese von GeoGebra Services aufgerufen werden können. Im Folgenden kann also davon ausgegangen werden, dass die vorgestellten Funktionalitäten mittels eines Softwareinterfaces zur Verfügung gestellt werden. Ausgenommen davon ist nur die Überprüfung der Abbruchkriterien, da es sich dabei um eine interne Funktionalität handelt. Prüfungslogik Dieser Bereich beinhaltet alle funktionalen Anforderungen an das CAT-Modul für das Erstellen, Durchführen und Beenden von Prüfungen. Konkret handelt es sich dabei um die Erstellung von Prüfungsentitäten auf Basis gewisser Konfigurationsparameter, die Prüfungsdurchführung 22. Juli 2021 Florian Mühlburger 16/64
inklusive der Bestimmung der nächsten Prüfungsfrage und der Überprüfung der Abbruchkriterien, sowie um die Berechnung des Prüfungsergebnisses. Prüfungserstellung Das CAT-Modul dient der Prüfungserstellung und Administration. Daher muss es auch eine Möglichkeit bieten, um Prüfungsentitäten zu erstellen. Da das CAT-Modul mit unterschiedlichen Prüfungstypen umgehen kann, müssen bei der Erstellung einer Prüfung, die für den jeweiligen Prüfungstyp relevanten Konfigurationsparameter übermittelt werden. Daraus ergibt sich folgende konkrete Anforderung: 1.1.1 - Prüfungsentität erstellen Funktionalität: Das CAT-Modul erstellt auf Basis einer Prüfungskonfiguration eine Prüfungsentität und stellt diese GeoGebra zur Verfügung. Input: Prüfungskonfiguration je nach Prüfungstyp Konfigurationsparameter für adaptive Prüfungen: Prüfungsthema Kompetenzniveau des Lernenden Maximale Anzahl an Fragen Minimale Genauigkeit des Prüfungsergebnisses Implementierung des Response Models Output: Konfiguration der Prüfung, Prüfungs-ID Fehlerbehandlung: Fehlermeldung: Prüfungskonfiguration nicht gültig Prüfungsdurchführung Um Prüfungen durchführen zu können, muss das CAT-Modul die Logik zur Prüfungsdurchführung beinhalten. Diese Logik ist je nach Prüfungstyp unterschiedlich, beinhaltet aber immer zwei Komponenten. Erstens die Überprüfung der Abbruchkriterien, bei welcher das CAT-Modul vor der Auslieferung jeder Frage überprüfen muss, ob eines der definierten Abbruchkriterien (beispielsweise maximale Anzahl der Fragen, Schätzgenauigkeit) erreicht wurde. Zweitens die Auswahl der nächsten Prüfungsfrage, bei welcher das CAT-Modul die nächste Prüfungsfrage auf Basis der gewählten Prüfungskonfiguration auswählen und übermitteln muss. Daraus ergeben sich folgende konkrete Anforderungen: 22. Juli 2021 Florian Mühlburger 17/64
1.2.1 - Abbruchkriterien überprüfen Funktionalität: Das CAT-Modul überprüft vor der Auslieferung der nächsten Prüfungsfrage, ob eines der Abbruchkriterien bereits eingetreten ist. Input: Abbruchkriterien je nach Prüfungstyp Abbruchkriterien für adaptive Prüfungen: Maximale Anzahl an Fragen Minimale Genauigkeit des Prüfungsergebnisses Output: Prüfung beendet oder Prüfung nicht beendet Fehlerbehandlung: - 1.2.2 - nächste Prüfungsfrage bestimmen Funktionalität: Das CAT-Modul wählt auf Basis der Prüfungskonfiguration sowie des Prüfungsstatus die nächste Prüfungsfrage aus und übermittelt diese an GeoGebra. Input: Prüfungskonfiguration, aktuelle Antwort, Prüfungs-ID. Output: Nächste Prüfungsfrage, Prüfungs-ID Fehlerbehandlung: Fehlermeldung: Prüfung nicht vorhanden Prüfungsbeendigung Um die Prüfungsergebnisse zu übermitteln und Ressourcen für neue Prüfungen freizumachen, muss das CAT-Modul alle Funktionalitäten für die Beendigung einer Prüfung bieten. Je nach Prüfungstyp kann sich die Logik bei der Implementierung dabei unterscheiden, prinzipiell gibt es aber immer zwei funktionale Anforderungen. Erstens die Berechnung und Übermittlung des Prüfungsergebnisses auf Basis der ausgespielten Prüfungsfragen und deren Antworten und zweitens das Löschen der Prüfungsentität zur Freigabe von Systemressourcen. 22. Juli 2021 Florian Mühlburger 18/64
1.3.1 - Ergebnis berechnen Funktionalität: Das CAT-Modul berechnet auf Basis der gestellten Prüfungsfragen, der Antworten des Prüflings und der Prüfungskonfiguration das Endergebnis der Prüfung und übermittelt dieses an GeoGebra. Input: Prüfungskonfiguration, Prüfungsfragen, Antworten, Prüfungs-ID Output: Prüfungsergebnis je nach Prüfungstyp, Prüfungs-ID Prüfungsergebnis für adaptive Prüfungen: Kompetenzniveau Schätzgenauigkeit Prüfungskonfiguration Prüfungsfragen Antworten Fehlerbehandlung: Fehlermeldung: Prüfung nicht vorhanden 1.3.2 - Prüfungsentität löschen Funktionalität: Das CAT-Modul löscht eine Prüfungsentität und gibt die beanspruchten Systemressourcen frei. Input: Prüfungs-ID Output: Löschbestätigung, Prüfungs-ID Fehlerbehandlung: Fehlermeldung: Prüfung nicht vorhanden Datenadministration (Zusatzinfos zu Fragen speichern) Dieser Bereich beinhaltet alle funktionalen Anforderungen für die Verwaltung der Zusatzinformationen von Prüfungsfragen. Bei diesen Zusatzinformationen handelt es sich konkret um Informationen zur Schwierigkeit einer Frage, ihrer Themenzugehörigkeit und anderen relevanten Konfigurationsparametern welche, in Verknüpfung mit den Daten derselben Frage aus der GeoGebra-Datenbank, die Umsetzung von adaptiven Prüfungen ermöglichen. Die funktionalen Anforderungen beinhalten daher das Erstellen, Lesen, Verändern und Löschen aller in der CAT-Datenbank gespeicherten Zusatzinformationen zu den Prüfungsfragen der GeoGebra- Datenbank. Besonders wichtig ist es dabei zu beachten, dass weder die Zusatzinformationen gespeichert in der CAT-Datenbank noch die Grundinformationen gespeichert in GeoGebra- Datenbank allein ausreichen, um adaptive Prüfungen zu erstellen. Die Erstellung von adaptiven Prüfungen ist nur durch eine Kombination beider Datenbanken möglich, weshalb die Datensätze der CAT-Datenbank, den entsprechenden Datensätzen der GeoGebra-Datenbank eindeutig zugeordnet sein müssen. Diese Verknüpfung der beiden Datenbanken wird in den folgenden Anforderungen mittels des Parameters Fragen-ID dargestellt, welcher das Mapping der Datensätze zwischen der CAT- und der GeoGebra-Datenbank ermöglicht. 22. Juli 2021 Florian Mühlburger 19/64
2.1. - Datensatz erstellen Funktionalität: Das CAT-Modul bietet eine Softwareschnittstelle, über welche GeoGebra Datensätze in der CAT-Datenbank erstellen kann. Input: Fragen-ID, Zusatzinformationen Output: Speicherbestätigung Fehlerbehandlung: Datensatz bereits vorhanden 2.2 - Datensatz lesen Funktionalität: Das CAT-Modul bietet eine Softwareschnittstelle, über welche GeoGebra Datensätze aus der CAT-Datenbank auslesen kann. Input: Fragen-ID, gewünschte Zusatzinformationen Output: Datensatz Fehlerbehandlung: Datensatz nicht vorhanden 2.3 - Datensatz verändern Funktionalität: Das CAT-Modul bietet eine Softwareschnittstelle, über welche GeoGebra Datensätze in der CAT-Datenbank verändern kann. Input: Fragen-ID, Zusatzinformationen Output: Speicherbestätigung Fehlerbehandlung: Datensatz nicht vorhanden 2.4 - Datensatz löschen Funktionalität: Das CAT-Modul bietet eine Softwareschnittstelle über welche GeoGebra Datensätze in der CAT-Datenbank löschen kann. Input: Fragen-ID, Zusatzinformationen Output: Löschbestätigung Fehlerbehandlung: Datensatz nicht vorhanden 3.2.2. Generelle nicht funktionale Anforderungen Dieses Unterkapitel beschreibt allgemeine nicht funktionale Anforderungen an Softwaresysteme. Um dabei die Vollständigkeit und Relevanz der genannten nicht funktionalen Anforderungen zu garantieren, wurden die nicht funktionalen Anforderungen aus dem ISO 25010 Standard gewählt. Der ISO 25010 Standard beschreibt 8 Softwarequalitätskriterien. Im Folgenden werden die Kriterien laut ISO 25010 näher beschrieben (ISO/IEC, 2010). Eines der Kriterien „Functional Suitability“ beschreibt dabei den Erfüllungsgrad der funktionalen Anforderungen und wird daher in diesem Unterkapitel nicht näher behandelt. 22. Juli 2021 Florian Mühlburger 20/64
Performance Efficiency Die Perfomance Efficiency beschreibt die Leistungsfähigkeit eines Systems unter Berücksichtigung der Systemressourcen. Dazu werden die Geschwindigkeit, die Ressourcenauslastung und die Leistungskapazität eines Systems zur Beurteilung in Betracht gezogen. Compatibility Die Kompatibilität eines Systems beschreibt, in welchem Ausmaß es dazu in der Lage ist Informationen mit anderen Systemen auszutauschen, sowie ob das System in der Lage ist seine Funktion zu erfüllen, während es sich die zugrundeliegende Hard- und Softwareinfrastruktur teilt. Die Fähigkeit Informationen mit anderen Systemen auszutauschen und Informationen anderer Systeme zu verarbeiten wird Interoperabilität genannt. Die Fähigkeit sich Hard- und Softwareressourcen mit anderen Systemen zu teilen wird im ISO Standard als Ko-Existenz bezeichnet. Usability Die Usability beschreibt inwiefern ein System es Usern ermöglicht ihre Ziele effektiv, effizient und auf befriedigende Art und Weise zu erreichen. Dabei wird die Usability in sechs Unterpunkte gegliedert: 1. Appropriateness recognizability Beschreibt wie gut ein User erkennen kann, ob das System seine Anforderungen erfüllen kann. 2. Learnability Beschreibt wie effektiv, effizient, befriedigend und mit welchem Risiko ein User den Umgang mit einem System bzw. Teilen davon erlernen kann. 3. Operability Beschreibt wie leicht ein System benutzt werden kann. 4. User error protection Beschreibt inwiefern ein System einen User davor schützt Fehler zu machen. 5. User interface aesthetics Beschreibt wie angenehm die Verwendung des Systeminterfaces für den User ist. 6. Accessibilty Beschreibt inwiefern ein System von unterschiedlichen Usern mit unterschiedlichen Fähigkeiten verwendet werden kann. Reliability Reliability beschreibt, wie verlässlich ein System seine Funktionen unter bestimmten Bedingungen über einen bestimmten Zeitraum erfüllt, und setzt sich aus vier Unterkriterien zusammen. 1. Maturity Die Maturity eines Systems beschreibt, wie verlässlich ein System seine Funktionen unter normalen Bedingungen erfüllt. 22. Juli 2021 Florian Mühlburger 21/64
2. Availability Die Availability beschreibt, in welchem Ausmaß ein System bei Verwendung funktionsfähig und erreichbar ist. 3. Fault tolerance Fault tolerance beschreibt, in welchem Ausmaß ein System trotz Hardware oder Softwarestörungen funktionsfähig bleibt. 4. Recoverability Recoverability beschreibt, inwiefern ein System dazu in der Lage ist, nach einer Systemunterbrechung, verloren Daten und den gewünschten Systemzustand wiederherzustellen. Security Das Sicherheitskriterium beschreibt inwiefern ein System seine Informationen und Daten vor unautorisierten Datenzugriff schützt und autorisierten Datenzugriff ermöglicht. Dieses Kriterium wird dabei in fünf Unterkriterien geteilt. 1. Confidentiality Das Vertraulichkeitskriterium beschreibt, inwiefern das System nur autorisierten Zugriff auf Daten sicherstellt. 2. Integrity Das Integritätskriterium beschreibt inwiefern das System unautorisiertes Zugreifen und Modifizieren von Daten oder Code verhindert. 3. Non-repudiation Die Nicht-Abstreitbarkeit beschreibt wie sehr das System sicherstellt, dass von einer Entität durchgeführte Aktionen oder Befehle im Nachhinein nicht von dieser Entität abgestritten werden können. 4. Accountability Die Verantwortlichkeit beschreibt inwiefern die Aktionen einer Entität im Nachhinein genau auf diese Entität zurückgeführt werden können. 5. Authenticity Die Authentizität beschreibt inwiefern es für ein Subjekt oder eine Ressource möglich ist seine Identität zu beweisen. Maintainability Die Maintainability beschreibt, wie effektiv und effizient ein System modifiziert werden kann, bspw. um es zu erweitern, verbessern oder anzupassen. Dabei gliedert sich die Maintainability in 5 Unterkriterien: 1. Modularity Die Modularity eines Systems beschreibt inwiefern das System aus einzelnen Komponenten mit minimalen Abhängigkeiten aufgebaut ist. 22. Juli 2021 Florian Mühlburger 22/64
2. Reusability Die Wiederverwendbarkeit beschreibt, inwiefern Teile eines Systems in anderen Systemen wiederverwendet werden können. 3. Analysability Die Analysierbarkeit eines Systems beschreibt wie effektiv und effizient die Auswirkung einer Änderungen eines Systemteils, auf andere Systemteile, ermittelt werden kann. Darüber hinaus hängt die Analysierbarkeit eines Systems auch davon ab wie effektiv und effizient die Ursachen für Systemfehler und Systemschwächen gefunden werden können. 4. Modifiability Die Modifiability beschreibt inwiefern ein System effektiv und effizient modifiziert werden kann ohne die Systemqualität dabei zu verschlechtern. 5. Testability Die Testability beschreibt wie effektiv und effizient Testkriterien für ein System eingeführt und Tests am System durchgeführt werden können. Portability Die Portabilität beschreibt wie einfach ein System von einer Systemumgebung in eine andere umgesiedelt werden kann. Dabei spielen 3 Punkte eine wesentliche Rolle: 1. Adaptability Die Adaptierbarkeit beschreibt wie effektiv und effizient ein System an unterschiedliche Systemumgebungen (Hardware, Software, etc.) angepasst werden kann. 2. Installability Die Installierbarkeit, beschreibt wie einfach ein System auf einer Systemumgebung installiert bzw. deinstalliert werden kann. 3. Replaceability Beschreibt inwiefern ein System ein anderes System, welches dieselben Funktionalitäten bietet, ersetzen kann. 3.2.3. GeoGebra-spezifische nicht funktionale Anforderungen Da das CAT-Modul im Rahmen dieser Masterarbeit entsteht und dadurch nur begrenzte Ressourcen zur Verfügung stehen, wurde beschlossen, dass der Fokus bei der Entwicklung auf die für GeoGebra besonders relevanten nicht funktionalen Anforderungen gelegt werden soll. Das bedeutet aber nicht das die anderen Qualitätskriterien laut ISO 25010 gänzlich außer Acht gelassen wurden, sondern lediglich das bei der Auswahl der Architekturmuster sowie bei der Evaluierung des CAT-Moduls nur diese Anforderungen herangezogen werden. Um diese GeoGebra-spezifischen nicht funktionalen Anforderungen zu ermitteln, wurde daher ein Interview mit GeoGebra durchgeführt. Als Interviewpartner stellte GeoGebra ein Mitglied seines Entwicklerteams, welches bereits von Anfang an in das Projekt involviert war, zur Verfügung. Der Interviewpartner bringt somit nicht nur das technische Verständnis für die Qualitätskriterien und Anforderungen mit, sondern kennt auch die Geschäftsperspektive und daraus resultierenden Anforderungen des Projekts. Als Interview Leitfaden dienten die Softwarequalitätskriterien laut ISO 25010, welche einzeln im Detail durchbesprochen wurden. Jedes dieser Qualitätskriterien wurde dazu dem Interviewpartner erläutert und anschließend im Detail diskutiert. Auf Basis dieser 22. Juli 2021 Florian Mühlburger 23/64
Diskussion wurde dann entschieden, ob ein Qualitätskriterium als nicht funktionale Anforderung aufgenommen wird. Die gewählten Anforderungen dienen einerseits als Auswahlkriterien für die verwendeten Architekturmuster sowie als Kriterien zur Evaluierung des CAT-Moduls. Die gewählten Anforderungen und die Gründe für deren Auswahl werden in den nächsten Absätzen einzeln kurz beschrieben. Performance Efficiency Die Performance Efficiency stellt für GeoGebra eine der wesentlichsten Anforderungen an das CAT-Modul dar. Einerseits da das System Live von den Lernenden bei Prüfungen benutzt wird und daher die Zeit für die statistische Berechnung und Auslieferung der nächsten Prüfungsfrage möglichst geringgehalten werden muss (Time Behaviour). Andererseits da GeoGebra weltweit genutzt wird und mit einer Vielzahl simultaner Prüfungen gerechnet werden muss (Capacity). Eine geringe Ressourcenauslastung ist laut GeoGebra keine Anforderung an das System. Der Fokus auf diese Qualitätskriterien wird auch durch die Betonung der Notwendigkeit von Skalierbarkeit während des Projekt-Kickoffs unterstrichen. Reliability Da GeoGebra weltweit verwendet wird und zu jeder Zeit reibungslos zur Verfügung stehen muss, spielt auch die Reliability des CAT-Moduls eine Rolle. Dabei definierte GeoGebra den Fokus klar auf die Availability und Maturity des Systems, während Teilaspekte wie die Fehlertoleranz und Wiederherstellbarkeit als weniger wichtig erachtet wurden. Security Die Sicherheit der Daten des Systems ist GeoGebra ein Anliegen, da das CAT-Modul aber nur im Hintergrund arbeitet und keine sensiblen Daten verarbeitet wurde im Interview beschlossen, das ein einfacher API-Key welcher den Zugriff nur für die GeoGebra App ermöglicht ausreicht um die notwendige Sicherheit zu gewährleisten. Daher wird die Sicherheit in der weiteren Entwicklung der Architektur als gegeben betrachtet. Maintainability Durch den Einsatz des CAT-Moduls für Prüfungen zur Selbstevaluierung sowie im Klassenzimmer leiten sich mehrere Prüfungsarten ab, einerseits adaptive Prüfungen, bei welchen die Testfragen automatisch auf Basis der Kompetenz des Lernenden gewählt werden und andererseits „klassische Prüfungen“ bei welchen ein Prüfungsersteller die Prüfungsfragen und deren Gewichtung festlegt. Da der Fokus dieser Arbeit auf den adaptiven Prüfungen liegt, wird im Weiteren größtenteils auf diese eingegangen. Allerdings ist es wichtig die „klassischen Prüfungen“ im Sinne der Maintainability der Architektur zu bedenken. Weshalb die Maintainability des Systems für GeoGebra eine der wesentlichsten Anforderungen an das CAT-Modul darstellt. Fokus wird dabei vor allem auf die Modularity, Modifiability und Testability des Systems gelegt. Da es sich um ein kleines Modul handeltn können laut GeoGebra Aspekte wie die Wiederverwendbarkeit und die Analysierbarkeit des Systems vernachlässigt werden. Auch dieses Qualitätskriterium wird durch die Betonung der Notwendigkeit von Erweiterbarkeit während des Projekt-Kickoffs unterstrichen. Das Interview mit GeoGebra schränkte somit den Fokus der nicht funktionalen Anforderungen auf die Performance Efficiency, die Reliability sowie die Maintainability ein. Daher werden diese 3 Qualitätskriterien insbesondere in der Auswahl der Architekturmuster für die CAT-Architektur sowie für die Evaluierung des CAT-Moduls verwendet. 22. Juli 2021 Florian Mühlburger 24/64
Sie können auch lesen