Semantische Analyse in der Justiz - EDV-Gerichtstag - 24. September 2020
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
Referenten Robert Wunderer Sören Preissler Richter am Landgericht, Diplom Wirtschaftsinformatiker (FH), Leiter des Sachgebiets IT C.3 Projektleiter SMART, (Scannen) bei dem IT- Stellvertretender Projektleiter eIP in Servicezentrum der bayerischen Rheinland-Pfalz, Pfälzisches Justiz Oberlandesgericht Zweibrücken 2
Ausgangslage Bayern Rheinland-Pfalz • 5 eAkte-Gerichte • 16 eAkte-Gerichte • Ca. 30.000 eAkten • > 30.000 eAkten • Familien-, Zivil- • FAM, VORM, ZIV- Sachen und VSIMM • Scanvolumen über • Scanvolumen über 130.000 Seiten 200.000 Seiten pro Monat pro Monat • Ca. 168.000 ERV- • Ca. 100.000 ERV- Eingänge pro Eingänge pro Monat Monat
eAkte - Neue Herausforderungen • Neue Systeme und Prozesse • Die Vorteile wirken sich erst zeitlich verzögert aus • Parallele Arbeitsweise zwischen Papier- und eAkten • Dazu auch neue Aufgaben ggü. der „Papierwelt“ 4
Neue Aufgaben • Erfassung von Metadaten • Kategorisierung der Dokumente • Benamung nach Namenskonvention • Trennung der Dokumente • Scannen der Dokumente 5
Ziele • 10 Dokumentklassen • daraus „sprechende“ Dateinamen • Automatische Trennung von Konvoluten • Aktenzeichenerkennung • Datumserkennung 7
Dokumentklassen Nr. Dokumentklasse Dateiname PoC 1 Klage KV Klage 28.01.2020.pdf 2 Verteidigungsanzeige BV VA 02.02.2020.pdf 3 Sonstige RA-Schreiben SonstigeRa 28.01.2020.pdf 4 Fristverlängerungen Fristverl 03.02.2020.pdf 5 Kostenfestsetzungsantrag KFA 05.03.2020.pdf 6a EEB eEB 29.10.2019.pdf 6b PZU PZU 29.10.2019.pdf 6c Empfangsbekenntnis EB 29.10.2019.pdf 7 PKH-Antrag PKH-Antr.pdf 8 PKH-Formular PKH-Form.pdf 9 Gutachten SV 04.04.2020.pdf 10 Sonstige Sonstiger Eingang 13.01.2020.pdf 8
Technische Durchführung • Funktionsweise der Texterkennung • Integration in bestehende Systemumgebung (eKP / eIP / forumSTAR / Scansystem) • Anlernen des Systems 9
Funktionsweise der Texterkennung • Erkennen der Dokumentklasse als Basis • Darauf aufbauend Trennung der Dokumente • Darauf aufbauend Aktenzeichen und Datum 10
Integration in den Scanprozess 11
Anlernen des Systems • Referenzerfassung mit Prokey • Optimieren des Systems • Austauschbarkeit der Regelwerke über mehrere Bundesländer 12
13
Ergebnisse und Ausblick • Erkennungsraten • Beispieldokumente (forumSTAR-Eingangskorb) • Ergebnisse und Ausblick 14
Erkennungsraten • Ermittlung: aus Referenzdaten • Auswertung: RICHTIG FALSCH NICHT ERKANNT Dokumentklasse 93% 5% 2% Seitentrennung 93% 5% 2% Aktenzeichen 92% 3% 5% Datum 86% 4% 10% 15
PKH-Antrag mit 5 Anlagen aus Scan (forumSTAR-Eingangskorb) 16
Klage mit 5 Anlagen aus ERV (forumSTAR-Eingangskorb) 17
Ergebnisse Ziele erreicht: • Verarbeitung aller Scan- und ERV-Eingänge (ggf. mit manueller Korrektur) • Klassifikation und Trennung funktioniert mit vielversprechender Quote • Aktenzeichenerkennung und Datumserkennung funktioniert mit vielversprechender Quote • Resultate können in forumSTAR und in die eAkte übernommen werden • Ausblick: Lösungsmöglichkeiten (Sören Preissler) 18
Lessons Learned • 100% Prozent automatische richtige Erkennung ist nicht das Ziel • Integration in die bestehende Umgebung • Großes Potenzial • Agile-Einführung nötig 19
Ausblick - Beteiligtenerkennung Name: Isa bin Osman Anrede 84% Adresse: Ort 88% Maxstr. 134, 12685 Berlin PLZ 94% Typ: Straße 88% Beklagtenvertreter Typ 87% Kanzlei: Nachname 65% Rechtsanwälte Müller & Partner Vorname 55% Titel 77% etc…. 20
Ausblick - Anonymisierung Name: Isa bin Osman Adresse: Maxstr. 134, 12685 Berlin Gruppe: Beklagtenvertreter Kanzlei: Rechtsanwälte Osman & Müller etc…. 21
Referenten Robert Wunderer Sören Preissler Richter am Landgericht, Diplom Wirtschaftsinformatiker (FH), Leiter des Sachgebiets IT C.3 Projektleiter SMART, (Scannen) bei dem IT- Stellvertretender Projektleiter eIP in Servicezentrum der bayerischen Rheinland-Pfalz, Pfälzisches Justiz Oberlandesgericht Zweibrücken 22
Sie können auch lesen