Semantische Analyse in der Justiz - EDV-Gerichtstag - 24. September 2020

Die Seite wird erstellt Jörn Völker
 
WEITER LESEN
Semantische Analyse in der Justiz - EDV-Gerichtstag - 24. September 2020
Semantische Analyse in der Justiz
       29. EDV-Gerichtstag – 24. September 2020
Semantische Analyse in der Justiz - EDV-Gerichtstag - 24. September 2020
Referenten

    Robert Wunderer                       Sören Preissler
Richter am Landgericht,             Diplom Wirtschaftsinformatiker (FH),
Leiter des Sachgebiets IT C.3       Projektleiter SMART,
(Scannen) bei dem IT-               Stellvertretender Projektleiter eIP in
Servicezentrum der bayerischen      Rheinland-Pfalz, Pfälzisches
Justiz                              Oberlandesgericht Zweibrücken

                                                                             2
Semantische Analyse in der Justiz - EDV-Gerichtstag - 24. September 2020
Ausgangslage
      Bayern             Rheinland-Pfalz
• 5 eAkte-Gerichte      • 16 eAkte-Gerichte
• Ca. 30.000 eAkten     • > 30.000 eAkten
• Familien-, Zivil-     • FAM, VORM, ZIV-
  Sachen                  und VSIMM
• Scanvolumen über      • Scanvolumen über
  130.000 Seiten          200.000 Seiten
  pro Monat               pro Monat
• Ca. 168.000 ERV-      • Ca. 100.000 ERV-
  Eingänge pro            Eingänge pro
  Monat                   Monat
Semantische Analyse in der Justiz - EDV-Gerichtstag - 24. September 2020
eAkte - Neue Herausforderungen
        • Neue Systeme und Prozesse
        • Die Vorteile wirken sich erst
          zeitlich verzögert aus
        • Parallele Arbeitsweise zwischen
          Papier- und eAkten
        • Dazu auch neue Aufgaben ggü.
          der „Papierwelt“

                                            4
Semantische Analyse in der Justiz - EDV-Gerichtstag - 24. September 2020
Neue Aufgaben

• Erfassung von Metadaten
• Kategorisierung der
  Dokumente
• Benamung nach
  Namenskonvention
• Trennung der Dokumente
• Scannen der Dokumente

                                   5
Semantische Analyse in der Justiz - EDV-Gerichtstag - 24. September 2020
Ablauf des Proof of Concept (PoC)
         • Ziele
         • Durchführung
         • Ergebnisse

                                    6
Semantische Analyse in der Justiz - EDV-Gerichtstag - 24. September 2020
Ziele
• 10 Dokumentklassen
• daraus „sprechende“
  Dateinamen
• Automatische Trennung von
  Konvoluten
• Aktenzeichenerkennung
• Datumserkennung

                                7
Semantische Analyse in der Justiz - EDV-Gerichtstag - 24. September 2020
Dokumentklassen
Nr.                           Dokumentklasse   Dateiname PoC
1     Klage                                    KV Klage 28.01.2020.pdf
2     Verteidigungsanzeige                     BV VA 02.02.2020.pdf
3     Sonstige RA-Schreiben                    SonstigeRa 28.01.2020.pdf

4     Fristverlängerungen                      Fristverl 03.02.2020.pdf
5     Kostenfestsetzungsantrag                 KFA 05.03.2020.pdf
6a    EEB                                      eEB 29.10.2019.pdf
6b    PZU                                      PZU 29.10.2019.pdf
6c    Empfangsbekenntnis                       EB 29.10.2019.pdf
7     PKH-Antrag                               PKH-Antr.pdf

8     PKH-Formular                             PKH-Form.pdf

9     Gutachten                                SV 04.04.2020.pdf

10    Sonstige                                 Sonstiger Eingang 13.01.2020.pdf

                                                                                  8
Semantische Analyse in der Justiz - EDV-Gerichtstag - 24. September 2020
Technische Durchführung
    • Funktionsweise der
      Texterkennung
    • Integration in bestehende
      Systemumgebung (eKP / eIP /
      forumSTAR / Scansystem)
    • Anlernen des Systems

                                    9
Semantische Analyse in der Justiz - EDV-Gerichtstag - 24. September 2020
Funktionsweise der Texterkennung
• Erkennen der
  Dokumentklasse als Basis
• Darauf aufbauend Trennung
  der Dokumente
• Darauf aufbauend
  Aktenzeichen und Datum

                                       10
Integration in den Scanprozess

                                 11
Anlernen des Systems
   • Referenzerfassung mit Prokey
   • Optimieren des Systems
   • Austauschbarkeit der Regelwerke
     über mehrere Bundesländer

                                    12
13
Ergebnisse und Ausblick
• Erkennungsraten
• Beispieldokumente
  (forumSTAR-Eingangskorb)
• Ergebnisse und Ausblick

                                      14
Erkennungsraten
• Ermittlung: aus Referenzdaten
• Auswertung:
                   RICHTIG   FALSCH   NICHT ERKANNT
  Dokumentklasse   93%       5%       2%
  Seitentrennung   93%       5%       2%
  Aktenzeichen     92%       3%       5%
  Datum            86%       4%       10%

                                                      15
PKH-Antrag mit 5 Anlagen aus Scan
   (forumSTAR-Eingangskorb)

                                    16
Klage mit 5 Anlagen aus ERV
 (forumSTAR-Eingangskorb)

                              17
Ergebnisse
Ziele erreicht:
•   Verarbeitung aller Scan- und ERV-Eingänge (ggf. mit
    manueller Korrektur)
•   Klassifikation und Trennung funktioniert mit
    vielversprechender Quote
•   Aktenzeichenerkennung und Datumserkennung
    funktioniert mit vielversprechender Quote
•   Resultate können in forumSTAR und in die eAkte
    übernommen werden
•   Ausblick: Lösungsmöglichkeiten (Sören Preissler)
                                                          18
Lessons Learned
•   100% Prozent automatische
    richtige Erkennung ist nicht
    das Ziel
•   Integration in die
    bestehende Umgebung
•   Großes Potenzial
•   Agile-Einführung nötig

                                   19
Ausblick - Beteiligtenerkennung
Name:
Isa bin Osman
                       Anrede        84%
Adresse:
                       Ort           88%
Maxstr. 134,
12685 Berlin           PLZ           94%

Typ:                   Straße        88%

Beklagtenvertreter     Typ           87%
Kanzlei:               Nachname      65%
Rechtsanwälte Müller
& Partner              Vorname       55%

                       Titel         77%

etc….
                                     20
Ausblick - Anonymisierung
Name:
Isa bin Osman
Adresse:
Maxstr. 134,
12685 Berlin
Gruppe:
Beklagtenvertreter
Kanzlei:
Rechtsanwälte Osman
& Müller

etc….
                                    21
Referenten

    Robert Wunderer                       Sören Preissler
Richter am Landgericht,             Diplom Wirtschaftsinformatiker (FH),
Leiter des Sachgebiets IT C.3       Projektleiter SMART,
(Scannen) bei dem IT-               Stellvertretender Projektleiter eIP in
Servicezentrum der bayerischen      Rheinland-Pfalz, Pfälzisches
Justiz                              Oberlandesgericht Zweibrücken

                                                                             22
Sie können auch lesen