Automatisches Erschließen [BdK 6.2 / DIS 25b]

 


Das Modul „Automatisches Erschließen (BdK 6.2 / DIS 25b)“ vermittelt durch theoretische Inhalte und eine praktische Aufgabenstellung die Grundlagen für linguistisch und statistisch arbeitende Verfahren der automatischen Indexierung. Dazu gehören: Möglichkeiten und Grenzen automatischer Erschließungsverfahren; Linguistisch basierte Verfahren; Statistisch basierte Verfahren; Gewichtungsverfahren; Retrievaltests; Automatische Klassifizierung; Clustering

Praktische Aufgabenstellung

In der praktischen Aufgabenstellung werden mit eigenen Daten unterschiedliche Techniken und Verfahren zur automatischen Indexierung bzw. Erschließung angewendet. Dazu gehört die Erstellung einfacher Stichwortlisten und Register aus Volltexten mit einem Textverarbeitungsprogramm. Der Zusammenhang zwischen Zeichenketten in Dokumenten und Indextermen für das Retrieval wird untersucht. Es werden Indexierungsläufe für eine vorgegebene Dokumentkollektion durchgeführt. Die erzielten Ergebnisse werden analysiert und miteinander in Bezug auf Retrievalverbesserungen verglichen.

 

Inhalte der praktischen Aufgabenstellung

  • Automatische Indexerstellung;
  • Intellektuelle Registererstellung;
  • Automatische Schlagwortvergabe (Midos 6); 
  • Automatisches Indexieren I – Grundformerzeugung, Wortklassenerkennung, Kompositumerkennung (Lingo);
  • Automatisches Indexieren II – Semantische Analyse (Lingo);
  • Automatisches Indexieren III – Wörterbucharbeit (Lingo);
  • Automatisches Erschließen mit GND-Daten I (Midos 6);
  • Automatisches Erschließen mit GND-Daten II (Lingo);
  • Automatisches Indexieren von Datensätzen (Midos 6, Lingo);
  • Erstellen einer Retrievalanwendung und Durchführen von Testrecherchen (Midos 6).


Lehrmaterialien


Lehrbuch

Grundlage für die Bearbeitung der Aufgabenstellung ist Kapitel 5 des Buchs Informationserschließung und Automatisches Indexieren:

Automatisches Indexieren (Kapitel 5)

Dort sind die Vorgehensweise und die theoretischen Grundlagen ausführlich beschrieben. Hilfestellungen für die praktische Arbeit mit Midos 6 finden sich in Kapitel 8.

Skript zur Vorlesung


Tutorial zur praktischen Aufgabenstellung

 

Daten

Alle für die Bearbeitung der praktischen Aufgabenstellung benötigten Daten lassen sich als Gesamtpaket (in einer Archivdatei) herunterladen:

lit-lingo.zip

Die Archivdatei „lit-lingo.zip“ muss auf dem eigenen Rechner auf der Hauptebene „c:“ entpackt werden. Dadurch entsteht ein Verzeichnis „lit-lingo“ mit folgenden Unterverzeichnissen:

   c:
     - lit-lingo

        - lingo-work
        - midos-literatur

Software

Das Softwarepaket Midos 6 (inkl. Midos-Thesaurus) kann hier heruntergeladen werden.

Eine Anleitung für die Installation des Open source-Systems Lingo findet sich im Tutorial.

Der Open source-Editor Notepad++ ist hier verfügbar: http://notepad-plus-plus.org/

Der Open source-Dateimanager Doublecommander ist hier verfügbar: https://doublecmd.sourceforge.io/