Das Modul „Automatisches Erschließen (BdK 6.2 / DIS 25b)“ vermittelt durch theoretische Inhalte und eine praktische Aufgabenstellung die Grundlagen für linguistisch und statistisch arbeitende Verfahren der automatischen Indexierung. Dazu gehören: Möglichkeiten und Grenzen automatischer Erschließungsverfahren; Linguistisch basierte Verfahren; Statistisch basierte Verfahren; Gewichtungsverfahren; Retrievaltests; Automatische Klassifizierung; Clustering
Praktische Aufgabenstellung
In der praktischen Aufgabenstellung werden mit eigenen Daten unterschiedliche Techniken und Verfahren zur automatischen Indexierung bzw. Erschließung angewendet. Dazu gehört die Erstellung einfacher Stichwortlisten und Register aus Volltexten mit einem Textverarbeitungsprogramm. Der Zusammenhang zwischen Zeichenketten in Dokumenten und Indextermen für das Retrieval wird untersucht. Es werden Indexierungsläufe für eine vorgegebene Dokumentkollektion durchgeführt. Die erzielten Ergebnisse werden analysiert und miteinander in Bezug auf Retrievalverbesserungen verglichen.
Inhalte der praktischen Aufgabenstellung
- Automatische Indexerstellung;
- Intellektuelle Registererstellung;
- Automatische Schlagwortvergabe (Midos 6);
- Automatisches Indexieren I – Grundformerzeugung, Wortklassenerkennung, Kompositumerkennung (Lingo);
- Automatisches Indexieren II – Semantische Analyse (Lingo);
- Automatisches Indexieren III – Wörterbucharbeit (Lingo);
- Automatisches Erschließen mit GND-Daten I (Midos 6);
- Automatisches Erschließen mit GND-Daten II (Lingo);
- Automatisches Indexieren von Datensätzen (Midos 6, Lingo);
- Erstellen einer Retrievalanwendung und Durchführen von Testrecherchen (Midos 6).
Lehrmaterialien
Lehrbuch
Grundlage für die Bearbeitung der Aufgabenstellung ist Kapitel 5 des Buchs Informationserschließung und Automatisches Indexieren:Automatisches Indexieren (Kapitel 5)
Dort sind die Vorgehensweise und die theoretischen Grundlagen ausführlich beschrieben. Hilfestellungen für die praktische Arbeit mit Midos 6 finden sich in Kapitel 8.
Skript zur Vorlesung
Tutorial zur praktischen Aufgabenstellung
Daten
Alle für die Bearbeitung der praktischen Aufgabenstellung benötigten
Daten lassen sich als Gesamtpaket (in einer Archivdatei) herunterladen:
lit-lingo.zip
Die
Archivdatei „lit-lingo.zip“ muss auf dem eigenen Rechner auf der Hauptebene „c:“ entpackt
werden. Dadurch entsteht ein Verzeichnis „lit-lingo“ mit folgenden Unterverzeichnissen:
c:
- lit-lingo
- lingo-work
- midos-literatur
Software
Das Softwarepaket Midos 6 (inkl. Midos-Thesaurus) kann hier heruntergeladen werden.
Eine Anleitung für die Installation des Open source-Systems Lingo findet sich im Tutorial.
Der Open source-Editor Notepad++ ist hier verfügbar: http://notepad-plus-plus.org/
Der Open source-Dateimanager Doublecommander ist hier verfügbar: https://doublecmd.sourceforge.io/