indexierung-retrieval.de
Informationserschließung und Automatisches Indexieren
Winfried Gödert, Klaus Lepsky, Matthias Nagelschmidt
Informationserschließung und Automatisches Indexieren: ein Lehr- und Arbeitsbuch.
Berlin u.a.: Springer, 2012. XIV, 434 S.
(X.media.press)
Midos – eine Datenbank- und Thesaurussoftware für Lehre und Forschung
![]() |
Midos – Datenbankmanager |
Das Datenbanksystem Midos wird seit langem in Lehre und Forschung am Institut für Informationswissenschaft der TH Köln eingesetzt. Es erlaubt einen ausgesprochen transparenten Umgang mit Datenbanken und verfügt über ein großes Funktionsspektrum, mit dem sich verschiedenste Aufgabenstellungen der Informationserschließung und des Information Retrieval praktisch lösen lassen.
Informationserschließung – Strukturierte Dokumentbeschreibung [DIS 07]
Das Modul Informationserschließung – Strukturierte Dokumentbeschreibung (DIS 07) schließt an das Modul Informationserschließung und Wissensorganisation (DIS 02) an und behandelt die Prinzipien einer formalen und inhaltlichen Dokumentbeschreibung für heterogene Dokumenttypen. Durch die selbstständige Analyse gängiger Datenformate, die Erweiterung und Anpassung eigener Kategorienschemata und die praktische Konzeptionierung und Durchführung von Datenimporten wird ein vertieftes Verständnis von Datenstrukturen für bibliografische Referenzdaten ermöglicht.
Praktische Aufgabenstellung
In der praktischen Aufgabenstellung wird mit einer Datenbank gearbeitet, die
bibliografische Datensätze für selbstständige und unselbstständige
Schriften enthält. Damit wird die Situation einer heterogenen
Dokumentkollektion simuliert, für die eine homogene Erschließungs- und
Suchumgebung aufgebaut wird. Die Diskussion der formalen und
inhaltlichen Erschließung berücksichtigt die spezifischen Eigenschaften
bibliografischer Daten in einem Erschließungskonzept und setzt die aus
der Beschäftigung mit Bilddokumenten bekannte Vorgehensweise der
Aspektorientierung und Verwendung terminologisch kontrollierten
Vokabulars fort. Die Dokumentkollektion wird durch Import von
Datensätzen aus anderen Quellen erweitert. Die dafür erforderlichen
Manipulationen an den zu importierenden Daten werden ausführlich
behandelt und mit Hilfe eines Texteditors durchgeführt. Aus allen Datensätzen der Datenbank wird eine Bibliografie erstellt.
Automatisches Erschließen [BdK 6.2 / DIS 25b]
Das Modul „Automatisches Erschließen (BdK 6.2 / DIS 25b)“ vermittelt durch theoretische Inhalte und eine praktische Aufgabenstellung die Grundlagen für linguistisch und statistisch arbeitende Verfahren der automatischen Indexierung. Dazu gehören: Möglichkeiten und Grenzen automatischer Erschließungsverfahren; Linguistisch basierte Verfahren; Statistisch basierte Verfahren; Gewichtungsverfahren; Retrievaltests; Automatische Klassifizierung; Clustering
Praktische Aufgabenstellung
In der praktischen Aufgabenstellung werden mit eigenen Daten unterschiedliche Techniken und Verfahren zur automatischen Indexierung bzw. Erschließung angewendet. Dazu gehört die Erstellung einfacher Stichwortlisten und Register aus Volltexten mit einem Textverarbeitungsprogramm. Der Zusammenhang zwischen Zeichenketten in Dokumenten und Indextermen für das Retrieval wird untersucht. Es werden Indexierungsläufe für eine vorgegebene Dokumentkollektion durchgeführt. Die erzielten Ergebnisse werden analysiert und miteinander in Bezug auf Retrievalverbesserungen verglichen.