Informationserschließung und Automatisches Indexieren



Winfried Gödert, Klaus Lepsky, Matthias Nagelschmidt

Informationserschließung und Automatisches Indexieren: ein Lehr und Arbeitsbuch.

XIV, 434 S. Berlin u.a.: Springer, 2012.
(X.media.press)


Modul Informationserschließung und Wissensorganisation [BC 3 / IR 3a]

Das Modul Informationserschließung und Wissensorganisation (BC 3 / IR 3a) vermittelt mit der Vorlesung Grundlagen der Informationserschließung und Wissensorganisation und dem Laborpraktikum Erstellen und Erschließen einer Datenbank für Bilder (BC 32 / IR 3.2) die Grundlagen der Wissensorganisation und Wissensrepräsentation.

In der Vorlesung stehen Methoden, Formen und Techniken der inhaltlichen Dokumenterschließung im Vordergrund. Hierzu gehören insbesondere Techniken zur Analyse des Dokumentinhaltes, Prinzipien zur Repräsentation des Inhaltes in Klassifikationssystemen oder verbalen Dokumentationssprachen sowie Fragen der Eignung der jeweiligen Dokumentationssprache für Verfahren des Information Retrieval. Schwerpunkte liegen auf der Theorie von Dokumentationssprachen (Klassifikationssysteme, Thesauri, Schlagwortregelwerke), der exemplarischen Vorstellung von Dokumentationssprachen sowie der Erarbeitung von Kriterien zur qualitativen Einordnung der Erschließungstechniken.

Theoretische Grundlagen und praktische Anleitungen zu den Inhalten der Lehrveranstaltungen finden sich im Lehrbuch:

Informationserschließung und Automatisches Indexieren.

Die intensive Lektüre der Einleitung und des Kapitels 2 ist Voraussetzung für die erfolgreiche Teilnahme am Modul!

Zu den Inhalten des Laborpraktikums

Laborpraktikum: Erstellen und Erschließen einer Datenbank für Bilder (BC 32 / IR 3.2)

Skript zur Vorlesung

Vorlesung: Grundlagen der Informationserschließung und Wissensorganisation

Übungsaufgaben und Wiederholungsfragen

Wiederholungsübung zur Modulprüfung (BC 3 / IR 3a)



Modul Informationserschließung und bibliografisches Information Retrieval [BC 4 / IR 3b]

Das Modul Informationserschließung und bibliografisches Information Retrieval (BC 4 / IR 3b) schließt an das Modul Informationserschließung und Wissensorganisation (BC 3 / IR 3a) an und besteht aus einer Vorlesung und einem Laborpraktikum.

Das Laborpraktikum Erstellen und Erschließen einer bibliografischen Datenbank (BC 41 / IR 3.3) behandelt die Prinzipien einer formalen und inhaltlichen Dokumentbeschreibung für heterogene Dokumenttypen. Durch die selbstständige Analyse gängiger Datenformate, die Erweiterung und Anpassung eigener Kategorienschemata und die praktische Konzeptionierung und Durchführung von Datenimporten wird ein vertieftes Verständnis von Datenstrukturen für bibliografische Referenzdaten ermöglicht.

Die Vorlesung Bibliografische Datenmodelle und Information Retrieval (BC 42 / IR 3.4) vermittelt die für die Aufgabenstellung des Laborpraktikums benötigten methodischen Kenntnisse zur formalen und inhaltlichen Dokumentbeschreibung sowie zur Erstellung geeigneter bibliografischer Retrievalanwendungen.

Theoretischen Grundlagen und praktische Anleitungen zu den Inhalten der Lehrveranstaltungen finden sich im Lehrbuch

Informationserschließung und Automatisches Indexieren.

Die intensive Lektüre des Kapitels 3 ist Voraussetzung für die erfolgreiche Teilnahme am Modul!

Hilfestellungen zum eingesetzten Programm finden sich in Kapitel 8.

Ein Terminplan für die Arbeiten an der Aufgabenstellung im Laborpraktikum befindet sich beim Blogeintrag zum Laborpraktikum Erstellen und Erschließen einer bibliografischen Datenbank (BC 41 / IR 3.3).

Zu den Inhalten des Laborpraktikums

Laborpraktikum: Erstellen und Erschließen einer bibliografischen Datenbank (BC 41 / IR 3.3)

Skript zur Vorlesung

Vorlesung: Grundlagen der Informationserschließung und Wissensorganisation

Übungsaufgaben und Wiederholungsfragen

Wiederholungsübung zur Modulprüfung BC 4 / IR 3b

Laborpraktikum: Erstellen und Erschließen einer Datenbank für Bilder [BC 3.2 / IR 3.2]



Aufgabenstellung

In diesem Laborpraktikum wird eine strukturierte Datenbank zur Erfassung und Erschließung von Bildern angelegt. Die Bilder werden im Rahmen eines Erschließungskonzepts formal erfasst, durch Datensätze in einer Datenbankumgebung repräsentiert und inhaltlich durch aspektdifferenzierte Thesauri erschlossen. Es werden die Grundsätze zur Erstellung von Erschließungskonzepten, des begrifflichen Strukturierens und der Gestaltung von Dokumentationssprachen erläutert. In die Vorgehensweise der intellektuellen Erschließung durch Inhaltsanalyse und Zuteilung normierten Vokabulars auf Grundlage von Indexierungsprinzipien wird sowohl theoretisch als auch mit Blick auf die konkreten Beispiele eingeführt. Die erschlossenen Daten werden mit einer Retrievalumgebung suchbar gemacht. Beispielrecherchen illustrieren die Möglichkeiten der eingesetzten Erschließungsmethoden.

Lehrmaterialien

Dieser Text gibt lediglich einen Überblick über die für die Aufgabenstellung erforderlichen Quelldaten und die eingesetzte Software.

Grundlage für die Bearbeitung der Aufgabenstellung ist Kapitel 2 des Buchs Informationserschließung und Automatisches Indexieren:

Erstellen und Erschließen einer Datenbank für Bilder (Kapitel 2)

Dort sind die Vorgehensweise und die theoretischen Grundlagen ausführlich beschrieben. Die vollständige Abfolge der einzelnen Schritte der Aufgabenstellung sowie ergänzende und vertiefende Übungsaufgaben finden sich in Abschnitt 2.11 Praktikum Bilddatenbank.

Am Beginn der praktischen Arbeit im Labor steht eine Übung zur Strukturierung.

Datenquellen

Alle Daten lassen sich als Gesamtpaket (in einer Archivdatei) herunterladen:

gln-daten.zip

Die Archivdatei "gln-daten.zip" muss auf dem eigenen Rechner entpackt werden. Dadurch entsteht ein Ordner "gln-daten" mit folgender Verzeichnisstruktur:

/bilder
/fremddaten
/literatur
/systematik
/thesauri
/titelseiten
/wortlisten

Falls nur einzelne Daten heruntergeladen werden sollen, können die o.g. Ordner auch direkt aufgesucht werden:

Stammordner aller Daten zum Buch

Alle im Buch verwendeten Dateinamen und Bezeichnungen beziehen sich immer auf die in der Archivdatei gln-daten.zip bzw. in der Verzeichnisstruktur des gln-Stammordners enthaltenen Dateien.

Software

Das Softwarepaket Midos 6 (inkl. Midos-Thesaurus) steht auf allen Laborrechnern als Vollversion zur Verfügung. Eine voll funktionsfähige Demo-Version kann von der Webseite des Herstellers kostenlos bezogen werden.

Terminplan für das Wintersemester


16.10.-20.10. – Einrichten einer eigenen Arbeitsumgebung; Dateimanager FreeCommander; Präsentationsprogramm PowerpointÜbung zur begrifflichen Strukturierung und Repräsentation am Beispiel Pflanzen (Konzeption mit Powerpoint)

23.10.-27.10. – Übung zur begrifflichen Strukturierung und Repräsentation am Beispiel Pflanzen (Übertragung in Midos-ThesaurusWiederholungsfragen

30.10.-03.11. –  Analyse der Bilder zur Ermittlung geeigneter Beschreibungskategorien; Erstellung eines Datenformats zur formalen und inhaltlichen Erschließung der Bilder (Midos 6)

06.11.-10.11. – Erfassen der formalen Bilddaten als Datensätze einer Datenbank (Midos 6)

13.11.-17.11. – Erfassen der formalen Bilddaten als Datensätze einer Datenbank (Midos 6)
Wiederholungsfragen

20.11.-24.11. – Entwicklung eines Erschließungsmodells für die inhaltliche Bildbeschreibung (Auswahllisten, Thesauri, freie Beschreibungstexte; Regeln zur Deskriptorzuteilung);
Thesauruserstellung (Midos-Thesaurus); Sammeln geeigneter Begriffe und Strukturierung entsprechend der Thesaurus-Konventionen

27.11.-01.12. – Profil2

04.12.-08.12. – Thesauruserstellung (Midos-Thesaurus); Sammeln geeigneter Begriffe und Strukturierung entsprechend der Thesaurus-Konventionen Wiederholungsfragen

11.12.-15.12. – Indexierung der Bilder mit den Elementen der Auswahllisten und der Thesauri (Midos 6, Midos-Thesaurus)

18.12.-22.12. – Indexierung der Bilder mit den Elementen der Auswahllisten und der Thesauri (Midos 6, Midos-Thesaurus)

08.01.-12.01. – Erstellen eines Ausgabeformates zur Anzeige der Bildbeschreibungen und der Bilder (Midos 6Wiederholungsfragen

15.01.-19.01. – Erstellen einer Retrievalanwendung mit Navigationsmöglichkeiten, Suchindizes und Einbindung der Thesaurussuche (Midos 6); Durchführung von Beispielrecherchen anhand selbst gewählter Fragestellungen (Midos 6Wiederholungsfragen

22.01.-26.01.Wiederholung

Laborpraktikum Erstellen und Erschließen einer bibliografischen Datenbank (BC 4.1 / IR 3.3)





Aufgabenstellung

In diesem Laborpraktikum wird mit einer Datenbank gearbeitet, die bibliografische Datensätze für selbstständige und unselbstständige Schriften enthält. Damit wird die Situation einer heterogenen Dokumentkollektion simuliert, für die eine homogene Erschließungs- und Suchumgebung aufgebaut wird. Die Diskussion der formalen und inhaltlichen Erschließung berücksichtigt die spezifischen Eigenschaften bibliografischer Daten in einem Erschließungskonzept und setzt die aus der Beschäftigung mit Bilddokumenten bekannte Vorgehensweise der Aspektorientierung und Verwendung terminologisch kontrollierten Vokabulars fort. Die Dokumentkollektion wird durch Import von Datensätzen aus anderen Quellen erweitert. Die dafür erforderlichen Manipulationen an den zu importierenden Daten werden ausführlich behandelt und mit Hilfe eines Texteditors durchgeführt. Es wird eine Retrievalumgebung aufgebaut und es wird eine Bibliografie erstellt.

Über diesen Text

Dieser Text gibt einen Überblick über die für die Aufgabenstellung erforderlichen Quelldaten und die eingesetzte Software. Grundlage für die Bearbeitung der Aufgabenstellung ist Kapitel 3 des Buchs Informationserschließung und Automatisches Indexieren:

Erstellen und Erschließen einer bibliografischen Datenbank (Kapitel 3)

Dort sind die Vorgehensweise und die theoretischen Grundlagen ausführlich beschrieben. Die vollständige Abfolge der einzelnen Schritte der Aufgabenstellung sowie ergänzende und vertiefende Übungsaufgaben finden sich in Abschnitt 3.12 Praktikum bibliografische Datenbank.

Datenquellen

Alle Daten lassen sich als Gesamtpaket (in einer Archivdatei) herunterladen:

gln-daten.zip

Die Archivdatei "gln-daten.zip" muss auf dem eigenen Rechner entpackt werden. Dadurch entsteht ein Ordner "gln-daten" mit folgender Verzeichnisstruktur:

/bilder
/fremddaten
/literatur
/systematik
/thesauri
/titelseiten
/wortlisten

Falls nur einzelne Daten heruntergeladen werden sollen, können die o.g. Ordner auch direkt aufgesucht werden:

Stammordner aller Daten zum Buch

Alle im Buch verwendeten Dateinamen und Bezeichnungen beziehen sich immer auf die in der Archivdatei gln-daten.zip bzw. in der Verzeichnisstruktur des gln-Stammordners enthaltenen Dateien.

Software

Das Softwarepaket Midos 6 (inkl. Midos-Thesaurus) steht auf allen Laborrechnern als Vollversion zur Verfügung. Eine voll funktionsfähige Demo-Version kann von der Webseite des Herstellers kostenlos bezogen werden.

Terminplan für das Wintersemester


16.10.-20.10. – Einrichten einer eigenen Arbeitsumgebung mit den Programmen Midos 6FreeCommanderNotepad++; Einrichten der bibliografischen Datenbank "literatur.dbm" (Midos 6); Erfassen der formalen Dokumentdaten für die zu ergänzenden Dokumente (Midos 6Präsentation: Prinzipien der formalen Beschreibung; Anpassung des Datenformats an die Erfordernisse der zu ergänzenden Dokumenttypen

23.10.-27.10. – Erfassen der formalen Dokumentdaten für die zu ergänzenden Dokumente (Midos 6)

30.10.-03.11. – Erfassen der formalen Dokumentdaten für die zu ergänzenden Dokumente (Midos 6Wiederholungsfragen

06.11.-10.11. – Inhaltliche Erschließung durch Wortlisten oder aspektorientierte Thesauri gemäß eines selbst gewählten Erschließungskonzepts (Midos 6Midos-Thesaurus)

13.11.-17.11. – Inhaltliche Erschließung durch Wortlisten oder aspektorientierte Thesauri gemäß eines selbst gewählten Erschließungskonzepts (Midos 6Midos-Thesaurus); Automatische Schlagwortvergabe als interaktive, dokumentbezogene Vorgehensweise (Midos 6Wiederholungsfragen

20.11.-24.11. – Erstellen eines Ausgabeformates zur Anzeige der Dokumentbeschreibungen am Bildschirm und innerhalb einer Bibliografie (Midos 6)

27.11.-01.12. – Profil2

04.12.-08.12. – Erstellen eines Ausgabeformates zur Anzeige der Dokumentbeschreibungen am Bildschirm und innerhalb einer Bibliografie (Midos 6)

11.12.-15.12. – Import von Fremddaten ("fremddaten.bib"); Anpassung der Datenstruktur durch globales Suchen und Ersetzen; Harmonisierung der Datenbank (Notepad++Midos 6)

18.12.-22.12. – Import von Fremddaten ("fremddaten.bib"); Anpassung der Datenstruktur durch globales Suchen und Ersetzen; Harmonisierung der Datenbank (Notepad++Midos 6Wiederholungsfragen

08.01.-12.01. – Erstellen einer Retrievalanwendung mit Navigationsmöglichkeiten, Suchindizes und Einbindung der Thesaurussuche (Midos 6)

15.01.-19.01. – Erstellen von Hilfetexten zur Suchgestaltung und -durchführung als Bestandteile der Retrievalanwendung; Erstellen einer Bibliografie mit formalen und sachlichen Registern (Midos 6Wiederholungsfragen

22.01.-26.01. – Wiederholung