Informationserschließung und Automatisches Indexieren



Winfried Gödert, Klaus Lepsky, Matthias Nagelschmidt

Informationserschließung und Automatisches Indexieren: ein Lehr und Arbeitsbuch.

XIV, 434 S. Berlin u.a.: Springer, 2012.
(X.media.press)


Modul Informationserschließung und Wissensorganisation [BC 3 / DIS 02]

Das Modul Informationserschließung und Wissensorganisation (BC 3 / DIS 02) vermittelt mit der Vorlesung Grundlagen der Informationserschließung und Wissensorganisation und dem Laborpraktikum Erstellen und Erschließen einer Datenbank für Bilder (BC 32 / DIS 02b) die Grundlagen der Wissensorganisation und Wissensrepräsentation.

In der Vorlesung stehen Methoden, Formen und Techniken der inhaltlichen Dokumenterschließung im Vordergrund. Hierzu gehören insbesondere Techniken zur Analyse des Dokumentinhaltes, Prinzipien zur Repräsentation des Inhaltes in Klassifikationssystemen oder verbalen Dokumentationssprachen sowie Fragen der Eignung der jeweiligen Dokumentationssprache für Verfahren des Information Retrieval. Schwerpunkte liegen auf der Theorie von Dokumentationssprachen (Klassifikationssysteme, Thesauri, Schlagwortregelwerke), der exemplarischen Vorstellung von Dokumentationssprachen sowie der Erarbeitung von Kriterien zur qualitativen Einordnung der Erschließungstechniken.

Theoretische Grundlagen und praktische Anleitungen zu den Inhalten der Lehrveranstaltungen finden sich im Lehrbuch:

Informationserschließung und Automatisches Indexieren.

Die intensive Lektüre der Einleitung und des Kapitels 2 ist Voraussetzung für die erfolgreiche Teilnahme am Modul!

Zu den Inhalten des Laborpraktikums

Laborpraktikum: Erstellen und Erschließen einer Datenbank für Bilder (BC 32 / DIS 02b)

Skript zur Vorlesung

Vorlesung: Grundlagen der Informationserschließung und Wissensorganisation

Übungsaufgaben und Wiederholungsfragen

Wiederholungsübung zur Modulprüfung (BC 3)



Modul Informationserschließung und bibliografisches Information Retrieval [BC 4 / IR 3b]

Das Modul Informationserschließung und bibliografisches Information Retrieval (BC 4 / IR 3b) schließt an das Modul Informationserschließung und Wissensorganisation (BC 3 / IR 3a) an und besteht aus einer Vorlesung und einem Laborpraktikum.

Das Laborpraktikum Erstellen und Erschließen einer bibliografischen Datenbank (BC 41 / IR 3.3) behandelt die Prinzipien einer formalen und inhaltlichen Dokumentbeschreibung für heterogene Dokumenttypen. Durch die selbstständige Analyse gängiger Datenformate, die Erweiterung und Anpassung eigener Kategorienschemata und die praktische Konzeptionierung und Durchführung von Datenimporten wird ein vertieftes Verständnis von Datenstrukturen für bibliografische Referenzdaten ermöglicht.

Die Vorlesung Bibliografische Datenmodelle und Information Retrieval (BC 42 / IR 3.4) vermittelt die für die Aufgabenstellung des Laborpraktikums benötigten methodischen Kenntnisse zur formalen und inhaltlichen Dokumentbeschreibung sowie zur Erstellung geeigneter bibliografischer Retrievalanwendungen.

Theoretischen Grundlagen und praktische Anleitungen zu den Inhalten der Lehrveranstaltungen finden sich im Lehrbuch

Informationserschließung und Automatisches Indexieren.

Die intensive Lektüre des Kapitels 3 ist Voraussetzung für die erfolgreiche Teilnahme am Modul!

Hilfestellungen zum eingesetzten Programm finden sich in Kapitel 8.

Ein Terminplan für die Arbeiten an der Aufgabenstellung im Laborpraktikum befindet sich beim Blogeintrag zum Laborpraktikum Erstellen und Erschließen einer bibliografischen Datenbank (BC 41 / IR 3.3).

Zu den Inhalten des Laborpraktikums

Laborpraktikum: Erstellen und Erschließen einer bibliografischen Datenbank (BC 41 / IR 3.3)

Skript zur Vorlesung

Vorlesung: Grundlagen der Informationserschließung und Wissensorganisation

Übungsaufgaben und Wiederholungsfragen

Wiederholungsübung zur Modulprüfung BC 4 / IR 3b

Laborpraktikum: Erstellen und Erschließen einer Datenbank für Bilder [BC 3.2 / DIS 02b]



Aufgabenstellung

In diesem Laborpraktikum wird eine strukturierte Datenbank zur Erfassung und Erschließung von Bildern angelegt. Die Bilder werden im Rahmen eines Erschließungskonzepts formal erfasst, durch Datensätze in einer Datenbankumgebung repräsentiert und inhaltlich durch aspektdifferenzierte Thesauri erschlossen. Es werden die Grundsätze zur Erstellung von Erschließungskonzepten, des begrifflichen Strukturierens und der Gestaltung von Dokumentationssprachen erläutert. In die Vorgehensweise der intellektuellen Erschließung durch Inhaltsanalyse und Zuteilung normierten Vokabulars auf Grundlage von Indexierungsprinzipien wird sowohl theoretisch als auch mit Blick auf die konkreten Beispiele eingeführt. Die erschlossenen Daten werden mit einer Retrievalumgebung suchbar gemacht. Beispielrecherchen illustrieren die Möglichkeiten der eingesetzten Erschließungsmethoden.

Lehrmaterialien

Dieser Text gibt lediglich einen Überblick über die für die Aufgabenstellung erforderlichen Quelldaten und die eingesetzte Software.

Grundlage für die Bearbeitung der Aufgabenstellung ist Kapitel 2 des Buchs Informationserschließung und Automatisches Indexieren:

Erstellen und Erschließen einer Datenbank für Bilder (Kapitel 2)

Dort sind die Vorgehensweise und die theoretischen Grundlagen ausführlich beschrieben. Die vollständige Abfolge der einzelnen Schritte der Aufgabenstellung sowie ergänzende und vertiefende Übungsaufgaben finden sich in Abschnitt 2.11 Praktikum Bilddatenbank.

Am Beginn der praktischen Arbeit im Labor steht eine Übung zur Strukturierung.

Datenquellen

Alle Daten lassen sich als Gesamtpaket (in einer Archivdatei) herunterladen:

gln-daten.zip

Die Archivdatei "gln-daten.zip" muss auf dem eigenen Rechner entpackt werden. Dadurch entsteht ein Ordner "gln-daten" mit folgender Verzeichnisstruktur:

/bilder
/fremddaten
/literatur
/systematik
/thesauri
/titelseiten
/wortlisten

Alle im Buch verwendeten Dateinamen und Bezeichnungen beziehen sich immer auf die in der Archivdatei gln-daten.zip bzw. in der Verzeichnisstruktur des gln-Stammordners enthaltenen Dateien.

Software

Das Softwarepaket Midos 6 (inkl. Midos-Thesaurus) steht auf allen Laborrechnern als Vollversion zur Verfügung. Eine voll funktionsfähige Demo-Version kann von der Webseite des Herstellers kostenlos bezogen werden.

Terminplan für das Wintersemester

08.10.-12.10. – Übung zur begrifflichen Strukturierung und Repräsentation am Beispiel Pflanzen (Konzeption mit Powerpoint)

15.10.-19.10. – Übung zur begrifflichen Strukturierung und Repräsentation am Beispiel Pflanzen (Übertragung in Midos-Thesaurus)

22.10.-26.10. – Analyse der Bilder zur Ermittlung geeigneter Beschreibungskategorien; Erstellung eines Datenformats zur formalen und inhaltlichen Erschließung der Bilder (Midos 6); Erfassen der formalen Bilddaten als Datensätze einer Datenbank (Midos 6)

29.10.-02.11. – Erfassen der formalen Bilddaten als Datensätze einer Datenbank (Midos 6)

05.11.-09.11. – Erfassen der formalen Bilddaten als Datensätze einer Datenbank (Midos 6)

12.11.-16.11. – Erstellen eines Ausgabeformates zur Anzeige der Bildbeschreibungen und der Bilder (Midos 6); Entwicklung eines Erschließungsmodells für die inhaltliche Bildbeschreibung (Auswahllisten, Thesauri, freie Beschreibungstexte; Regeln zur Deskriptorzuteilung);

19.11.-23.11. – Projektwoche

26.11.-30.11. – Thesauruserstellung (Midos-Thesaurus); Sammeln geeigneter Begriffe und Strukturierung entsprechend der Thesaurus-Konventionen

03.12.-07.12. – Thesauruserstellung (Midos-Thesaurus); Sammeln geeigneter Begriffe und Strukturierung entsprechend der Thesaurus-Konventionen

10.12.-14.12. – Indexierung der Bilder mit den Elementen der Auswahllisten und der Thesauri (Midos 6, Midos-Thesaurus)

17.12.-21.12. – Indexierung der Bilder mit den Elementen der Auswahllisten und der Thesauri (Midos 6, Midos-Thesaurus)

07.01.-11.01. – Erstellen einer Retrievalanwendung mit Navigationsmöglichkeiten, Suchindizes und Einbindung der Thesaurussuche (Midos 6); Durchführung von Beispielrecherchen anhand selbst gewählter Fragestellungen (Midos 6)

14.01.-18.01.Wiederholung

Laborpraktikum Erstellen und Erschließen einer bibliografischen Datenbank (BC 4.1 / IR 3.3)





Aufgabenstellung

In diesem Laborpraktikum wird mit einer Datenbank gearbeitet, die bibliografische Datensätze für selbstständige und unselbstständige Schriften enthält. Damit wird die Situation einer heterogenen Dokumentkollektion simuliert, für die eine homogene Erschließungs- und Suchumgebung aufgebaut wird. Die Diskussion der formalen und inhaltlichen Erschließung berücksichtigt die spezifischen Eigenschaften bibliografischer Daten in einem Erschließungskonzept und setzt die aus der Beschäftigung mit Bilddokumenten bekannte Vorgehensweise der Aspektorientierung und Verwendung terminologisch kontrollierten Vokabulars fort. Die Dokumentkollektion wird durch Import von Datensätzen aus anderen Quellen erweitert. Die dafür erforderlichen Manipulationen an den zu importierenden Daten werden ausführlich behandelt und mit Hilfe eines Texteditors durchgeführt. Es wird eine Retrievalumgebung aufgebaut und es wird eine Bibliografie erstellt.

Lehrmaterialien

Dieser Text gibt einen Überblick über die für die Aufgabenstellung erforderlichen Quelldaten und die eingesetzte Software. Grundlage für die Bearbeitung der Aufgabenstellung ist Kapitel 3 des Buchs Informationserschließung und Automatisches Indexieren:

Erstellen und Erschließen einer bibliografischen Datenbank (Kapitel 3)

Dort sind die Vorgehensweise und die theoretischen Grundlagen ausführlich beschrieben. Die vollständige Abfolge der einzelnen Schritte der Aufgabenstellung sowie ergänzende und vertiefende Übungsaufgaben finden sich in Abschnitt 3.12 Praktikum bibliografische Datenbank.

Datenquellen

Alle Daten lassen sich als Gesamtpaket (in einer Archivdatei) herunterladen:

gln-daten.zip

Die Archivdatei "gln-daten.zip" muss auf dem eigenen Rechner entpackt werden. Dadurch entsteht ein Ordner "gln-daten" mit folgender Verzeichnisstruktur:

/bilder
/fremddaten
/literatur
/systematik
/thesauri
/titelseiten
/wortlisten

Alle im Buch verwendeten Dateinamen und Bezeichnungen beziehen sich immer auf die in der Archivdatei gln-daten.zip bzw. in der Verzeichnisstruktur des gln-Stammordners enthaltenen Dateien.

Software

Das Softwarepaket Midos 6 (inkl. Midos-Thesaurus) steht auf allen Laborrechnern als Vollversion zur Verfügung. Eine voll funktionsfähige Demo-Version kann von der Webseite des Herstellers kostenlos bezogen werden.

Terminplan für das Wintersemester

08.10.-12.10. – Einrichten der bibliografischen Datenbank "literatur.dbm" (Midos 6);
Erfassen der formalen Dokumentdaten für die zu ergänzenden Dokumente (Midos 6) ; Anpassung des Datenformats an die Erfordernisse der zu ergänzenden Dokumenttypen
(Präsentation: Prinzipien der formalen Beschreibung)

15.10.-19.10. – Erfassen der formalen Dokumentdaten für die zu ergänzenden Dokumente (Midos 6)

22.10.-26.10. – Erfassen der formalen Dokumentdaten für die zu ergänzenden Dokumente (Midos 6)

29.10.-02.11. – Inhaltliche Erschließung durch Wortlisten und/oder aspektorientierte Thesauri gemäß eines selbst gewählten Erschließungskonzepts (Midos 6Midos-Thesaurus)

05.11.-09.11. – Inhaltliche Erschließung durch Wortlisten und/oder aspektorientierte Thesauri gemäß eines selbst gewählten Erschließungskonzepts (Midos 6Midos-Thesaurus);
Automatische Schlagwortvergabe
 als interaktive, dokumentbezogene Vorgehensweise (Midos 6)

12.11.-16.11. – Erstellen eines Ausgabeformates zur Anzeige der Dokumentbeschreibungen am Bildschirm und innerhalb einer Bibliografie (Midos 6)

19.11.-23.11. – Projektwoche

26.11.-30.11. – Erstellen eines Ausgabeformates zur Anzeige der Dokumentbeschreibungen am Bildschirm und innerhalb einer Bibliografie (Midos 6)
03.12.-07.12. – Import von Fremddaten ("fremddaten.bib"); Anpassung der Datenstruktur durch globales Suchen und Ersetzen; Harmonisierung der Datenbank (Notepad++Midos 6)

10.12.-14.12. – Import von Fremddaten ("fremddaten.bib"); Anpassung der Datenstruktur durch globales Suchen und Ersetzen; Harmonisierung der Datenbank (Notepad++Midos 6)

17.12.-21.12. – Erstellen einer Retrievalanwendung mit Navigationsmöglichkeiten, Suchindizes und Einbindung der Thesaurussuche (Midos 6)

07.01.-11.01. – Erstellen von Hilfetexten zur Suchgestaltung und -durchführung als Bestandteile der Retrievalanwendung; Erstellen einer Bibliografie mit formalen und sachlichen Registern (Midos 6)

14.01.-18.01. – Wiederholung


Modul Formalerschließung [BdK 1.4]

Das Modul „Formalerschließung“ [BdK 1.4] besteht aus einer Vorlesung und praktischen Übungen im Labor. Die zweistündige Vorlesung findet regelmäßig wöchentlich statt. Die Laborpraktika beginnen erst nach der Projektwoche, d.h. sie finden ab dem 26.11. wöchentlich vierstündig statt.

Modulinhalte

  • Dokumenttypen und formale Dokumentbeschreibung
  • Entitäten und Beziehungen (FRBR, FRBR-LRM)
  • Prinzipien der Formalerschließung
  • Katalogprinzipien
  • Regelwerke (RDA)
  • Normdateien
  • Datenformate (MARC, BIBFRAME)
  • standardisierte Datenanzeige (ISBD)
  • Datenübernahme, Datenimport, Datenexport
  • Verknüpfung von Medien

Programm der Laborpraktika

  • Erstellen formaler Dokumentbeschreibungen für unterschiedliche Medienarten mit einer bibliografischen Software (allegro-c)
  • Anlegen von Datensätzen für die wichtigsten in Bibliotheken vorkommenden Medienarten
  • Herstellen von Beziehungen zwischen Dokumenten durch Verknüpfung
  • Verwendung von Normdaten
  • Anwenden grundlegender Prinzipien der formalen Dokumentbeschreibung gemäß Regelwerk (RDA)
  • Analysieren der Zusammenhänge zwischen Metadaten und Indexeinträgen für Suchvorgänge

Materialien


RDA

Lehrbuch
Wiesenmüller, Heidrun und Silke Horny: Basiswissen RDA : eine Einführung für deutschsprachige Anwender, 2., überarbeitete und erweiterte Auflage Aufl., Berlin: De Gruyter Saur 2017.
https://www.degruyter.com/view/product/487025?format=B

Website zum Lehrbuch
https://www.basiswissen-rda.de/

RDA-Toolkit
http://access.rdatoolkit.org/

RDA in D-A-CH
https://wiki.dnb.de/display/RDAINFO/RDA+in+D-A-CH

Arbeitshilfen (D-A-CH)
https://wiki.dnb.de/display/RDAINFO/Arbeitshilfen

Standardelemente-Set – Titeldaten
https://wiki.dnb.de/download/attachments/114430616/Standardelemente-Set_Titeldaten.pdf?version=8&modificationDate=1519116655000&api=v2

GBV Beispielsammlung
https://www.gbv.de/bibliotheken/verbundbibliotheken/02Verbund/01Erschliessung/rda-beispielsammlung 

RDA mit allegro

allegro-rdac (Datenbank für das Laborpraktikum)
http://ixtrieve.fh-koeln.de/lehre/rdac.zip

Start mit allegro-rdac
http://ixtrieve.fh-koeln.de/lehre/bc22-allegro-start.pdf

allegro
http://www.allegro-b.de/

allegro-Funktionen
http://www.allegro-b.de/download/doku/alca99g.htm

Programm Laborpraktikum (Moodle)

folgt ...

Konkordanz RDA-allegro
http://ixtrieve.fh-koeln.de/lehre/bc22_rda_allegro_konkordanz.pdf

Vorlesungsskript

Foliensatz zur Vorlesung "Prinzipien der Formalerschließung"
http://ixtrieve.fh-koeln.de/lehre/s-050-prinzipien-der-formalerschliessung.pdf