Katalog.plus! – die integrierte Suchumgebung der Universitätsbibliothek Bielefeld
Dirk Pieper,
Christian Pietsch &
Friedrich Summann
Universitätsbibliothek Bielefeld, LibTec
Kolloquium Wissensinfrastruktur am 15.05.2014
Eigene Erweiterungen
- Datenbank-Empfehlungsdienst
- Einband-Abbildungen
- Rezensionen (in Vorbereitung)
- 6750 Zitierstile via CSL (Stand: Mai 2014)
Eigene Erweiterungen
1. Datenbank-Empfehlungsdienst
Ausgangslage
- Fachdatenbanken für die Literaturrecherche befanden sich außerhalb des OPAC.
- Nutzer müssen eine fachliche Vorauswahl treffen,
- dann eine Datenbank auswählen,
- den Link zum eigentlichen Angebot finden,
- sich auf der dortigen Website zurechtfinden.
→ Zu abgelegen, zu viele Klicks, zu heterogen.
Lösungsansatz
- Relevante Fachdatenbanken(-Listen) im OPAC empfehlen abhängig von der Suchanfrage!
→ Empfehlungsdienst (recommender system)
- Vorreiter beim Einsatz von Empfehlungsdiensten im OPAC: SuUB Bremen
- Suchanfrage → 1–3 Fachdatenbanken-Listen
- Direkte Lösung durch künstliche Intelligenz (KI) schwierig, langsam, unzuverlässig:
- automatisches Textverstehen (NLU) ist unausgereift
- autom. Kategorisierung (ML) benötigt Trainingsdaten
- verwendete Algorithmen sind zeit- und speicherintensiv
Lösung
- Indirekte Lösung durch bibliothekarische Intelligenz (BI)
einfach, schnell, zuverlässig:
Das
im Katalog gesammelte Wissen der Katalogisierer nutzen,
indem die Metadaten der ersten (z.Z. 20) Suchergebnisse
ausgewertet werden.
- Beispiel: Suchanfrage = »beauvoir«
ergibt Funde aus den Fachbibliotheken
16; 15; 05; 12; 15; 14; 16; 05; 16; 15; 15; 15; 16; 15; 15; 15; 15.
- naive Auswertung: 9 × FB 15; 4 × FB 16; 2 × FB 5; Rest 1 ×
- liefert ungenaue Ergebnisse (s. folgende Tabelle), weil
einer Fachbibliothek mehrere Fachgebiete zugeordnet sein
können
FB | DBIS-Fachgebiete | Erklärung
|
---|
03 | 16 | Wirtschaftswissenschaften
|
05 | FF | Frauen- und Geschlechterforschung
|
07 | 20 | Sportwissenschaft
|
10 | 30 02 | Informatik Mathematik
|
11 | 15 | Rechtswissenschaften
|
12 | 18 17 29 | Soziologie, Politologie, Ethnologie
|
13 | 16 | Wirtschaftswissenschaften
|
14 | 27 26 09 | Archäol., Geschichte, Klass. Philologie, Kunst, Archit.
|
15 | 13 12 11 09 10 51 | Allg. u. Vergl. Sprach- u. Lit.wiss., Angl., German. u. Skandinav., Klass. Philologie, Romanistik, Slawistik
|
16 | 19 21 22 23 25 53 | Philosophie Psychol. Theol. Päd.+Medienw. Musik
|
17 | 01 | Physik
|
18 | 03 | Chemie
|
19 | 05 48 52 | Biologie
|
22 | 06 7 | Geographie Geowissenschaften
|
23 | GE | Gesundheitswissenschaften
|
Implementierte Auswertung
Die Auswertung der ersten Fundstellen nach Fachbibliotheken
ist zu grob. Daher betrachten wir statt dessen die ersten
beiden Stellen der Systemstelle/Signatur. Laut Systematik sind
400 dieser Präfixe an der UB Bielefeld in Verwendung.
- Systemstellen-Anfänge für das Beispiel »beauvoir«:
BJ VG AR IA VG DY BG AR AT VA VG VG BJ VG VG VG VG
- Ergebnis: Empfehlungen für je 5 Top-Datenbanken aus …
- Fachgebiet: Romanistik (8 VG)
- Fachgebiet: Philosophie (1 BG + 2 BJ)
- Sammlung: Frauen- und Geschlechterforschung (2 AR)
Systematik-Exzerpt in Perl
my %systemstelle_fachgebiet_map = (
'AA' => '54', # FB 01 Informationswissenschaft
'AB' => '54', # FB 01 Informationswissenschaft
'AC' => '54', # FB 01 Informationswissenschaft
'AD' => '54', # FB 01 Informationswissenschaft
'AF' => '_AF_', # FB 02 ZIF Allgemein / Fachübergreifend (Sonderfall)
'AR' => 'FF', # FB 05 Frauen- und Geschlechterforschung <--- 2 ×
# ...
'BA' => '21', # FB 16.1 Philosophie
'BB' => '21', # FB 16.1 Philosophie
'BC' => '21', # FB 16.1 Philosophie
'BD' => '21', # FB 16.1 Philosophie
'BE' => '21', # FB 16.1 Philosophie
'BF' => '21', # FB 16.1 Philosophie
'BG' => '21', # FB 16.1 Philosophie <--- 1 ×
'BH' => '21', # FB 16.1 Philosophie
'BI' => '21', # FB 16.1 Philosophie
'BJ' => '21', # FB 16.1 Philosophie <--- 2 ×
# ...
'VA' => '10', # FB 15 - Romanistik
'VB' => '10', # FB 15 - Romanistik
'VC' => '10', # FB 15 - Romanistik
'VD' => '10', # FB 15 - Romanistik
'VE' => '10', # FB 15 - Romanistik
'VF' => '10', # FB 15 - Romanistik
'VG' => '10', # FB 15 - Romanistik <--- 8 ×
# ...
);
2. Einband-Abbildungen
Ziel: Leichteres Finden im Regal, ästhetische Aufwertung
3 ausgewählte Anbieter mit kostenloser Abfrage über ISBN: GBV, OpenLibrary, Amazon
Umsetzung:
- Such das Bild im Zwischenspeicher unseres Servers
- Such das Bild beim GBV
- Such das Bild bei Amazon
Vorteile: freie Lizenz, Datensammlung als Dump
Nachteile: langsame API, Dump-Daten von 2011
- 7.720.648 ISBNs mit Bildern im Dump von OpenLibrary
- 6.677.883 Bilddateien im Dump von OpenLibrary (64 GB)
- 859.453 ISBNs in unserem OPAC
- 351.822 ISBNs sowohl in OpenLibrary als auch im OPAC (Schnittmenge)
Probleme mit Einband-Abbildungen
… sind juristischer Natur.
unproblematisch: freie Lizenzen bei GBV
und OpenLibrary
problematisch:
- Amazon stellt diverse
Bedingungen, z.B. Rückverlinkung.
- VLB stellt diverse
Bedingungen, z.B. Rückverlinkung.
- BookLooker als
unabhängiger antiquarischer Händler hat uns eine
Kooperationsvereinbarung geschickt, die geprüft wird.
- LibraryThing als
aktuellere Alternative zu OpenLibrary: von Nutzern
eingestelle Bilder OK in den USA, aber hier?
Vorschau
3. Rezensionen
Ziel: Einbindung hochwertiger Buchbesprechungen
2 ausgewählte Anbieter mit kostenloser Abfrage über ISBN:
Entwurf einer Einbindung auf dem Entwicklungsserver:
→ Beispiel 1,
→ Beispiel 2
Vielen Dank!
Diese Präsentation basiert auf html5slides, einer freien Vorlage von Google für Präsentationen in HTML5.