UB Basel. EDV Netzwerk
Andres von Arx,  3. Mai 2000

 

IT-Konzept für Online-Sonderkataloge

Inhalt


Verbundkatalog und Sonderkataloge

Für besondere Bedürfnisse der Bestandserschliessung genügt der Online-Verbundkatalog in seiner gewohnten Form nicht. Gewünscht wird (1) ein besonderer Einstiegspunkt zu Sonderbeständen, meist eine speziellen Webseite ausserhalb des Online-Verbundkatalogs. Gewünscht wird aber auch (2) eine besondere Präsentation der Einzeltitel auf separaten Webseiten, sowie (3) eine Datenhaltung ausserhalb des Verbundkatalogs. Die Spezialbestände selbst definieren sich dabei nach den unterschiedlichsten Kriterien (inhaltlich, formal); sie können abgeschlossen oder wachsend sein.

Im Rahmen der Feinerschliessungsprojekte der UB Basel 2000 sind die Wünsche nach Online-Sonderkatalogen explodiert. Darin liegt eine gewisse Gefahr.

Unbestrittenermassen sinnvoll ist es, für Sonderbestände einen eigenen Einstiegspunkt einzurichten, der den Bestand genauer beschreibt und Hinweise zu dessen Benutzung gibt.

Bei der Präsentation der Daten ist zu überlegen, ob wirklich jeder Sonderbestand eine separate Benutzeroberfläche ausserhalb des Bibliothekssystems braucht. Dafür kann es durchaus gute Gründe geben. Es gibt aber auch gewichtige Gründe dagegen:

Noch problematischer ist die Datenhaltung ausserhalb des Verbundkatalogs, sofern es um bibliographische Daten geht. Jede dezentrale Datenhaltung birgt die Gefahr von Inkonsistenzen und Datenleichen, erhöht den Aufwand der Datenpflege und bildet eine Hypothek auf die Zukunft (Konversion auf neue Plattformen).

Mehrere Feinerschliessungsprojekte gehen etwas leichtfertig davon aus, dass man externe bibliographische Daten irgendwie in Aleph "importieren" kann. Dazu ist anzumerken:

Fazit: Eine Katalogkonversion ist etwas, dass man macht, wenn man keine andere Wahl hat. Wenn man Daten neu zu erfassen beginnt, und man weiss, das die Daten früher oder später auch im Bibliothekssystem erscheinen sollen, dann sollte man von Beginn weg die Daten im Bibliothekssystem erfassen. Alles andere wäre eine Verschleuderung von Ressourcen.

Das folgende IT-Konzept für Online-Sonderkataloge geht deshalt von folgenden Thesen aus:
  1. Was im Verbundkatalog erfasst werden kann, soll im Verbundkatalog erfasst werden.
  2. Was im Verbundkatalog dargestellt werden kann, soll im Verbundkatalog dargestellt werden.
  3. Für alles andere soll möglichst mit standardisierten Arbeitsabläufen gearbeitet werden.

Dabei zeigt sich bald einmal:

  1. Es lässt sich einiges mehr im Verbundkatalog erfassen als man glaubt.
  2. Es lässt sich einiges mehr im Verbundkatalog darstellen als man glaubt.
  3. Es lässt sich einiges mehr standardisieren als man glaubt.
     

Modelle von Sonderkatalogen

Modell 1: Datenhaltung und Präsentation im Verbundkatalog

Modell 1.0: Sonderkatalog als separate Aleph Datenbank

Prinzip Ein Sonderbestand, dessen Format zu stark von USMARC / KIDS abweicht, kann als separate Datenbank im Bibliothekssystem geführt werden. Die Oberfläche des Bibliothekskatalogs kann auf den Sonderbestand angepasst werden (Suchfunktionen, Indices)
Vorteil Aleph-Benutzeroberfläche
Nachteil Hoher Aufwand für Einrichtung und Wartung von Datenbank und Suchoberfläche
Beispiel Nachlässe UB Basel
Denkbar für ???

 

Modell 1.1: Sonderkatalog als Aleph Search Library

Prinzip Im Aleph-Katalog wird ein Teilbestand einer bibliographischen Datenbank als virtuelle "Search Library" definiert. Alle Funktionen des Verbundkatalogs stehen zur Verfügung, laufen aber nur auf diesem Teilbestand.
Vorteil Aleph-Benutzeroberfläche; kein Wartungsaufwand
Nachteil Wenn eine Teilmenge des Verbundkatalogs aufgesetzt wird: Hohe Systembelastung und lange Startup-Zeiten; Indexsuche unbrauchbar für kleine und mittlere Datenmengen. Nicht alle angebotenen Suchmöglichkeiten von Aleph sind auf den Sonderbestand anwendbar; eine Anpassung der Webseiten kommt aus Aufwandgründen aber nur in ganz wenigen Ausnahmen in Frage
Beispiel Teilkataloge Basel und Bern (Teilmenge Verbundkatalog)
Denkbar für Nachlass Meier (Teilmenge Nachlässe UB)

 

Modell 1.2 : Sonderkatalog als Aleph Hitset (vorformulierte Suchbefehle)

Prinzip Aus einer beliebigen Webseite heraus wird Aleph aufgerufen, und zwar direkt mit einer Suchanfrage. Die Suchanfrage kann ganz oder teilweise versteckt sein, um auch sehr komplexe CCL-Befehle vor dem Benutzer zu verbergen.
Vorteil Aleph-Benutzeroberfläche; minimer Wartungsaufwand
Nachteil Sortierung nur für Treffermengen = 500 Titel möglich
Beispiele Neuerwerbungslisten:
http://www.ub.unibas.ch/lib/ba/
http://www.ub.unibas.ch/nel/

Online-Zugriff auf Basler Bibliographie
http://www.ub.unibas.ch/spez/baselbib.htm

Denkbar für Zeitungskatalog Basel (Liste A-Z und - modifizierte - Länderlisten)
Zeitschriftenkataloge mit < 500 Titeln
Online-Datenbanken (A-Z)

 

Modell 1.3: Sonderkatalog als Spezielles Suchformular in Aleph

Prinzip Für Sonderbestände können massgeschneiderte Suchformulare in Aleph erstellt werden, die implizit die Suche auf diesen Teilbestand eingrenzen und/oder die Suche auf vorformulierte Kriterien (mit Pulldown-Menu) einschränken. Der Aleph-Katalog kann auch direkt mit dieser Suchmaske gestartet werden (Link auf einer externen Webseite).
Vorteil Aleph-Benutzeroberfläche; mittlerer Wartungsaufwand
Nachteil Implementierung im Aleph-Webopac ist nicht Aleph-Standard
Beispiele StUB-Freihandbibliothek CD-Musik
http://aleph.unibas.ch:4505/ALEPH/-/start-ext/ids+basel+bern?file/find-c-400fc
Denkbar für ?

 


Modell 2:  Datenhaltung und Präsentation im Verbundkatalog, mit integrierten Links auf extern gehaltene Daten

Prinzip Dieses Modell kann mit jeder Variante von Modell 1 kombiniert werden. Hier  enthalten die bibliographische Records zusätzlich einen oder mehrere Links auf externe Daten, die sich nicht im bibliographischen Format unterbringen lassen (Volltext, Bilder usw.). Versuche zeigen, dass die Links nicht nur in den bibliographischen Datensätzen untergebracht werden können (BIB), sondern - bibliotheksspezifisch - auch in Holdings-Datensätzen (HOL).

Benutzt wird das USMARC Feld 856. Die gegenwärtige Implementierung von 856 in Aleph 505.12 öffnet den Link im rechten Frame des Katalogs; dies sollte in den Anzeigeprogrammen korrigiert werden (Anzeige in separatem Fenster).

Eine weitergehende Möglichkeit, die nicht dem klassischen USMARC entspricht, könnte mit einer relativ bescheidenen Erweiterung des Erfassungsformats und der Anzeigeprogramme zu einem radikal anderen Erscheinungsbild des Katalogs führen, z.B. durch die Integration von Thumbnails. Dies ist bereits im jetzigen Aleph 505.12 möglich - allerdings unter Verletzung der Formatvorschriften und unter Ausnützen eines Features von Aleph, das wohl eher ein Bug ist (siehe Beispiel unten).

Vorteil Aleph-Benutzeroberfläche; standardisierte Datenerfassung;
Nachteil Aufwand für periodische Wartung der korrekten Links.
Beispiele  
Denkbar für Porträtsammlung

sonderkataloge2000-3.gif (31265 Byte)

Kodierung der obigen Aufnahme (DST01 / SysNo 0120848):

KIDS-konform:

856 u http://www.ub.unibas.ch/spez/pic/jacburck.gif

    z Portrait von Jacob Burckhardt (Standard)
Nicht KIDS-konform:

856 u "http://www.ub.unibas.ch/spez/pic/jacburck.gif" target=newwin>

      <img src=http://www.ub.unibas.ch/spez/pic/jacburck.gif height=110

      width=92 align=left border=0

    z Portrait von Jacob Burckhardt</a><br><em>(&ouml;ffnet ein neues 

      Fenster)</em><a>

856 u "http://www.ub.unibas.ch/spez/pic/jacburck.gif" target=newwin

    z Portrait von Jacob Burckhardt (neues Fenster)

 


Modell 3:  Sonderkatalog mit Datenhaltung im Verbundkatalog und Präsentation ausserhalb des Verbundkatalogs

sonderkataloge2000-1.gif (5713 Byte)

Prinzip Arbeitsablauf:
  1. Bibliographische Daten werden aus dem Bibliothekskatalog selektioniert, sortiert, formatiert, und in eine Extraktionsdatei ausgegeben.
  2. Ein Editionsprogramm produziert daraus HTML-Seiten als Endprodukt.
  3. Templates enthalten den fixen Teil der HTML-Seiten und Platzhalter für die Daten. Die Platzhalter werden beim Edieren durch die aufbereiteten Daten ersetzt. Templates dienen dazu, die Gestaltung und die Programmierung möglichst zu trennen. Bequemerweise kann oft die resultierende HTML-Seite selbst als Template dienen.
  4. Die produzierten HTML-Seiten können wiederum einen Link vom Einzeltitel zum Verbundkatalog erhalten (Bestandesübersicht, Bestellmöglichkeit usw.).

Alle oder einzelne Schritte dieses Arbeitsablaufs können automatisiert werden.

Vorteil Standardisierte Datenerfassung
Nachteil Hoher Programmierungsaufwand
Beispiele  
Denkbar für Zeitschriftenkataloge mit über 500 Titeln
Alphabetische Liste EJournals

 


Modell 4:  Sonderkatalog mit Datenhaltung im Verbundkatalog, zusätzlicher externer Datenhaltung  und Präsentation ausserhalb des Verbundkatalogs

sonderkataloge2000-2.gif (6481 Byte)

Prinzip Arbeitsablauf:
  1. Bibliographische Daten werden aus dem Bibliothekskatalog selektioniert, sortiert, formatiert, und in eine Extraktionsdatei ausgegeben.
  2. Zusatzdaten (Bild, Text...) werden in einer separaten Datenbank gehalten. Das kann auch eine einfache Text- oder HTML-Datei sein.
  3. Ein Editionsprogramm verknüpft beide Datenquellen und produziert daraus HTML-Seiten als Endprodukt. Dazu muss ein logischer Link zwischen Extraktionsdaten und Zusatzdaten bestehen (1:1, 1:n oder n:1 Beziehung).
  4. Templates enthalten den fixen Teil der HTML-Seiten und Platzhalter für den variablen Teil. Die Platzhalter werden beim Edieren durch die aufbereiteten Daten ersetzt werden. (Templates können auch fehlen; oder bequemerweise kann die Resultatdatei als Template dienen.)
  5. Die HTML-Seiten enthalten, wo sinnvoll, ihrerseits einen Link auf die entsprechende Titelaufnahme des Bibliothekssystems

Alle oder einzelne Schritte dieses Arbeitsablaufs können automatisiert werden.

Vorteil Massgeschneiderte Präsentation
Nachteil Relativ hoher Programmierungsaufwand, Problem der Datenhaltung, Synchronisierung zweier Datenquellen
Beispiele Basler Literarisches Archiv
Basler Zeitungenkatalog
Denkbar für Basler Literarisches Archiv
Zeitschriftenkataloge mit über 500 Titeln
Alphabetische Liste EJournals

 


Modell 5:  Datenhaltung und Präsentation ausserhalb des Verbundkatalogs

sonderkataloge2000-4.gif (2565 Byte)

Prinzip Wie Modell 4, aber hier werden die Daten vollständig ausserhalb von Aleph gehalten.
Vorteil Völlige unabhängigkeit von Formatregeln
Nachteil Relativ hoher Programmierungsaufwand, Problem der Datenhaltung
Beispiele EJournals
Online-Datenbanken
Denkbar für nicht empfohlen!

 


Möglichkeiten der Standardisierung

Die Spezialkataloge die bis jetzt produziert worden sind (Online und gedruckt), sind prkatisch auf allen Stufen mit individuellen Techniken erstellt worden. Aus ökonomischen Gründen muss eine Standardisierung der Verfahren angestrebt werden.

Stufe Datenhaltung:

BIB-Katalog: Standardisierung durch KIDS gegeben. Dabei soll alle Information, die (1) sich auf eine bibliographische Einheit bezieht und (2) sich in KIDS unterbringen lässt, auch in Aleph gehalten werden.

Zusatzdaten sind sehr heterogen; ebenso ist der logische Link zwischen Bibliographischen Daten und Zusatzdaten sehr unterschiedlich. Individuelle Lösung pro Endprodukt haben bis jetzt die Erfassung möglichst einfach gemacht. Eine Standardisierung bietet eine Garantie für die Langlebigkeit der Daten; andererseits kompliziert sie die Erfassung und ist aufwendig zu implementieren.

Als erster Schritt muss eine (1) Inventarisierung der Daten erfolgen, die in absehbarer Zeit in elektronischer Form gehalten werden sollen, v.a. mit einer Schätzung des Datenvolumens (wachsend, abgeschlossen?). Es müssen (2) Standards der Dateiformate definiert werden (z.B. PDF, JPG); und es muss (3) eine Namenskonvention für diese Dateien bzw. URLs erarbeitet werden.

Nach einer genauen Inventarisierung ist zu entscheiden, ob sich diese Daten weiterhin mit ad-hoc-Methoden verwalten lassen, oder ob dazu spezialisierte Content-Management-Software eingesetzt werden soll.

Geschätzter Aufwand für Inventarisierung, Festlegung Dateiformate, Namenskonversion: 1-2 Wochen.

Geschätzter Aufwand für die Evaluation und Einführung eines universellen Content-Management-Systems für UB (inkl. SWA): ein halbes Personenjahr.

 

Stufe Extraktion:

Die Selektion: geschieht nach unterschiedlichsten Kriterien (Hitsets auf indexierte Felder, SQL-Suchstatements) und muss für jedes Produkt separat eingerichtet werden.

Die Möglichkeiten der Sortierung in Aleph muss noch geklärt werden; anderfalls sind Sortierroutinen ausserhalb von Aleph zu entwickeln.

Die Definition von Exportformaten in Aleph ist sehr schwerfällig und aufwändig. Deshalb sollte man hier versuchen, mit möglichst wenigen Exportformaten auszukommen. Die Editionsprogramme können nicht benötigte Information dann eliminieren.

Geschätzter Aufwand für die Implementierung von standardisierten Exportformaten:
??????

 

Stufe Edition:

Bei der Aufbereitung einer Exportdatei aus dem Verbundkatalog (Modell 3) ist eine Standardisierung der Editionsprogramme denkbar; parametrisierbar sein müssten: Eingangsdatei / Ausgangsdatei / Sortierung ja oder nein / Ausgabeformat (nur Titel, Kurzaufnahme mit/ohne Signatur) / Link zu Aleph / Unterteilungsliste mit Link zu einzelnen Buchstaben ja/nein. Aufwendiger, aber ebenfalls denkbar,  wäre eine Standardisierung für Editionsprogramme mit gemischter oder externer Datenhaltung (Modell 4 und 5).

Trotzdem wird es für verschiedene Bedürfnisse separate Lösungen geben müssen. Das Programmiertool erster Wahl (Perl) erlaubt aber eine starke Modularisierung und Wiederverwendung von Code Libraries für einzelne Teilschritte der Edition.

Als Regel sollte die Trennung von Darstellung und Programmablauf gelten, z.B. durch Verwendung von Templates. Webgestaltung und Programmierung werden dadurch voneinander unabhängig .

Geschätzter Aufwand für die Implementierung eines universellen Aufbereitungstools:
1 Personenmonat

 


Bestandesaufnahme aktueller Produkte

1. Basler Literarisches Archiv

Bisherige Endprodukte:

Bisherige Datenquellen:

Bisherige Aktualisierung: wer? wann?

Vorschläge zur künftigen Behandlung

  1. Weiterhin behandeln nach Modell 4
  2. Abklären, wer künfigt die Zusatzdaten pflegt (Vorschlag: durch E. Oeggerli)
  3. Abklären der Selektion (im Webopac kein Hitset mit BLA? möglich!)
  4. Lokale Datenquelle: vorläufig weiterhin als HTML-Datei pflegen
  5. Editionsprogramme: Link auf Aleph-Katalog einbauen (Abfrage auf Heading Autor; zeigt auch Titel der Autorin ausserhalb des BLA an)
Geschätzter Aufwand:
- Bedürfnisabklärung: 1 Tag (oe)
- Pflege der externen Daten: ??? (N.N:)
- Selektion: ???? Tage (mus)
- Edition 2 Tage (ava)

2. Zeitungen im Raum Basel

Bisherige Endprodukte:

Bisherige Datenquelle:

Bisherige Aktualisierung: wer? wann?

Vorschläge zur künftigen Behandlung

  1. Wechsel vom Modell 5 zum Modell 1.2: Erfassung der Daten ausschliesslich in Aleph.
  2. Folgende Informationen fehlen derzeit noch in den Katalogaufnahme: Unterteilung Schweiz in "Region Basel", "(übrige) Schweiz", historische und laufende Ztg. Diese Information könnte z.B. als Zusatz zum Code "ztgbs" in 909A versorgt werden, z.B. "ztgbs. bs", "ztgbs bs alt", "ztgbs ch", "ztgbs ch alt".
    Zu überlegen wäre, ob ein spezieller Code für Zeitungen mit elektronischer Ausgabe (Feld 856) gesetzt werden soll.
  3. Die alphabetische Titelliste kann vollständig durch eine Aleph-Abfrage nach Modell 1.2 ersetzt werden:
    http://aleph.unibas.ch:4505/ALEPH/-/start-ext/ids+basel+bern?find-c?CCL-TERM=wlc=ztgbs
  4. Das Bedürfnis nach einer Länderliste sollte abgeklärt werden (Vorschlag: durch Verbundabteilung, F. Winter).
    Leider sind Ländercodes in Feld 008 nicht indexiert; es wäre also nur eine Unterteilung nach Basel / Schweiz / Ausland,  laufend / historisch und allenfalls nach Sprache möglich. Falls der Code in 909A entsprechend gesetzt würde, wäre auch eine Online-Abfrage nach Ländern möglich, oder - das dürfte attraktiv sein - nach Zeitungen mit einer Web-Ausgabe.
Geschätzter Aufwand:
- Bedürfnisabklärung: 1 Tag (fw)
- Bereinigung der Aleph-Daten: 1 Woche (Verbund)
- Anpassung der Anzeige: 1 Tag (ava)

Anmerkung zu geplanten Produkten

Die verschiedenen geplanten Online-Sonderkataloge bedürfen m.E. einer erneute Analyse, welche die Möglichkeit der Datenhaltung und -präsentation im Verbundkatalog nach Modell 1 und 2 ernsthaft prüft.