VuFind trifft GReTA – genderbibliothek.de

Noch ist nicht alles perfekt aber schon vieles sehr ordentlich. Unter

kann der zukünftige Katalog der Genderbibliothek (GReTA) bereits eingesehen werden. Spätestens zum Start des neuen Wintersemesters 2014/15 ist er hoffentlich offiziell vorgestellt.

 

Advertisements

XSLT – XML Dateien in die richtige Form bringen

Bei meiner Arbeit im META Projekt (und zuvor für meine Magisterarbeit) habe ich viel mit XSLT zu tun. Zur Info – Wikipedia sagt: XSLT, das ist eine Programmiersprache zur „Transformation von XML-Dokumenten„.

Das XSLT-Skript, welches die XML-Daten der Genderbibliothek umwandelt, umfasst nach heutigem Stand knapp 2000 Zeilen. Im Skript werden alle Objektarten homogenisiert (z.B. Buch, Hochschulschriften, Videos etc.) und mit zusätzlichen Informationen (z.B. Sprachcodes, Projektmarkierungen) angereichert.

Die Umwandlung der Rohdaten für VuFind erfolgt in zwei Schritten:

  1. Die Rohdaten werden in ein Zwischenformat umgewandelt, das wir liebevoll als Arbeitsxml bezeichnen (ein Preis für die Namensgebung wird es wahrscheinlich nicht geben)
  2. Die Arbeitsxml wird in das SOLR spezifische XML umgewandelt.

Letztlich sind das dieselben Schritte, die auch größere Player, wie die DDB, bei ihrer Datentransformation leisten muss – nur in einem kleinerem Maßstab.

Ziel dieser Arbeit ist es die Daten so aufzubereiten (Homogenisieren & Anreichern), dass sie in beliebig viele Formate umgewandelt werden kann. Denkbar sind Formate wie Marcxml, MODS oder EAD. An erster Stelle steht für das META Projekt und die Genderbibliothek allerdings die Integration der Daten in VuFind.

Achso – was kleinerer Maßstab heißt? Die Umwandlung der gesamten Datensätze dauert 111 Minuten und die Dateigröße schwillt von ca. 50 MB (ca. 58000 Datensätze) auf das Dreifache, ca. 150 MB, an.

… wenn ich das so schreibe, klingt es gar nicht mehr so viel. So oder so es steckt eine Menge Arbeit drin.

Zu sehen ist ein Bildschirmfoto eines XSLT Skriptes

Auszug aus dem XSLT-Skript für die Genderbibliothek

Hierarchische Darstellung in VuFind – ein Beispiel

Die Arbeiten an der neuen GReTA (VuFind) schreiten stetig voran.

Heute im Fokus: hierarchische Darstellung in VuFind an einem ausgewählten Beispiel.

Die Darstellung von Hierarchien in VuFind ist recht einfach. Die Datensätze müssen alle notwendigen Informationen enthalten und die Hierarchiefunktion in der Konfigurationsdatei (config.ini) muss auskommentiert sein. Soweit so gut.

Die eigentliche Herausforderung ist aber nicht die technische Realisierung sondern das Konzept hinter den Datensätzen. Was soll wie abgebildet und warum?

Letztlich ist das Ziel dieser Funktion, dass Nutzer_innen auf  Kontexte/Bezüge ihrer Suchergebnisse aufmerksam gemacht werden. Kurz gesagt: Die Nutzer_innen sollen nicht finden, sondern entdecken. Discovery Interface und so!

Ganz praktisch kann das dann so aussehen:

  1. Einzeltitel aus Sammelbänden oder Zeitschriften werden so angezeigt, dass weitere Einzeltitel auf einen Blick sichtbar werden (Screenshot 1 & 2)
  2. Ein Sammelband, der an einer bestimmten Stelle in der Aufstellungssystematik (ganz konkret im Regal) steht, steht dort nicht allein. Werke die ebenfalls in diesen Systematikpunkt eingeordnet wurden, können ebenfalls über die Darstellung ausgeben werden (Screenshot 3)

Diese Funktion gab es schon im alten GenderVu Katalog (vormals: Stöbern im Buchregal), wurde aber grundlegend überarbeitet.

Screenshot 1 – ein Sammelband bei dem die Einzeltitel sowie die übergeordnete Aufstellungssystematik angegeben ist.

Auswahl_003.png

Screenshot 2 – ein Artikel aus dem oben genannten Sammelband. Der Kontext wird weiterhin angezeigt.

Auswahl_006Screenshot 3 – ein Punkt der Aufstellungsystematik. Dokumente, die dieser Systematik zugeordnet sind, werden in der Hierarchie dargestellt

Auswahl_007

 

Tagcloud in VuFind

Im META Projekt arbeite ich gerade an der Weiterentwicklung des alten GenderVu Kataloges der Genderbibliothek. Es wird also für die Studierenden der Gender Studies in Berlin sowie allen Interessierten in absehbarer Zeit eine bessere, auf  VuFind 2.x  basierende, „GReTA“ geben. Es handelt sich aber nicht nur um eine Weiterentwicklung sondern vielmehr um einen Prototypen, bei dem verschiedene zusätzliche Funktionen eingebaut sind, die dann ebenfalls im META Projekt eingesetzt werden sollen.

Realisiert werden die einzelnen Projekte durch die Anpassung der drei entscheidenden Komponenten:

  • Datenlage
  • Technische Implementierung
  • Gestaltung
Heute will ich kurz einen Blick auf die Tagcloud (Schlagwortwolke) geben.
Screenshot einer ersten Version sder Tagcloud in VuFind

Screenshot einer ersten Version sder Tagcloud in VuFind

Re: #bibtag14 – Power in allen Größenordnungen

Ein interessanter Beitrag zum Bibliothekstag 2014. Gut zu lesen, sehr informativ und mit viel Persönlichkeit. Wichtig für mich: Dr. Karin Aleksander aus der Genderbibliothek findet mit ihrem Beitrag Erwähnung. Ein schöner Einblick. Vielen Dank.

„Die nächste mich beeindruckende Vortragende war am Do., den 05.06. zu hören. Dr. Karin Aleksander von der eher im Verborgenen blühendenGenderbibliothek der Humboldt-Universität zu Berlin. Und auch hier waren es vor allem die Inhalte, die überzeugten.“ weiterlesen

Coming soon: Meine Magisterarbeit geht in den Produktivbetrieb

vufind-logoMit meiner Magisterarbeit fing alles an. Der neue, als „GenderVu“ bekannte Onlinekatalog, ergänzte den älteren Onlinekatalogdienst, bekannt unter dem Namen „GReTA„. GenderVu lief bisher als Beta-Version und konnte GReTA aber bisher nicht endgültig ablösen. Ein Makel, wie ich finde.

Technik neu – Name bleibt.

Der alte GReTA Onlinekatalog, basierend auf dem FAUST iServer, und GenderVu, basierend auf VuFind 1.2, werden in nächster Zeit abgeschaltet. Der neue Katalog wird wieder GReTA heißen und auf VuFind 2.x basieren. Best of both worlds sozusagen.
Auch der neue GReTA/VuFind 2.x Katalog ist zu großen Teilen auf meinem Mist gewachsen – allerdings konsequent weiterentwickelt und mit einigen neuen Features, die es so bisher noch nicht gab. Auch von technischer Seite gibt es ebenfalls die passende Unterstützung.
In der nächsten Zeit werde ich an dieser Stelle über dieses Projekt berichten und die neuen Features vorstellen. Entstanden ist es aus einer Zusammenarbeit der ZtG und des META Projektes des i.d.a.-Dachverbandes. Alter und aktueller Arbeitgeber in einem Projekt!
Bis später.

GenderVu mit neuem Server

Ich hatte jetzt schon eine ganze Weile keine Zeit mehr hier etwas über GenderVu zu schreiben. Das will ich kurz und knapp nachholen.

Die Weiterentwicklungen an GenderVu (Der Beta-Katalog der Genderbibliothek) liegen erst mal auf Eis. Derzeitig arbeite ich an der dazugehörigen Magisterarbeit und da habe ich zum Einen keine Zeit und zum Anderen will ich nicht schon wieder an den Dingen schrauben, die dann ja in der Arbeit stehen. Einen Serverumzug musste ich trotzdem machen, weil der alte Rechner auf dem GenderVu von September 2011 bis März 2012 lief eigentlich gar nicht dafür geeignet war. Das Headerbild konnte ich leider noch nicht überspielen 😦
Die neue URL lautet: gendervu.linuxd.org
Auf dem neuen Server laufen zwei Instanzen von VuFind. Zum Einen der bereits erwähnte GenderVu Katalog, zum Anderen eine Testinstanz (genderbibcat.linuxd.org), die Marcxml-Datensätzen bespielt wurde. Der Vorteil an diesem Vorgehen ist, dass der OAI-Server von VuFind so auch genutzt werden kann.
Die Erstellung der Marcxml-Daten aus der FAUST Datenbank kostet eine Menge Gehirnschmalz und nimmt den Umweg über das Metadatenformat MODS. Es sind viele Modifikationen notwendig gewesen um die Daten in das richtige Format zu bringen. Das liegt auch am Datenbestand der Genderbibliothek, der für den Export nach Marcxml einfach noch nicht ausgelegt ist.
Mit Hilfe von XSLT war es aber trotzdem möglich die Daten so zu erstellen, dass Formal erst einmal keine Fehler mehr zu beanstanden waren. Inhaltlich gibt es noch eine Menge zu tun.
Soweit!