Datensätze direkt einspielen – VuFind / Solr

Heute hatte ich endlich die Zeit und die Muße mich um ein besonderes Problem zu kümmern. Der Import von Daten im XML-Format gestaltete sich für mich bisher als etwas mühsam. Jeder Datensatz musste in einer eigenen Datei vorliegen. Bei dem eingebauten Importskript von VuFind wurde dann jede einzelne Datei eingespielt. Bei 50.000 Datensätzen handelt es sich um 50.000 einzelne XML-Dateien. Das war müßig.

Mit der Hilfe von Oliver Goldschmidt aus Hamburg habe ich jetzt endlich den Trick raus, wie ich die Daten aus einer einzelnen Datei einlesen kann, in der alle einzelnen Datensätze gespeichert sind.

Die Datensätze, die innerhalb einer XML-Datei gespeichert sind, können wie folgt in das System eingespielt werden:

/usr/bin/curl -d @result.xml 
http://localhost:4040/solr/biblio/update -H 
"Content-Type:text/xml; charset: UTF-8"

Die Daten müssen natürlich die richtige Form haben und die schema.xml Datei von SOLR muss entsprechend angepasst sein.

Vielen Dank an dieser Stelle nach Hamburg.

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s