Skip to content

Commit 6a0834c

Browse files
committed
Minor changes
1 parent 1e78eb8 commit 6a0834c

16 files changed

+29
-113
lines changed

Makefile

+2
Original file line numberDiff line numberDiff line change
@@ -4,6 +4,8 @@ preview:
44
default:
55
quarto render --to html
66

7+
.PHONY: refs
8+
refs: references.bib
79
references.bib:
810
curl -s 'https://api.zotero.org/groups/5801244/items?format=biblatex&limit=100' > $@
911

README.md

+1-55
Original file line numberDiff line numberDiff line change
@@ -1,58 +1,4 @@
11
# Einführung in die Verarbeitung von PICA-Daten
22

3-
Dieses Handbuch bietet eine Einführung in die Verarbeitung von Daten in, aus und zwischen **PICA-Formaten**.
3+
Das Handbuch in diesem Repository wird mit quarto erstellt.
44

5-
*Jakob Voß (Verbundzentrale des GBV), 2020- ([siehe Änderungshistorie](https://github.com/pro4bib/pica/commits/master)*)
6-
7-
## Vorwort
8-
9-
> During a relatively long period of research, an advanced format was developed for the storage of bibliographic information; the PICA format. — Look Costers (1979)
10-
11-
Das PICA-Format ist seit mehr als 40 Jahren im Einsatz und konnte bisher nicht durch modernere Techniken wie relationale Datenbanksysteme oder Wissensgraphen ersetzt werden. PICA ist einerseits zentral für die Datenhaltung in den meisten Bibliotheken in Deutschland, andererseits wird das Format nicht außerhalb des Bibliothekswesens benutzt. Um sich mit der Verarbeitung von PICA-Daten vertraut zu machen, ist daher Dokumentation notwendig, wozu das vorliegende Handbuch beitragen soll. Schwerpunkt ist die Verarbeitung von PICA-Daten mit frei zugänglichen Werkzeugen.
12-
13-
## Inhalt
14-
15-
- [Grundlagen](grundlagen.md)
16-
- Geschichtlicher Hintergrund
17-
- Arten von Datenformaten
18-
- [PICA-Formate](formate.md)
19-
- Aufbau des PICA-Formats
20-
- Serialisierungen
21-
- Abfragesprache
22-
- Anwendungsprofile und Schemas
23-
- [Darstellung](darstellung.md)
24-
- Anzeige von PICA-Daten mit Syntaxhervorhebung
25-
- Hilfe zu einzelnen PICA-Feldern
26-
- [Verarbeitung](verarbeitung.md)
27-
- Auswertung und Konvertierung von PICA-Daten
28-
- Vergleich vorhandener Werkzeuge
29-
- [Verarbeitung mit picadata](picadata.md)
30-
- [Verarbeitung mit Catmandu](catmandu.md)
31-
- [Verarbeitung mit pica-rs](pica-rs.md)
32-
- [Schnittstellen](schnittstellen.md)
33-
- Zugriff auf PICA-Daten (OPAC, WinIBW, SRU, unAPI...)
34-
- [Bearbeitung](bearbeitung.md) von PICA-Daten
35-
- [Ausblick](ausblick.md)
36-
- Verwandte Formate (MARC, RDF, JSON...)
37-
- Allgemeines und Weiterführendes zur Datenverarbeitung
38-
- [Über dieses Handbuch](CONTRIBUTING.md)
39-
40-
## Screencasts
41-
42-
Als Begleitmaterial gibt es folgende Screencasts:
43-
44-
- *PICA-Formate entschlüsseln mit Avram und PicaEditor* <https://doi.org/10.5446/48737> (2020-09-18, 13:46 Minuten)
45-
46-
## Weiterführende Quellen
47-
48-
- Die Online-Hilfe der [CBS MARC21 database](https://help.oclc.org/Metadata_Services/CBS_MARC_21_database) enthält unter anderem eine Beschreibung der PICA-Felder die für praktisch alle CBS-Installationengleich sind
49-
50-
## Literatur
51-
52-
- Becker et. al (1992): *Das PICA-System. Bericht über die im Auftrag des Niedersächsischen Ministeriums für Wissenschaft und Kunst durchgeführte Funktionsprüfung (Stand Mitte 1990).* In: Bibliothek Forschung und Praxis, Band 16, Heft 3. <https://doi.org/10.1515/bfup.1992.16.3.307>
53-
- Costers (1979): *The PICA Catalogue System.* In: Proceedings of the IATUL Conferences. Paper 26. <https://docs.lib.purdue.edu/iatul/1979/papers/26>
54-
- Eversberg (1999): *Was sind und was sollen Bibliothekarische Datenformate* [urn:nbn:de:gbv:084-1103231323](https://nbn-resolving.org/urn:nbn:de:gbv:084-11032313237)
55-
- Klute (2018): *ETL-Prozesse für bibliothekarische Metadaten: Die Migration lokaler Katalogisate im GBV.* <https://doi.org/10.15771/MA_2018_3>
56-
- Schneiders (1997): *Nederlandse bibliotheekgeschiedenis: van librije tot virtuele bibliotheek*. NBLC Uitg.
57-
- Tennant (2002): *MARC Must Die.* In: Library Journal.
58-
- Voß (2009): *Verarbeitung von PICA+ Daten mit PICA::Record*. <https://www.gbv.de/Verbundzentrale/Publikationen/2009/pdf/pdf_3940.pdf>

SUMMARY.md

-12
This file was deleted.

_quarto.yml

+1-1
Original file line numberDiff line numberDiff line change
@@ -14,11 +14,11 @@ book:
1414
- formate.qmd
1515
- darstellung.qmd
1616
- verarbeitung.qmd
17+
- bearbeitung.qmd
1718
- picadata.qmd
1819
- catmandu.qmd
1920
- pica-rs.qmd
2021
- schnittstellen.qmd
21-
- bearbeitung.qmd
2222
- ausblick.qmd
2323
- CONTRIBUTING.md
2424
- literatur.md

ausblick.qmd

+1-1
Original file line numberDiff line numberDiff line change
@@ -1,4 +1,4 @@
1-
# Ausblick
1+
# Ausblick {#sec-ausblick}
22

33
## Andere Datenformate
44

bearbeitung.qmd

+1-1
Original file line numberDiff line numberDiff line change
@@ -1,4 +1,4 @@
1-
# Ändern von PICA-Daten
1+
# Ändern von PICA-Daten {#sec-aendern}
22

33
Die **Änderung von PICA-Daten** beschränkt sich in der Regel auf Bibliotheken und Verbundzentralen, die gemeinsam PICA-Datenbanken wie den K10plus betreiben. Dazu
44
gibt es folgende, nicht frei zugängliche Werkzeuge:

catmandu.qmd

+2-2
Original file line numberDiff line numberDiff line change
@@ -1,4 +1,4 @@
1-
# Das Werkzeug Catmandu
1+
# Das Werkzeug Catmandu {#sec-catmandu}
22

33
**Catmandu** ist ein digitaler Werkzeugkasten für die Verarbeitung von Metadaten. Im Gegensatz zu ähnlichen ETL-Tools unterstützt Catmandu gängige Datenformate und Schnittstellen von Bibliothekssoftware, darunter auch PICA. Die PICA-Unterstützung in Catmandu basiert auf [picadata] und geht darüber hinaus, vor allem was Möglichkeiten des Zugriffs auf [Schnittstellen](schnittstellen) und der Konvertierung zwischen PICA und anderen Formaten betrifft.
44

@@ -82,7 +82,7 @@ catmandu convert pp to pp --fix 'set_field(titel,"Ein gutes Buch");pica_set(tite
8282
045B/02 $aSpo 1025$aBID 200
8383
~~~
8484

85-
Weitere Beispiele für Fix-Skripte gibt es [im Abschnitt zur PICA-Bearbeitung](bearbeitung).
85+
Weitere Beispiele für Fix-Skripte gibt es in @sec-aendern.
8686

8787
## Schnittstellen
8888

darstellung.qmd

+1-1
Original file line numberDiff line numberDiff line change
@@ -1,4 +1,4 @@
1-
# Darstellung von PICA-Daten
1+
# Anzeigen von PICA-Daten {#sec-anzeigen}
22

33
Der erste Schritte bei jeder Analyse und Verarbeitung von PICA-Daten besteht darin, sich die Daten anzusehen. Dazu ist am besten die [PICA Plain Serialisierung](formate.qmd#serialisierungen) geeingnet. Werkzeuge zur Konvertierung in dieses Format werden [im folgenden Kapitel](verarbeitung) vorgestellt. Zur übersichtlicheren Anzeige von PICA Plain gibt es verschiedene Methoden der [Syntaxhervorhebung](#syntaxhervorhebung).
44

formate.qmd

+1-1
Original file line numberDiff line numberDiff line change
@@ -1,4 +1,4 @@
1-
# PICA-Formate
1+
# PICA-Formate {#sec-pica-format}
22

33
Beim PICA-Format handelt es sich genaugenommen um eine Reihe aufeinander aufbauende Strukturierungsformate, Kodierungen und Anwendungsprofile. Im Zweifelsfall ist in diesem Handbuch das **PICA+** Format gemeint, auf dem alle anderen PICA-Formate aufbauen.
44

grundlagen.qmd

+11-4
Original file line numberDiff line numberDiff line change
@@ -1,19 +1,26 @@
1-
# Grundlagen
1+
# Grundlagen {#sec-grundlagen}
22

3-
Das **PICA-Format** ist das interne Datenbankformat der Katalogsysteme CBS (Zentrale Bibliothekssystem) und LBS (Lokales Bibliotheksystem). Dieses Kapitel gibt eine kurze Einführung in den [Geschichte von PICA](#historisches) von PICA sowie in [Datenformate im Allgemeinen](#datenformate). Auf PICA-Formate im Speziellen wird [im nächsten Kapitel](formate.qmd) eingegangen.
3+
Das **PICA-Format** ist das interne Datenbankformat der Katalogsysteme CBS (Zentrale Bibliothekssystem) und LBS (Lokales Bibliotheksystem). Dieses Kapitel bietet einen kurzen Überblick zur [Geschichte von PICA](#historisches) und zu [PICA-Datenbanken] und erläutert allgemeine [Grundlagen zu Datenformaten](#datenformate). Auf konkrete PICA-Formate wird [im nächsten Kapitel](formate.qmd) eingegangen.
44

55
## Historisches
66

7-
Das PICA-Format geht auf eine 1969 begonnene Kooperation der Königlichen Bibliothek Den Haag und niederländischen Universitätsbibliotheken zur gemeinsamen Computergestützten Katalogisierung zurück (PICA: "Project for Integrated Catalogue Automation"). Die erste zentrale Katalogdatenbank (CBS) wurde 1978 auf einer [PDP 11] in Betrieb genommen. Einen historischen Einblick für Deutschland gibt der [Bericht zum PICA-System], auf dessen Grundlage CBS und LBS in den 1990ern in Deutschland eingeführt wurden. In den 2000er Jahren ging die Entwicklung der PICA-Systeme von der PICA-Stiftung an [OCLC PICA] bzw. OCLC über.
7+
Das PICA-Format geht auf eine 1969 begonnene Kooperation der Königlichen Bibliothek Den Haag und niederländischen Universitätsbibliotheken zur gemeinsamen Computergestützten Katalogisierung zurück (PICA: "Project for Integrated Catalogue Automation"). Die erste zentrale Katalogdatenbank (CBS) wurde 1978 auf einer [PDP 11] in Betrieb genommen. Einen historischen Einblick für Deutschland geben der Bericht zum PICA-System [@becker_pica-system_1992], auf dessen Grundlage CBS und LBS in den 1990ern in Deutschland eingeführt wurden, und für den Einsatz von PICA im GBV die Darstellung von @mittler_reiner_2024. In den 2000er Jahren ging die Entwicklung der PICA-Systeme von der PICA-Stiftung an [OCLC PICA] bzw. OCLC über.
88

99
Das PICA-Format ist an das noch ältere [MARC-Format](http://format.gbv.de/marc) (1966) angelehnt. Viele Eigenheiten beider Formate lassen sich durch die damaligen Anforderungen erklären: erstens musste sehr auf geringen Speicherbedarf und effiziente Verarbeitung geachtet werden, zweitens wurden die Daten nicht wie heute üblich in einem Datenbankmanagementsystem (DBMS) verwaltet sondern direkt verarbeitet und drittens lag der primäre Einsatzzweck dieser Formate nicht in der Erstellung eines elektronischen Retrievalsystems sondern in der Erstellung von Katalogkarten. Aus diesem Grund gibt es schon seit den den frühen 2000ern Stimmen, bibliothekarische Formate wie MARC und PICA durch modernere Alternativen zu ersetzen. Angesichts des Aufwands, bestehende Bibliothekssysteme anpassen oder ersetzen zu müssen, ist ein baldiges Ende jedoch noch nicht abzusehen.
1010

1111
[PDP 11]: https://de.wikipedia.org/wiki/PDP-11
12-
[Bericht zum PICA-System]: https://doi.org/10.1515/bfup.1992.16.3.307
1312
[OCLC PICA]: https://de.wikipedia.org/wiki/OCLC_PICA
1413

1514
![Hardware-Infrastruktur des ersten PICA Systems (1979)](img/pica1979.png){#fig-hardwarepica}
1615

16+
## PICA-Datenbanken
17+
18+
::: {.callout-important appearance="simple"}
19+
Hier fehlt noch eine kurze Erläuterung von Zweck und Aufbau des CSB und LBS: warum gibt es sie? Wie hängen sie zusammen? Was sind Normdaten, Verknüpfungen und Expansion? Klarstellung, dass Suchindex nicht direkt auf PICA-Daten gebildet wird....
20+
:::
21+
22+
Eine umfassende [Einführung zu Bibliotheksmanagementsystemen] gibt es im Handbuch IT in Bibliotheken -@noauthor_handbuch_nodate.
23+
1724
## Datenformate
1825

1926
Das PICA-Format ist ein Datenformat, doch was ist überhaupt ein Datenformat? Ein Datenformat ist eine Konvention zur Strukturierung digitaler Objekte (Datensätze). So legen beispielsweise CSV-Formate die Struktur einer Tabelle aus Zeilen und Spalten fest. Letzendlich dienen alle Datenformate dazu, Daten in Bestandteile zu zerlegen, denen Bedeutung zugewiesen werden kann. Bei CSV besteht die Bedeutung von einzelnen Datenelementen beispielsweise aus "Zeile", "Spalte", "Trennzeichen" und "Zelle". Datenformat deren Elemente solche eher abstrakten Bedeutungen haben, werden auch [Strukturierungsformate] genannt. Davon zu unterscheiden sind [Anwendungsformate], [Kodierungen] und [Datenmodelle]. Eine besondere Rolle bei der Festlegung von Datenformaten spielen [Standards und Profile] sowie [Abfrage- und Schemaformate].

index.md

-16
Original file line numberDiff line numberDiff line change
@@ -1,23 +1,7 @@
11
---
22
title: "Einleitung"
33
---
4-
# Einleitung
54

65
> During a relatively long period of research, an advanced format was developed for the storage of bibliographic information; the PICA format. — Look Costers -@costers_pica_1979
76
87
Das PICA-Format ist seit mehr als 40 Jahren im Einsatz und konnte bisher nicht durch modernere Techniken wie relationale Datenbanksysteme oder Wissensgraphen ersetzt werden. PICA ist einerseits zentral für die Datenhaltung in den meisten Bibliotheken in Deutschland, andererseits wird das Format nicht außerhalb des Bibliothekswesens benutzt. Um sich mit der Verarbeitung von PICA-Daten vertraut zu machen, ist daher Dokumentation notwendig, wozu das vorliegende Handbuch beitragen soll. Schwerpunkt ist die Verarbeitung von PICA-Daten mit frei zugänglichen Werkzeugen.
9-
10-
## Screencasts
11-
12-
Als Begleitmaterial gibt es folgende Screencasts:
13-
14-
- *PICA-Formate entschlüsseln mit Avram und PicaEditor* <https://doi.org/10.5446/48737> (2020-09-18, 13:46 Minuten)
15-
16-
## Weiterführende Quellen
17-
18-
- Die Online-Hilfe der [CBS MARC21 database](https://help.oclc.org/Metadata_Services/CBS_MARC_21_database) enthält unter anderem eine Beschreibung der PICA-Felder die für praktisch alle CBS-Installationengleich sind
19-
20-
<!-- TODO
21-
- Eversberg: https://nbn-resolving.org/urn:nbn:de:gbv:084-11032313237
22-
- Tennant (2002): *MARC Must Die.* In: Library Journal.
23-
-->

pica-rs.qmd

+1-1
Original file line numberDiff line numberDiff line change
@@ -1,4 +1,4 @@
1-
# Das Werkzeug pica-rs
1+
# Das Werkzeug pica-rs {#sec-pica-rs}
22

33
pica-rs ist wie [picadata](picadata.qmd) ein Kommandozeilenwerkzeug zur Auswertung von PICA-Daten.
44

picadata.qmd

+1-1
Original file line numberDiff line numberDiff line change
@@ -1,4 +1,4 @@
1-
# Das Werkzeug picadata
1+
# Das Werkzeug picadata {#sec-picadata}
22

33
Das Kommandozeilenprogramm `picadata` ermöglicht die Konvertierung zwischen verschiedenen [PICA-Serialisierungen](formate.qmd#serialisierungen), einfache Analyse und Auswertung von PICA-Daten sowie die [Validierung gegen Avram-Schemas](formate.qmd#avram-schemas).
44

references.bib

+4-15
Original file line numberDiff line numberDiff line change
@@ -1,19 +1,8 @@
11

2-
@article{bauknecht_handbuch_2023,
3-
title = {Handbuch {IT} in Bibliotheken. Unter einer {CC}-{BY} 3.0 {DE}-Lizenz im Internet unter https://it-in-bibliotheken.de (mit Datum der letzten Änderung: 17. Mai 2023).},
4-
volume = {47},
5-
rights = {http://creativecommons.org/licenses/by/4.0},
6-
issn = {1865-7648, 0341-4183},
7-
url = {https://www.degruyter.com/document/doi/10.1515/bfp-2023-0063/html},
8-
doi = {10.1515/bfp-2023-0063},
9-
shorttitle = {Handbuch {IT} in Bibliotheken. Unter einer {CC}-{BY} 3.0 {DE}-Lizenz im Internet unter https},
10-
pages = {542--546},
11-
number = {3},
12-
journaltitle = {Bibliothek Forschung und Praxis},
13-
author = {Bauknecht, Cornelius and Erndt, Michael},
14-
urldate = {2024-12-17},
15-
date = {2023-11-28},
16-
langid = {english},
2+
@book{noauthor_handbuch_nodate,
3+
title = {Handbuch {IT} in Bibliotheken},
4+
rights = {{CC}-{BY}-4.0},
5+
url = {https://it-in-bibliotheken.de/},
176
}
187

198
@article{mittler_reiner_2024,

schnittstellen.qmd

+1-1
Original file line numberDiff line numberDiff line change
@@ -1,4 +1,4 @@
1-
# Schnittstellen
1+
# Schnittstellen {#sec-apis}
22

33
Für den lesenden Zugriff auf PICA-Daten gibt es [unAPI](#unapi) für einzelne Datensätze und [SRU](#sru) zur Abfrage von Suchergebnissen. Darüber hinaus können PICA-Daten manuell über die [OPAC-Oberfläche](#opac) und mit [WinIBW](#winibw) heruntergeladen werden. Über die [Avram-API](#avram-api) können Informationen zu Anwendungsprofilen abgerufen werden.
44

verarbeitung.qmd

+1-1
Original file line numberDiff line numberDiff line change
@@ -1,4 +1,4 @@
1-
# Verarbeitung von PICA-Daten
1+
# Verarbeiten von PICA-Daten {#sec-verarbeiten}
22

33
Dieses Kapitel gibt eine allgemeine Übersicht von frei zugänglichen Werkzeugen zur Verarbeitung von PICA-Daten. Auf folgende Werkzeuge wird ausführlicher eingegangen:
44

0 commit comments

Comments
 (0)