Konverzija podataka
Pravila za konverziju: Revision 24

Natrag na naslovnicu


Komentari uz pojedina MARC21 polja

  • zapis se konvertira se ako postoji polje 200^a

LEADER

  • LDR 05 - c ili d - iz 999a ili 999b ili 999
    • druga je mogućnost da svi konvertirani imaju oznaku n, a da se podatak iz 999 stavi u neko lokalno polje
  • LDR 06 - a - language material
  • LDR 07 - m - Monograph/item
  • LDR 17 i 18 - razjasniti (17 Encoding level, 18 Descriptive cataloging form)
  • LDR 19 - razjasniti

001

Voyager

003

razjasniti

007

razjasniti

008 - All materials

  • 008 00 - datum - što kad datum nije poznat? smije li stajati 000000
  • 008 06 - Type of date/Publication status - t - raspraviti
  • 008 07-10 - Date 1 - iz 210d koji kroz modify postaje 210c
  • 008 11-14 - Date 2
  • 008 15-17 - Place of publication, production, or execution - što ako nema 102?
  • 008 35-37 - Language - izvlači se iz polja 101. što ako nema 101?
    • zxx - no linguistic content
  • 008 38 - Modified record - razjasniti
  • 008 39 - Cataloging source - d (other)

008 - Books

  • 008 18-21 - Illustrations
  • 008 22 - Target audience
  • 008 23 - Form of item
  • 008 24-27 - Nature of contents
  • 008 28 - Government publication
  • 008 29 - Conference publication
  • 008 30 - Festschrift
  • 008 31 - Index
  • 008 32 - Undefined
  • 008 33 - Literary form
  • 008 34 - Biography

020

  • modify za polje 10 -> drugi ISBN počinje prefixom "ISBN" koji se miče (pr. u sfb)
  • marc-lint javlja krivi checksum

035$6 ili 035$9

  • Privemeno koristimo 035$6 umjesto 035$9, zato što marclint prijavljuje 9 kao grešku.
  • marc 035a - System Number - Voyagerov ID (001)
  • polje 035$9 smije sadržavati slova i razmake

040

  • za sve je isti
  • treba utvrditi točnu oznaku za ustanovu

041 - indikatori

pretpostavke o indikatorima

  • Ako postoji polje 300 i ono sadrži /Prijevod/ ili /Izv. stv. nasl./ => i1 = 1
    • Da li je napomena uvijek pisana?
  • Podatak o prevodiocu u 200g. Problem: različiti oblici riječi, različiti jezici
  • Ako u UDK oznaci postoji "=", bez zagrada, onda je to prijevod
    • ako postoje zagrade pr. 94(=411.16) onda su to pomoćne oznake
    • pr. 821.111-2=163.42 je prijevod engleske drame na HR.
    • to ima samo za književna djela, eseje....

041

  • ponovljivo polje (101) konvertira se u ponovljiva potpolja (041a)

044

zemlja izdavanja

080 - UDK

  • 675 podpolja b, c, d ... - što s njima? - provjeriti za svaku bazu

084 - other classification (R)

  • NSK ga koristi za stručnu oznaku NSK iz polja 681
  • NSK konvertira polje 686 u 084, u skladu s LOC konv. tablicom
  • polje 686 koristi FFPS. još netko?

100

  • I1 = 0 ako je pseudonim (ima 700a, nema 700b)

111 i 110

  • konverzija u 110 ili 111 ovisno o postojanju/nepostojanju nekih polja - provjeriti ispise naslova iz svake baze - moguće su greške.

245 indikatori

  • i1 = 0 za anonimne publikacije, i1 = 1 ako postoji 700 ili 710
  • i2 = pretpostavlja se na temelju člana na početku naslova i jezika
  • provjeriri

245

  • potpolja i interpunkcije pripremljeni u modify

246

250

  • zapisima koji nemaju potpolje, dodaje se ^a u modify - provjeriti

260

  • ponovljiva potpolja u originalnom redosljedu - priprema u modify

300

  • urediti interpunkcije za sve kombinacije

362 - brojčani podaci za nakladničku cjelinu - razjasniti upotrebu

440 - indikatori

    1. 2.ind. prema jeziku i članu, provjeriti

440


    1. marc_compose za 440 radi samo kad polje ni potpolja nisu ponovljiva. ne zapisuje dobro drugo pojavljivanje ^v, tj. ^v iza ^p (iz 225^w)

    1. 225w treba ici u 440v, na kraj

# '+', join_with(' ; ',
--

500


502 - bilješka o disertacijama

    1. odgovarajućeg polja nema u originalnim podacima. možda se može pretpostaviti?

504


505

    1. FFPS 327 - sadrzaj
    2. NSK konvertira 327 (NP) u 501 (R)
    3. u LOC konv. tablici stoji 327 (NP) u 505 (NR)
    4. standard i validacije dopuštaju 501 (R) i 505 (R)

520

    1. NSK konvertira 330 (P) u 520 (P) = LOC konv. tablica
    2. FFPS 330 (NP) - sažetak

526 - STUDY PROGRAM INFORMATION NOTE

    1. provjeriti za svaku bazu sta je u 996?

538 - zahtjevi sustava


655


653


700

    1. ako je u originalu ponovljivo polje treba biti i konvertirano u ponovljivo !!

740 - nadopuniti


760 w

    1. generiranje zapisa o nakladničkoj cjelini i povezivanje podređenog zapisa s nadređenim

852 - signatura


876 - item information - basic bibliographic unit


886 - former marc


Pravila za konverziju ispisana su u konfigiracijskim datotekama za Webpac2.

Modify

regex mappings

direktorij conf/modify
format:

Omogućava dodatnu pripremu podataka, prije normalizacije.
Koristi se za:

  • zamjenu interpunkcije potpoljem i obrnuto
  • zamjenu potpolja drugim potpoljem
  • dodavanje interpunkcija
  • micanje suvišnih znakova

Normalize

Datoteke za normalizaciju nalaze se u direkororiju /conf/normalize/.
Tu su opisana pravila za konverziju podataka.

Za konverziju FF CDS/ISIS formata u MARC21 koriste se ove datoteke:

  • ff-libri.pl
  • ff-peri.pl
  • ff-arti.pl

bilješke iz datote ff-libri: http://mjesec.ffzg.hr/isis-konverzija/pravila_za_konverziju-komentari.txt

nalaze se na adresi: http://knjiznice.ffzg.hr/isis-konverzija/normalize/ (desni klik, pa Save As, ako zelite pogledati datoteku. ako samo kliknete, javit ce vam se grozna greška)

Formati

Moguće su različite kombinacije ulaznih i izlaznih fomata podataka:

Formati ulaznih podataka:

  • CDS/ISIS master file
  • MARC (ISO-2709)
  • Excel
  • DBF
  • ISI file format
  • Gutenberg file format
  • PDF tablice
  • ... (potencijalno svaki strukturirani format)

Formati izlaznih podataka

  • ISO-2709 (MARC)
  • Excel
  • JSON
  • formati za searhc engines