KOHA
Migracija podataka: Revision 36

Migraciji je predhodilo čišćenje podataka i izrada alata za konverziju.
Dokumentacija o konverziji - http://saturn.ffzg.hr/konverzija


Tablice za mapiranje signatura

* Podaci u Koha bazi i mapiranje u MARC

Što je potrebno napraviti prije migracije?

  • definirati lokacije (home i holding)
  • definirati vrste građe za posudbu
  • utvrditi sustav mapiranja za signature -- raspored građe u otvorenom pristupu
  • odrediti pravila za katalogizaciju
  • utvrditi koji se podaci zapisuju na RFID i da li se podaci generiraju u Kohi?

Mapiranje u nove signature

Kako prirediti tablicu za mapiranje?

konfiguracija za webpac:

  ffta:
    name: 'Talijanistika, Filozofski fakultet u Zagrebu'
    input:
      - name: libri
        type: isis
        path: '/backup/isis_backup/A225-2/isisdata/latest/LIBRI/LIBRI'
        encoding: 'cp852'
        #limit: 10
        modify_file: 'conf/modify/report.pl'
        normalize:
          - path: 'conf/normalize/ffreports-sorted.pl'
    output:
      - module: 'Sorted'
        path: 'out/report/sorted/ta/'


najprije se makiva prefix iz polja 990 (pr. TA, IZ, ..)

u conf/modify/report.pl:

990
  '*'
    'IZ' => ''
    'TA' => ''

relevantne linije u ffreports-sorted.pl:

sorted('UDK',
        frec('675a')
);      
sorted('Stara signatura',
        join_with('',
             suffix(' ; ',
                 rec('000'),
             ),
             join_with(' | ',
                  rec('990')
             )
        ),
);     

Rezultat

stara_signatura.txt
Iz datoteke se izdvaja dio koji sadrži stručnu oznaku. Također popis je potrebno deduplicirati i prebrojati broj pojavljivanja pojedine oznake.

cat /data/webpac2/out/report/sorted/an/stara_signatura.txt | sed -e 's#^[0-9]*\s;\s##' | sed -e 's#\s|\s.*##' | sort | uniq -c 

Dobiveni popis učitava se u tablicu. U tu tablicu, u treću kolonu, potrebno je upisati odgovarajuće nove oznake.

Iznimke:
etnologija
??
filozofija - lokalne oznake
pedagogija - lokalne oznake
povijest - lokalne oznake

Što sadrži tablica za mapiranje?

1. kolona: frekvencija pojavljivanja svake skupine
2. kolona: stara stručna skupina iz siganture ili UDK
3. kolona: nova stručna skupina

Koha bulk import

misc/migration_tools/bulkmarcimport.pl

Koha podaci o primjercima

Može li se naknadno nešto mijenjati u podacima?

Da li je moguće napraviti update podataka u Koha bazi, na temelju tablice s vrijednostima koje treba unjeti u bazu prema odgovarajućim kriterijima?
Da li moguće iz tako promijenjene Koha baze napraviti export u ISO-2709?

Redosljed migracije

Radni prijedlog:
Migirat će se knjižnica po knjižnica.

Kriteriji za pomoć u određivanju redosljeda migracije:

  • postojanje sustava za signiranje građe
  • katalogizatorica vještija u baratanju kompjuterom

Redosljed može ovisti i o nametnutom redosljedu seljenja - neke knjižnice selit će se prije - B i C trakt, komparativna.

Zašto ne migrirati sve odjednom?

    • Podaci se trenutno nalaze u odvojenim bazama, a veličina tih baza podnošljiva je za baratanje (max. veličina je 23000 zapisa). Upload 20000 zapisa u Kohu traje nekoliko minuta.
    • Podaci u različitim bazama su različitog opsega i složenosti - sve baze ne koriste isti opseg polja i potpolja.
    • Manje baze općenito sadrže manje grešaka.
    • Knjižničare treba educirati prije nego što se počnu koristiti novim sustavom, a to zahtijeva određenu količinu vremena. Vještiji knjižničari savladat će katalogizaciju u Kohi brže i jednostavnjije.

Bilješke

  • Mora li se MARC framework postaviti prije importa podatka?
  • Što ako se ne postavi?
  • Može li se kasnije raditi export u MARC za polja koja se zapisuju u koha bazu, a nisu mapirana?