KOHA
Migracija podataka: Revision 23

Migraciji je predhodilo čišćenje podataka i izrada alata za konverziju.
Dokumentacija o konverziji - http://saturn.ffzg.hr/konverzija


Što je potrebno napraviti prije migracije?

  • definirati lokacije (home i holding)
  • definirati vrste građe za posudbu
  • utvrditi sustav mapiranja za signature -- raspored građe u otvorenom pristupu
  • odrediti pravila za katalogizaciju
  • utvrditi koji se podaci zapisuju na RFID i da li se podaci generiraju u Kohi?

Mapiranje u nove signature

Kako prirediti tablicu za mapiranje?

konfiguracija za webpac:

  ffta:
    name: 'Talijanistika, Filozofski fakultet u Zagrebu'
    input:
      - name: libri
        type: isis
        path: '/backup/isis_backup/A225-2/isisdata/latest/LIBRI/LIBRI'
        encoding: 'cp852'
        #limit: 10
        modify_file: 'conf/modify/report.pl'
        normalize:
          - path: 'conf/normalize/ffreports-sorted.pl'
    output:
      - module: 'Sorted'
        path: 'out/report/sorted/ta/'


najprije se makiva prefix iz polja 990 (pr. TA, IZ, ..)

u conf/modify/report.pl:

990
  '*'
    'IZ' => ''
    'TA' => ''

relevantne linije u ffreports-sorted.pl:

sorted('Signature strucna oznaka',
        frec('990')
);      
        
sorted('Stara signatura',
        join_with(' | ',
                rec('000'),
                rec('990')
        )
);        

Rezultat

signature_strucna_oznaka.txt
Trebala bi sadržavati samo stručne oznake, tj. podatak u prvom pojavljivanju polja 990. Međutim, iako smo uz pomoć modify maknuli prefix iz signature, frec(990) čini se da svejedno uzima u obzir to polje.
Znači, ako u orig. ISIS bazi nema prefixa (može se maknuti u ISIS-u sa search/replace), onda je ova datoteka upotrebljiva, ako prefixi ostanu u ISIS-u, datoteka nije upotrebljiva, a popis stručnih oznaka izrađuje se iz datoteke stara_signatura.txt

stara_signatura.txt
Iz datoteke se izdvaja dio koji sadrži stručnu oznaku. Također popis je potrebno deduplicirati i prebrojati broj pojavljivanja pojedine oznake.

Dobiveni popis učitava se u tablicu. U tu tablicu, u treću kolonu, potrebno je upisati odgovarajuće nove oznake.

Što sadrži tablica za mapiranje

1. kolona: frekvencija pojavljivanja svake skupine
2. kolona: stara stručna skupina iz siganture ili UDK
3. kolona: nova stručna skupina

Koha bulk import

misc/migration_tools/bulkmarcimport.pl

Redosljed migracije

Radni prijedlog:
Migirat će se knjižnica po knjižnica.

Kriteriji za pomoć u određivanju redosljeda migracije:

  • postojanje sustava za signiranje građe
  • katalogizatorica vještija u baratanju kompjuterom

Redosljed može ovisti i o nametnutom redosljedu seljenja - neke knjižnice selit će se prije - B i C trakt, komparativna.

Zašto ne migrirati sve odjednom?

    • Podaci se trenutno nalaze u odvojenim bazama, a veličina tih baza podnošljiva je za baratanje (max. veličina je 23000 zapisa). Upload 20000 zapisa u Kohu traje nekoliko minuta.
    • Podaci u različitim bazama su različitog opsega i složenosti - sve baze ne koriste isti opseg polja i potpolja.
    • Manje baze općenito sadrže manje grešaka.
    • Knjižničare treba educirati prije nego što se počnu koristiti novim sustavom, a to zahtijeva određenu količinu vremena. Vještiji knjižničari savladat će katalogizaciju u Kohi brže i jednostavnjije.

Bilješke

  • Mora li se MARC framework postaviti prije importa podatka?
  • Što ako se ne postavi?
  • Može li se kasnije raditi export u MARC za polja koja se zapisuju u koha bazu, a nisu mapirana?