Migraciji je predhodilo čišćenje podataka i izrada alata za konverziju.
Dokumentacija o konverziji - http://saturn.ffzg.hr/konverzija
Što je potrebno napraviti prije migracije?
- definirati lokacije (home i holding)
- definirati vrste građe za posudbu
- utvrditi sustav mapiranja za signature -- raspored građe u otvorenom pristupu
- odrediti pravila za katalogizaciju
- utvrditi koji se podaci zapisuju na RFID i da li se podaci generiraju u Kohi?
Mapiranje u nove signature
Kako prirediti tablicu za mapiranje?
konfiguracija za webpac:
ffta:
name: 'Talijanistika, Filozofski fakultet u Zagrebu'
input:
- name: libri
type: isis
path: '/backup/isis_backup/A225-2/isisdata/latest/LIBRI/LIBRI'
encoding: 'cp852'
#limit: 10
modify_file: 'conf/modify/report.pl'
normalize:
- path: 'conf/normalize/ffreports-sorted.pl'
output:
- module: 'Sorted'
path: 'out/report/sorted/ta/'
najprije se makiva prefix iz polja 990 (pr. TA, IZ, ..)
u conf/modify/report.pl:
990
'*'
'IZ' => ''
'TA' => ''
relevantne linije u ffreports-sorted.pl:
sorted('Signature strucna oznaka',
frec('990')
);
sorted('Stara signatura',
join_with(' | ',
rec('000'),
rec('990')
)
);
Rezultat
signature_strucna_oznaka.txt
Trebala bi sadržavati samo stručne oznake, tj. podatak u prvom pojavljivanju polja 990. Međutim, iako smo uz pomoć modify maknuli prefix iz signature, frec(990) čini se da svejedno uzima u obzir to polje.
Znači, ako u orig. ISIS bazi nema prefixa (može se maknuti u ISIS-u sa search/replace), onda je ova datoteka upotrebljiva, ako prefixi ostanu u ISIS-u, datoteka nije upotrebljiva, a popis stručnih oznaka izrađuje se iz datoteke stara_signatura.txt
stara_signatura.txt
Iz datoteke se izdvaja dio koji sadrži stručnu oznaku. Također popis je potrebno deduplicirati i prebrojati broj pojavljivanja pojedine oznake.
cat /data/webpac2/out/report/sorted/an/stara_signatura.txt | sed -e 's#^[0-9]*\s|\s##' | sed -e 's#\s|\s.*##' | sort | uniq -c
Dobiveni popis učitava se u tablicu. U tu tablicu, u treću kolonu, potrebno je upisati odgovarajuće nove oznake.
Iznimke:
etnologija
??
filozofija - lokalne oznake
pedagogija - lokalne oznake
Što sadrži tablica za mapiranje?
1. kolona: frekvencija pojavljivanja svake skupine
2. kolona: stara stručna skupina iz siganture ili UDK
3. kolona: nova stručna skupina
Koha bulk import
misc/migration_tools/bulkmarcimport.pl
Redosljed migracije
Radni prijedlog:
Migirat će se knjižnica po knjižnica.
Kriteriji za pomoć u određivanju redosljeda migracije:
- postojanje sustava za signiranje građe
- katalogizatorica vještija u baratanju kompjuterom
Redosljed može ovisti i o nametnutom redosljedu seljenja - neke knjižnice selit će se prije - B i C trakt, komparativna.
Zašto ne migrirati sve odjednom?
- Podaci se trenutno nalaze u odvojenim bazama, a veličina tih baza podnošljiva je za baratanje (max. veličina je 23000 zapisa). Upload 20000 zapisa u Kohu traje nekoliko minuta.
- Podaci u različitim bazama su različitog opsega i složenosti - sve baze ne koriste isti opseg polja i potpolja.
- Manje baze općenito sadrže manje grešaka.
- Knjižničare treba educirati prije nego što se počnu koristiti novim sustavom, a to zahtijeva određenu količinu vremena. Vještiji knjižničari savladat će katalogizaciju u Kohi brže i jednostavnjije.