Konverzija podataka
Greške u CDS/ISIS zapisima: Revision 40

Izvještaji o greškama i statistike CDS/ISIS zapisa

http://knjiznice.ffzg.hr/isis-konverzija/

Svaka knjižnica ima poseban izvještaj za svaku pojedinu bazu.
U izvještajima se nalaze svi tipovi grešaka koje treba popraviti prije konverzije.
Dio nelogičnosti u originalnoj bazi nije potrebno ručno ispravljati jer ih je moguće popraviti u fazi konverzije!

Opis grešaka u CDS/ISIS zapisima

Prva tri tipa grešaka sigurno greške i treba ih ispraviti. Neispravna podpolja nastaju zato što CDS/ISIS ne validira zapise prilikom unosa u bazu. Ovo su sigurno greške.
Napomena: Moguće je da se u izvještaju zapisi prijave kao krivi, ali su stvarno ispravni, naročito u prvim fazama postupka. Svaki sumnjivi slučaj treba odmah prijaviti na adresu mglavica@ffzg.hr, pa se u sljedećem krugu neće pojaviti. U početnim prolazima kroz bazu u izvještajima se namjerno kao greške prijavljuju potpolja koja se koriste u vrlo malom broju zapisa - potrebno je provjeriti da li su podaci slučajno ili namjerno u tom potpolju.

Greške se generiraju na osnovu pravila u tzv. validacijskoj datoteci. Svaka knjižnica ima svoju validacijsku datoteku. U njoj su zapisana sva dozvoljena polja i podpolja u bazi. Posebno se mogu označiti polja koja se smatraju obaveznima. Iz izvještaja se mogu isključiti neka polja.

U izvještaju se pod greške prijavljuju i slučajevi koje treba ljudskim okom pregledati i onda odlučiti da li se radi o grešci ili ispravnom zapisu. Takvi slučajevi opisani pod 4. i 5.

1. Nedostaje podpolje - missing subfield

Podatak je upisan bez podpolja u polje koje treba imati podpolje.

NE TREBA ISPRAVLJATI SVE ZAPISE PRIJAVLJENE U IZVJEŠTAJU! Treba ispraviti samo one u kojima se podatak krivo upisan. Svejedno je da li je podatak upisan sa ili bez poptpolja, bitno je da je dobar sadržaj.

Primjer:
Treba ispraviti:

MFN 1479
205: missing subfield (a,d,f,g required)
	a2. dopunjeno i izmijenjeno izd
MFN 6635
205: missing subfield (a,d,f,g required)
	d1997

 Ne treba ispraviti: .pre
MFN 1472
102: missing subfield (a* required)
HR

MFN 15240
517: missing subfield (a*,e,f required)
Devetnaesto stoljeće


^^^ 2. Podpolje višak - subfield extra

U zapisu se nalazi podatak koji se prepoznaje kao podpolje koje ne smije postojati. Najčešće se radi o tome da je katalogizatorica upisala oznaku "^", a propustila upisati odgovarajuće potpolje. Prvi sljedeći znak interpretira se kao potpolje, a sustav prijavljuje ovu grešku.

^^^ 3. Neočekivano polje - unexpected

U zapisu se pojavljuje polje kojeg nema u popisu polja za tu bazu.

^^^ 4. Dupla podpolja - subfield extra repeatable

U prvom prolazu u izvještaj su uključena sva pojavljivanja duplih podpolja, a nakon što se odredi koja podpolja smiju u bazi postojati, treba ih prijaviti kako bi se ti slučajevi izbacili iz sljedećeg izvještaja.
U većini baza, dozvoljena ponovljiva podpolja će biti:
`200^e, 200^g, 210^a, 210^c`

^^^ 5. Nedostajuća obavezna polja i podpolja - missing, subfield missing

Obavezno!: 200^a

Obavezno podpolje ako postoji odgovarajuće polje:
205^a - ako nije upisano postoji, može se ispraviti automatski (*ne treba ispravljati!*)
210^d - može se ispraviti i poslije konverzije
675^a, 700^a, 701^a, 702^a

Napomena: trebalo bi promijeniti naziv ovog tipa grešaka u izvještaju ovako: obligatory field, obligatory subfield

^^^ 6. Redoslijed potpolja i interpunkcija - potentialy invalid combination

U datoteci 'conf/validate/libri' nalazi se popis svih kombinacija potpolja i interpunkcija u svim bazama. Ovu datoteku mozemo editirati. Ona kombinacija koju izbrišemo u ovoj datoteci prijavit će se kao greška u izvještaju.
Ova procedura moze se koristiti i za pronalaženje zapisa zanimljivih za testiranje. Umjesto da ih tražimo preko ISIS-a, čini se da je lakše pogledati u ovu ekstrahiranu datoteku i u njoj identificirati zapise za koje bismo rado provjerili da li su se dobro konvertirali. U tom slučaju nećemo bristati kombinaciju iz validacijske datoteke, već ju možemo zakomentirati (#)

----

? v200 : '^a'

? v200 : ^a