Konverzija podataka
Greške u CDS/ISIS zapisima: Revision 38

Izvještaji o greškama i statistike CDS/ISIS zapisa

http://knjiznice.ffzg.hr/isis-konverzija/

Svaka knjižnica ima poseban izvještaj za svaku pojedinu bazu.
U izvještajima se nalaze svi tipovi grešaka koje treba popraviti prije konverzije.
Dio nelogičnosti u originalnoj bazi nije potrebno ručno ispravljati jer ih je moguće popraviti u fazi konverzije

Opis grešaka u CDS/ISIS zapisima

Prva tri tipa grešaka sigurno greške i treba ih ispraviti. Neispravna podpolja nastaju zato što CDS/ISIS ne validira zapise prilikom unosa u bazu. Ovo su sigurno greške.
Napomena: Moguće je da se u izvještaju zapisi prijave kao krivi, ali su stvarno ispravni, naročito u prvim fazama postupka. Svaki sumnjivi slučaj treba odmah prijaviti na adresu mglavica@ffzg.hr, pa se u sljedećem krugu neće pojaviti. U početnim prolazima kroz bazu u izvještajima se namjerno kao greške prijavljuju potpolja koja se koriste u vrlo malom broju zapisa - potrebno je provjeriti da li su podaci slučajno ili namjerno u tom potpolju.

Greške se generiraju na osnovu pravila u tzv. validacijskoj datoteci. Svaka knjižnica ima svoju validacijsku datoteku. U njoj su zapisana sva dozvoljena polja i podpolja u bazi. Posebno se mogu označiti polja koja se smatraju obaveznima. Iz izvještaja se mogu isključiti neka polja.

U izvještaju se pod greške prijavljuju i slučajevi koje treba ljudskim okom pregledati i onda odlučiti da li se radi o grešci ili ispravnom zapisu. Takvi slučajevi opisani pod 4. i 5.

1. Nedostaje podpolje - missing subfield

Podatak je upisan bez podpolja u polje koje treba imati podpolje.
Pr.
205 2. izd.
umjesto
205 ^a2. izd.

2. Podpolje višak - subfield extra

U zapisu se nalazi podatak koji se prepoznaje kao podpolje koje ne smije postojati. Najčešće se radi o tome da je katalogizatorica upisala oznaku "^", a propustila upisati odgovarajuće potpolje. Prvi sljedeći znak interpretira se kao potpolje, a sustav prijavljuje ovu grešku.

3. Neočekivano polje - unexpected

U zapisu se pojavljuje polje kojeg nema u popisu polja za tu bazu.

4. Dupla podpolja - subfield extra repeatable

U prvom prolazu u izvještaj su uključena sva pojavljivanja duplih podpolja, a nakon što se odredi koja podpolja smiju u bazi postojati, treba ih prijaviti kako bi se ti slučajevi izbacili iz sljedećeg izvještaja.
U većini baza, dozvoljena ponovljiva podpolja će biti:
200^e, 200^g, 210^a, 210^c

5. Nedostajuća obavezna polja i podpolja - missing, subfield missing

Obavezno!: 200^a

Obavezno podpolje ako postoji odgovarajuće polje:
205^a - ako nije upisano postoji, može se ispraviti automatski (ne treba ispravljati!)
210^d - može se ispraviti i poslije konverzije
675^a, 700^a, 701^a, 702^a

Napomena: trebalo bi promijeniti naziv ovog tipa grešaka u izvještaju ovako: obligatory field, obligatory subfield

6. Greške u redosljedu upisivanjih potpolja i interpunkcija - potentialy invalid combination

U datoteci 'conf/validate/libri' nalazi se popis svih kombinacija potpolja i interpunkcija u svim bazama. Ovu datoteku mozemo editirati. Ona kombinacija koju izbrišemo u ovoj datoteci prijavit će se kao greška u izvještaju.
Ova procedura moze se koristiti i za pronalaženje zapisa zanimljivih za testiranje. Umjesto da ih tražimo preko ISIS-a, čini se da je lakše pogledati u ovu ekstrahiranu datoteku i u njoj identificirati zapise za koje bismo rado provjerili da li su se dobro konvertirali. U tom slučaju nećemo bristati kombinaciju iz validacijske datoteke, već ju možemo zakomentirati (#)


? v200 : '^a'

? v200 : ^a