Konverzija podataka
shell komande i malo perla za zgodne statistike: Revision 1

Moramo vidjeti u podacima koja se točno podpolja nalaze u pojedinim poljima. Podaci su text dump iz ISIS datoteke.

Treba nam jedna mala perl skripta:

#!/usr/bin/perl
while(<>) {
 chomp;
 s/(\^a-z)^\^*/$1/g;
 print "$_\n";
}

i pokoja shell naredba:

grep ^200 dump.libri | ./filter.pl | sort | uniq -c | sort -rn

Rezultat izlgleda ovako

` 2319 200 ^a^f`
 2064 200 ^a^e^f
 409 200 ^a^f^g
 372 200 ^a^e^f^g
 163 200 ^a^e
 64 200 ^a
 17 200 ^a^e^e^f
 12 200 ^a^e^g
 10 200 ^a^g
 7 200 ^a^d^f
 6 200 ^a^e^e
 5 200 ^a^e^e^f^g
 4 200 ^a^f^g^g
 4 200 ^a^e^e^e^f
 3 200 ^a^f^v
 3 200 ^a^e^d^e^f
 2 200 ^a^g^f
 2 200 ^a^e^f^g^g
 2 200 ^a^e^e^g
 2 200 ^a^d^e^f
 2 200 ^a^b^f
 2 200 ^a^b
 1 200 Human communication disorders^e^f
 1 200 ^a^k^f^g
 1 200 aHandbook of research methods in developmental science^f
 1 200 ^a^f^g^g^g
 1 200 ^a^e^f^v
 1 200 ^a^e^f^g^g^g
 1 200 ^a^e^f^d
 1 200 ^a^e^e^e^f^g
 1 200 ^a^d^f^g
 1 200 ^a^d