Konverzija podataka
shell komande i malo perla za zgodne statistike: Revision 5

Moramo vidjeti u podacima koja se točno podpolja nalaze u pojedinim poljima. Podaci su text dump iz ISIS datoteke.

Treba nam jedna mala perl skripta:

#!/usr/bin/perl
while(<>) {
chomp;
s/(\^[a-z])[^\^]*/$1/g;
print "$_\n";
}

i pokoja shell naredba:

grep ^200 dump.libri | ./filter.pl | sort | uniq -c | sort -rn

Rezultat izlgleda ovako

2319 200 ^a^f
2064 200 ^a^e^f
409 200 ^a^f^g
372 200 ^a^e^f^g
163 200 ^a^e
64 200 ^a
17 200 ^a^e^e^f
12 200 ^a^e^g
10 200 ^a^g
7 200 ^a^d^f
6 200 ^a^e^e
5 200 ^a^e^e^f^g
4 200 ^a^f^g^g
4 200 ^a^e^e^e^f
3 200 ^a^f^v
3 200 ^a^e^d^e^f
2 200 ^a^g^f
2 200 ^a^e^f^g^g
2 200 ^a^e^e^g
2 200 ^a^d^e^f
2 200 ^a^b^f
2 200 ^a^b
1 200 Human communication disorders^e^f
1 200 ^a^k^f^g
1 200 aHandbook of research methods in developmental science^f
1 200 ^a^f^g^g^g
1 200 ^a^e^f^v
1 200 ^a^e^f^g^g^g
1 200 ^a^e^f^d
1 200 ^a^e^e^e^f^g
1 200 ^a^d^f^g
1 200 ^a^d