shell komande i malo perla za zgodne statistike: Revision 11 / Konverzija podataka

Konverzija podataka

shell komande i malo perla za zgodne statistike: Revision 11

Trebamo o u podacima vidjeti koja se točno podpolja nalaze u pojedinim poljima. Podaci su text dump iz ISIS datoteke.

Za elegantno rješenje, ne moramo se maknuti iz Linux shella:

Dovoljna je ova naredba:

grep ^200 dump.libri | sed 's/$\^[a-z]$[^\^]*/\1/g' | sort | uniq -c | sort -rn

za sljedeći rezultat:

Za istu stvar moguće je iskoristiti i malo perla:

#!/usr/bin/perl
while(<>) {
chomp;
s/(\^[a-z])[^\^]*/$1/g;
print "$_\n";
}

onda to izgleda ovako:

grep ^200 dump.libri | ./filter.pl | sort | uniq -c | sort -rn