|
EPrints - softver za digitalne repozitorije
Napredno pretraživanje: Revision 4
Napredno pretraživanje ima problem sa UTF-8 znakovima. Za sada izgleda da je krivac tokenizator u EPrints/Index/Tokenizer.pm koji ima definiciju mappinga samo za neke latin1 karaktere:
$EPrints::Index::FREETEXT_CHAR_MAPPING = {
chr(0x0027) => "'", # '
chr(0x00a1) => '!', # ¡
chr(0x00a2) => 'c', # ¢
chr(0x00a3) => 'L', # £
chr(0x00a4) => 'o', # ¤
Kreiranje mappinga za naša slova: (bez use utf8 koji bi ovo enkodirao u utf-8 stringove)
dpavlin@klin:~$ perl -MData::Dump -e 'print Data::Dump::dump("š","Š","đ","Đ","č","Č","ć","Ć","ž","Ž"),$/'
(
"\xC5\xA1",
"\xC5\xA0",
"\xC4\x91",
"\xC4\x90",
"\xC4\x8D",
"\xC4\x8C",
"\xC4\x87",
"\xC4\x86",
"\xC5\xBE",
"\xC5\xBD",
)
Restart indexera /etc/init.d/epindexer stop /etc/init.d/epindexer start Rekreiranje full-text search-a: sudo -u eprints /usr/share/eprints3/bin/epadmin erase_fulltext_index grf |