EPrints - softver za digitalne repozitorije
Napredno pretraživanje: Revision 5
Napredno pretraživanje ima problem sa UTF-8 znakovima. Za sada izgleda da je krivac tokenizator u EPrints/Index/Tokenizer.pm koji ima definiciju mappinga samo za neke latin1 karaktere: $EPrints::Index::FREETEXT_CHAR_MAPPING = { chr(0x0027) => "'", # ' chr(0x00a1) => '!', # ¡ chr(0x00a2) => 'c', # ¢ chr(0x00a3) => 'L', # £ chr(0x00a4) => 'o', # ¤ Kreiranje mappinga za naša slova: (bez use utf8 koji bi ovo enkodirao u utf-8 stringove) dpavlin@klin:~$ perl -MData::Dump -e 'print Data::Dump::dump("š","Š","đ","Đ","č","Č","ć","Ć","ž","Ž"),$/' ( "\xC5\xA1", "\xC5\xA0", "\xC4\x91", "\xC4\x90", "\xC4\x8D", "\xC4\x8C", "\xC4\x87", "\xC4\x86", "\xC5\xBE", "\xC5\xBD", ) Restart indexera /etc/init.d/epindexer stop /etc/init.d/epindexer start Rekreiranje full-text search-a: sudo -u eprints /usr/share/eprints3/bin/epadmin erase_fulltext_index grf Ovo nije rješenje, related mailing list post: http://mailman.ecs.soton.ac.uk/pipermail/eprints-tech/2013-July/002079.html |