EPrints - softver za digitalne repozitorije
Napredno pretraživanje: Revision 5

Napredno pretraživanje ima problem sa UTF-8 znakovima.

Za sada izgleda da je krivac tokenizator u EPrints/Index/Tokenizer.pm koji ima definiciju mappinga samo za neke latin1 karaktere:

$EPrints::Index::FREETEXT_CHAR_MAPPING = {
               chr(0x0027) => "'",     # '
               chr(0x00a1) => '!',    # ¡
               chr(0x00a2) => 'c',    # ¢
               chr(0x00a3) => 'L',    # £
               chr(0x00a4) => 'o',    # ¤

Kreiranje mappinga za naša slova: (bez use utf8 koji bi ovo enkodirao u utf-8 stringove)

dpavlin@klin:~$ perl -MData::Dump -e 'print Data::Dump::dump("š","Š","đ","Đ","č","Č","ć","Ć","ž","Ž"),$/'
(
  "\xC5\xA1",
  "\xC5\xA0",
  "\xC4\x91",
  "\xC4\x90",
  "\xC4\x8D",
  "\xC4\x8C",
  "\xC4\x87",
  "\xC4\x86",
  "\xC5\xBE",
  "\xC5\xBD",
)

Restart indexera

/etc/init.d/epindexer stop
/etc/init.d/epindexer start

Rekreiranje full-text search-a:

sudo -u eprints /usr/share/eprints3/bin/epadmin erase_fulltext_index grf

Ovo nije rješenje, related mailing list post: http://mailman.ecs.soton.ac.uk/pipermail/eprints-tech/2013-July/002079.html