RazmjenaVjestina
DraftPilotProjekt: Revision 3


CreativeCommonsHr

Puni naziv projekta:

CreativeCommons.hr - repozitorij i pretraživač slobodnih sadržaja, te sučelje za razvoj semantičkog weba slobodnih sadržaja na hrvatskom jeziku?

Skraćeni naziv projekta:

CreativeCommons.hr

Engleski naziv projekta:

CreativeCommons.hr - repository and search engine for free culture content + interface for development of semantic web of free culture in Croatian language?

Opis projekta:

Dizajn i implementacija kompleksnog informacijskog sustava Creativecommons.hr sa slijedećim modulima:

  • repozitorij slobodnih sadržaja na hrvatskom jeziku sa sučeljem za skidanje sadržaja iz repozitorija i postavljanje novih u repozitorij
  • sučelje za licenciranje slobodnih sadržaja koristeći već postojeće tehnologije razvijene unutar Creative Commons projekta
  • pretraživač repozitorija kao i indeks svih ostalih slobodnih sadržaja na hrvatskom jeziku koji se ne nalaze u repozitoriju
  • sučelje za opis i kategoriziranje sadržaja, gdje je najširoj javnosti dostupna tehnologija označavanja poznata pod imenom "folksonomy" ili "tagiranje", a ono je integrirano u kompleksniji model ekspertnog opisivanja i označavanja sadržaja kao priprema za semantički web (sustav će omogućiti označavanje po proizvoljnim ortogonalnim svojstvima; npr, označavanje vremenskih isječaka multimedijalnih datoteka)
  • indeksiranje prema već postojećim metainformacijama u datotekama (npr. ID2/3 mp3 tagovi, EXIF podatci i slično)
  • unos i označavanje sadržaja prema geoprostornim informacijama
  • leksička analiza oznaka na hrvatskom jeziku, te priprema sustava za kompleksno povezivanje sa budućim projektima poput hrvatskog WordNeta.
  • API za RSS export/import sadržajnih jedinica

CreativeCommons.hr zamišljen je kao najnovija generacija web portala čija je uloga prikupljanje i distribucija informacija u novom kontekstu semantičkog weba. To znači da on postaje centralno sučelje standardizacije u formatiranju informacijskih resursa. Iako funkcionira i kao krajnje mjesto dolaska po informacije, sam web sajt nije nužno i mjesto na kojem krajnji korisnici konzumiraju informacije. Creativecommons.hr je mjesto s kojega je lako dobiti informacije u standardnom obliku (npr. RSS feeds, RDF, XML...) tako da se one mogu objavljivati i u nekom drugom kontekstu gdje lako postaju dio tih drugih servisa i/ili vizualnih identiteta.

Podjednako važna uloga je i u okupljanju različitih zajednica poput producenata/autora slobodnih sadržaja (audio, video, tekst, fotografija, softver....) koji na Creativecommons.hr postavljaju svoje radove, biraju neku od Creative Commons licenci za svoj rad i/ili ih opisuju i prijavljuju u repozitorij za kasnije pretraživanje. Cilj je također okupiti i entuzijaste oko razvoja semantičkog weba slobodnih sadržaja na hrvatskom jeziku koji uz minimum truda mogu koristiti označavanje sadržajnih jedinica jednostavnim ključnim riječima ili se uključiti u ozbiljne ekspertne razvoje ontologija za slobodne sadržaje na hrvatskom jeziku.

  • stvoriti cjelovito informacijsko mrežno rješenje za pretraživanje, prikupljanje, indeksiranje, kategoriziranje i licenciranje slobodnih sadržaja na hrvatskom jeziku za autore, istraživače i najširu publiku
  • poticati javnu svijest o značaju upotrebe novih tehnologija u stvaranju semantičkog weba na hrvatskom jeziku kao slijedećeg koraka u razvoju društva znanja
  • poticati javnu svijest o značaju slobodnih i najšire dostupnih informacijskih resursa za širenje potencijala stvaralaštva i razmjene

Objasniti potrebu za projektom:

Web tehnologije su više manje u cijelom svijetu prošle fazu u kojoj su ljudi otkrivali od kolike sve koristi one mogu biti u pronalaženju informacija, povezivanju ljudi ili pomoći poslovnom sektoru. Potencijal globalnih promjena u korištenju informacijskih tehnologija, na čelu sa webom, prepoznat je od njegovih najranijih dana upotrebe. Najoptimističnija predviđanja se nisu ostvarila. Iako se može primjetiti globalna raširenost informacijskih tehnologija, njen razvojni potencijal u smislu pomaka ka globalnom društvu znanja ustupio je mjesto ekonomskoj globalizaciji i interesu krupnog kapitala.

Ograničenja koja bi danas mogli prepoznati kao ključna na putu prema najširoj distribuciji i dostupnosti znanja i značajnih informacija su:
 a) dosadašnje web tehnologije kao što je HTML u kojima smisao, značenje i i takvu povezivost informacija uspijeva uspješno prepoznati tek krajnji korisnik/pojedinac

 b) najšira kultura korištenja informacijskih tehnologija koja ne prepoznaje potencijal kolaborativnog djelovanja u mrežnoj okolini, a uslijed raširenosti dominantne paradigme i doslovne metafore uredskog prostora kao polazišne točke korištenja računala

 c) otežani pristup informacijskim resursima uslijed restriktivne zakonske regulative intelektualnog vlasništva (autorska prava i patenti)

 d) dominantni tržišni pristup zasnovan na poslovnim modelima stvorenim u uvjetima prije informacijske (digitalne) tehnološke revolucije
 

U takvoj kompleksnoj konstelaciji u zadnjih nekoliko godina pojavilo se nekoliko uspješnih trendova koji kombiniraju moguće odgovore na opisana ograničenja:
Ad.a) HTML se pokazao kao dovoljno dobar 'markup' jezik u kojem prosječan korisnik Interneta zna od kuda će krenuti u potragu za željenom informacijom (najčešće jedan od popularnih pretraživača), te što je od ponuđenih rezultata značajno, a što ne. No s uznapredovalom digitalizacijom i hiperprodukcijom sadržaja za web pojavila se potreba za usustavljanjem i poboljšavanjem tehnika i pristupa u prepoznavanju značenja i međusobne povezivosti informacija.

Još sredinom devedesetih predloženi su novi tehnološki standardi koji su odgovarali na problem nedostatnog opisa značenja , te strukture i hijerarhije podataka opisanih HTML-om. U svrhu rješenja tih ograničenja Tim Berners Lee zajedno s drugima u sklopu Web Konzorcija pristupio je stvaranju semantičkog weba. Tehnologije koje omogućavaju stvaranje semantičkog weba su prije svega XML (Extensible Markup Language), RDF (Resource Description Framework) i OWL (Web Ontology Language), a njihova upotreba dovela je i do pojave novih poput RSS-a (Really Simple Syndication ili Rich Site Summary). Do njihove najšire prihvaćenosti došlo je tek zadnjih godina, a one su omogućile pojavu vrlo zanimljivih servisa poput automatske distribucije informacija (npr. vijesti, ponuda proizvoda, servisne informacije) sa više izvora na jednom mjestu prema najrazličitijim individualnim korisničkim kriterijima.

Korištenje kombinacije opisanih tehnologija omogućila bi upotrebu računalnih algoritama u potrazi za značenjem, smislom i i logičkom povezivošću informacija. No pripremanje informacija za semantički web zahtijeva ekspertno znanje i vještine što se pokazalo kao preskupa investicija za većinu projekata izgradnje takvih informacijskih resursa. Odgovor se pojavio spontano kao nastavak tradicije kolaborativnog modela produkcije poznat iz svijeta slobodnog softvera - folksonomy.
Ad.b) Ideja da se informacije predstavljaju kroz metafore fizičkih objekata iz stvarnog svijeta (poslovni ured) pomogla je brzom usvajanju korisničkih sučelja i primjeni računala u širokom spektru ljudskih djelatnoti. Međutim ta je paradigma s vremenom postala kočnica usvajanja novih drugačijih pristupa ljudskoj obradi informacija. Neki zaokruženi logički sklop Informacija nije nužno svesti samo na njegovo ime i mjesto u hijerarhiji mapa na tvrdom disku računala. Informacije se mogu opisivati i njihovom pripadnošću većem broju asocijativnih oblaka putem ključnih riječi. Ako su tako opisane do njih je moguće doći upisivanjem bilo koje ključne riječi neovisno o njihovom redu pojavljivanja. Nizanje ključnih riječi selektivno smanjuje broj mogućih izbora i tako dovodi do uspješnog pronalaženja željenih informacija. Taj je pristup poznat iz pretrage pri korištenja web pretraživača, no dugo vremena se nije najšire koristio i kao način opisivanja pri spremanju informacija. Pristup je vjerojatno najpoznatiji pri korištenju nove riječi nastale kao posljedica korištenja najpopularnijeg pretraživača - guglanje.

Kada se taj pristup primjeni u sferi kolaborativnog mrežnog djelovanja na način da je moguće pretraživati i djeliti asocijativne oblake ključnih riječi sa velikim brojem drugih korisnika na Internetu, rezultati mogu biti zapanjujući. Prije nekoliko godina prvi servis koji je to omogućio svojim korisnicima bio je http://del.icio.us , socijalni bookmark. Del.icio.us je povezao korisničke omiljene web adrese u fascinatan semantički web, a ključni moment uspjeha bio je jednostavno korisničko sučelje gdje je korisnicima ostavljeno da potpuno arbitrarno u svakom novom trenutku upisu ključne riječi koje im padnu na pamet u vezi sa web adresom koju tog časa spremaju u bazu podataka. Del.icio.us model kolaborativnog opisivanja podataka ključnim riječima preuzeo je web poput oluje. Taj model prihvatili su projekt djeljenja digitalnih fotografija http://www.flickr.com, slušanja i djeljenja glazbe http://last.fm, povezivanja blogova http://technorati.com, opisivanja geoprostornih podataka poput http://www.plazes.com ili Google Map, a cijeli model je dobio i službeno novo ime - folksonomy. Nakon dvije godine rada Del.icio.us je kupljen od strane Yahoo-a za preko dvadeset milijuna dolara. U ovom slučaju važno je napomenuti da je programska logika iza Del.icio.us softvera izuzetno jednostavna i da u stvari gotovo jedino sto je Yahoo u tom slučaju kupio je baza podataka i korisnika koje je Deli.icio.us s vremenom okupio.

Folksonomy je kolaborativno opisivanje podataka ključnim riječima, kroz najjednostavnije moguće korisničko sučelje, otvoreno svima. S vremenom, nakon što veliki broj ljudi prihvati servis, taj resurs postaje pogodan za semantičku analizu i povezivanje s drugim resursima u semantički web. Do danas folksonomy se pokazao kao najuspješniji model razvoja semantičkog weba.
Ad.c) Danas više nego ikad prije znanje, inventivna ideja i prava informacija postale su ključni moment ostvarivanja tržišne prednosti nad konkurencijom. Zbog toga ne čudi stalni trend pokušaja da se što bolje zaštiti intelektualno vlasništvo nad takvim vrijednim informacijama. S jedne strane takva zakonska regulativa pogoduje poslovnim investicijama i rastu poslovnog sektora, no u isto vrijeme svjedoci smo apsurdnih situacija na drugom kraju spektra gdje zbog toga informacije postaju nedostupne, a pristup informacijama, njihova upotreba, kopiranje i distribucija često bivaju proglašene za ilegalne radnje u kojima sudjeluje gotovo cijela aktivna populacija.

U Hrvatskoj postoji već mnogobrojna zajednica autora s različitih područja stvaralaštva koji koriste neadekvatna (uglavnom s područja slobodnog softvera preuzeta) i u sklopu hrvatskog zakonodavstva neprimjenjiva alternativna rješenja za licenciranje autorskih djela. Takoder, postoji veliki broj autora koji ne žive od svog stvaralaštva i stoga imaju interes da distribuiranje i korištenje njihovih djela ne bude ograničeno postojećim restriktivnim sistemima zaštite autorskih prava, već da bude što dostupnije, ali ne znaju da postoji pravo i rješenja koja bi njihova djela učinila slobodnima.

Projekt bi stoga trebao odgovoriti na sljedeće potrebe:

 1. potrebu za jednostavnim rješenjem za licenciranje autorskih djela pod drugačijim uvjetima.

 2. potrebu za promoviranjem, vidljivošću i povezivanjem slobodnog stvaralaštva.

 3. potrebu za zaštitom javnih kulturnih dobara pred interesima tržišta.
Ad.d) Uspjeh pokreta slobodnog softvera gdje se paralelno razvija slobodni operativni sustav i različite aplikacije u najvećim svjetskim softverskim korporacijama (IBM, Sun, Novell, Google, Nokia, Motorola...) zajedno s hakerskim zajednicama širom svijeta, te raznim svjetskim vladama (Njemačka, Norveška, Brazilska, Kineska, Španjolska..), kao i uspjeh projekata poput najveće svjetske enciklopedije Wikipedije razvijene volonterskim kolaborativnim radom, isto tako i socijalnih servisa nove generacije poput Del.icio.usa, Flickra, Technorata, Last.fma ili plazes.coma naveo je neke od najuspješnijih kompanija danas da promijene klasične business modele i revolucioniziraju period nakon velikog raspada dot.com ere s početka 21. stoljeća. Najveća vrijednost postaju zajednice ljudi koji dijele medjusobno svoje podatke i koriste najnovije alate semantičkog weba.

Možda tri najbolja primjera su Del.icio.us, Skype i Flickr. U svakom od ta tri slučaja razvoj softvera koji pogoni te servise moguće je velikim kompanijama razviti u relativno kratkom roku. U prilog tome govori i činjenica da je za većinu tih servisa skoro svaka velika kompanija imala softverski ekvivalent, no nisu uspijevali okupiti kritičnu masu korisnika. U času kada su kupljeni Skype od strane E-baya za oko dvije milijarde dolara ili Del.icio.us za tridesetak milijuna dolara, kao i Flickr od strane Yahooa, ono što su Yahoo i E-bay kupovali su podatci i zajednica korisnika. Sličan ili gotovo isti softver su već imali, no uvidjeli su koliko vrijedi povjerenje i entuzijazam koji je stvoren oko uspješnih socijalnih servisa.

Poput E-baya i Yahooa, Google i Amazon najuspješniji su inovatori u polju novih poslovnih modela usmjereni na okupljanje zajednice korisnika i ostvarivanje povjerenja kako bi od korisnika prikupili što više korisnih podataka. Podatci se koriste kako bi plasirali što bolje servise i informacije ili u slučaju Googlea i Yahooa i kontekstualne tekstualne reklame koje danas čine preko pedeset posto prometa oglašavanja na internetu. Te su kompanije pokazale da se na resursima koji se spontano razvijaju na mreži može graditi uspješan poslovni model, te se čini da je to gotovo i jedini model koji će opstati u budućnosti u polju mrežnih komunikacijskih tehnologija.

Rezultat projekta bit će:

  • web sučelje gdje će svaki korisnik moći u nekoliko jednostavnih koraka kreirati licencu za svoje autorsko djelo koja će imati drugačije uvjete od onih koje nameće standardna zaštita autorskog prava. Korisnik će dobiti licencu u tri oblika - u obliku pravnog teksta, u digitalnom obliku i u sažetom obliku. Web sučelje će također uključivati bazu podataka o djelima koja su licencirana pod iCommons licencom te će putem njega ti podaci biti uvršteni u bazu podataka o djelima iz cijelog svijeta koju stvara matični projekt Creative Commons na svom webu.
  • pretraživač slobodnih sadržaja na hrvatskom jeziku
  • sučelje za opisivanje sadržaja kao priprema za budući semantički web slobodnih sadržaja
  • API za daljnju redistribuciju sadržaja

Potencijalni korisnici su:

  • autori/producenti sa svih područja stvaralaštva zaštićenog autorskim pravom. Pogotovu oni autori koji djeluju izvan kulturne ili informatičko-tehnološke industrije ili koji ne žele da distribuiranje i korištenje njihovih djela (ne) bude ograničeno okvirima tržišne primjene zaštite autorskog prava, već da bude šire dostupno uz veće slobode. U Hrvatskoj postoji već veliki broj stvaraoca, pogotovu umjetnika i programera, ali i projekata koji proizvode sadržaje financirane iz javnih sredstava i za javne potrebe, koji trebaju alternativna i pravovaljana rješenja za licenciranje djela.
  • istraživači i zainteresirani za semantički web slobodnih sadržaja na hrvatskom jeziku
  • najšira hrvatska i svjetska javnost zainteresirana za slobodne sadržaje nastale u Hrvatskoj ili na hrvatskom jeziku

GNU/Linux, Python, Perl, PostgreSQL, AJAX, RSS, RDF, XML, HTML, SOAP, WDL, REST

Definirati nastavak realizacije nakon završetka pilot projekta:

Projekt će nastaviti okupljati entuzijaste na prikupljanju i promociji slobodnih sadržaja, kao i na poboljšavanju statusa semantičkog weba proizašlom iz pilot projekta.

Projekt hrvatske implementacije iCommons licenci nastaje u suradnji s matičnim projektom Creative Commons kojeg razvija tim pravnih stručnjaka na sveučilištu Stanford. Trenutno je u tijeku 12 implementacija iCommons u nacionalne pravne sustave diljem svijeta. Multimedijalni institut planira poticati uvođenje sličnih rješenja u susjednim zemljama sličnog jezika i pravnih sustava. Takoder će se uspostaviti razmjena slobodnih sadržaja s drugim iCommons projektima i njihovim korisnicima. Tu je od posebnog značaja brazilski projekt kojeg podupire i tamošnje ministarstvo kulture.

Usporedba sa sličnim projektima u svijetu:

Creative Commons, Free Software, Archive.org, Ccmixter.org, Del.icio.us, Flickr, Jamendo


original Mar 22 10:40am