Pravne baze podataka
LexBox pretražuje 820.000+ pravnih dokumenata iz 8 javno dostupnih izvora.
Izvori podataka
EU zakonodavstvo (EUR-Lex)
AktivnoDirektive, uredbe, odluke i drugi pravni akti EU
Vektora: 135.000+
Izvor: eur-lex.europa.eu
Narodne novine
AktivnoSlužbeni i međunarodni dio Narodnih novina od 1990. nadalje
Vektora: 100.000+
Izvor: narodne-novine.nn.hr
Presude Suda EU (CURIA)
AktivnoPresude i mišljenja Suda EU i Općeg suda
Vektora: 62.600+
Izvor: curia.europa.eu
Presude ECHR (HUDOC)
AktivnoPresude Europskog suda za ljudska prava
Vektora: 4.600+
Izvor: hudoc.echr.coe.int
Mišljenja Porezne uprave
AktivnoSlužbena mišljenja o primjeni poreznih propisa
Vektora: 2.600+
Izvor: porezna-uprava.gov.hr
Kako prikupljamo podatke
- 1Svi izvori su javno dostupne pravne baze - sudske odluke, zakoni i propisi objavljeni su na službenim portalima.
- 2Podaci se prikupljaju, obrađuju i dijele na semantičke cjeline (chunks) koje omogućuju precizno pretraživanje.
- 3Svaka cjelina se pretvara u vektorski embedding pomoću BGE-M3, višejezičnog modela optimiziranog za pravne tekstove.
- 4Vektori se pohranjuju u Qdrant vektorsku bazu podataka koja omogućuje brzo semantičko pretraživanje po značenju, a ne samo po ključnim riječima.
Ažuriranje baze
Baza se ažurira jednom mjesečno. Od travnja 2026. provodimo redoviti mjesečni ciklus ažuriranja svih izvora.
Proces uključuje automatizirano prikupljanje novih odluka i propisa s javnih izvora, generiranje vektorskih reprezentacija (Voyage-law-2) i verifikaciju kvalitete prije objave.
Broj vektora ne odgovara broju dokumenata. Jedan zakon ili presuda može sadržavati više vektora jer se dijeli na semantičke cjeline.
Poznata ograničenja
- Nisu sve sudske odluke digitalno dostupne, osobito starije odluke koje nisu digitalizirane.
- Neke odluke nižih sudova možda nisu objavljene na odluke.sudovi.hr.
- EUR-Lex pokriva dokumente dostupne u hrvatskom prijevodu - dio starijih akata može biti dostupan samo na engleskom ili francuskom.