Pravne baze podataka
LexBox pretražuje 615.000+ pravnih vektora iz 6 javno dostupnih izvora.
Izvori podataka
EU zakonodavstvo (EUR-Lex)
AktivnoDirektive, uredbe, odluke i drugi pravni akti EU
Vektora: 346.000+
Izvor: eur-lex.europa.eu
Presude Suda EU (CURIA)
AktivnoPresude i mišljenja Suda EU i Općeg suda
Vektora: 111.000+
Izvor: curia.europa.eu
Zakoni i propisi RH
AktivnoZakoni, pravilnici, uredbe iz Narodnih novina
Vektora: 78.000+
Izvor: zakon.hr
Presude ECHR (HUDOC)
AktivnoPresude Europskog suda za ljudska prava
Vektora: 35.200+
Izvor: hudoc.echr.coe.int
Kako prikupljamo podatke
- 1Svi izvori su javno dostupne pravne baze - sudske odluke, zakoni i propisi objavljeni su na službenim portalima.
- 2Podaci se prikupljaju, obrađuju i dijele na semantičke cjeline (chunks) koje omogućuju precizno pretraživanje.
- 3Svaka cjelina se pretvara u vektorski embedding pomoću BGE-M3, višejezičnog modela optimiziranog za pravne tekstove.
- 4Vektori se pohranjuju u Qdrant vektorsku bazu podataka koja omogućuje brzo semantičko pretraživanje po značenju, a ne samo po ključnim riječima.
Ažuriranje baze
Baza podataka se redovito ažurira kako se objavljuju nove sudske odluke i zakonodavstvo. Trenutna svježina podataka: kontinuirana ažuriranja.
Broj vektora ne odgovara broju dokumenata. Jedan zakon ili presuda može sadržavati više vektora jer se dijeli na semantičke cjeline.
Poznata ograničenja
- Nisu sve sudske odluke digitalno dostupne, osobito starije odluke koje nisu digitalizirane.
- Neke odluke nižih sudova možda nisu objavljene na odluke.sudovi.hr.
- EUR-Lex pokriva dokumente dostupne u hrvatskom prijevodu - dio starijih akata može biti dostupan samo na engleskom ili francuskom.
- Integracija odluka Ustavnog suda RH (USRH) je u tijeku i bit će dostupna uskoro.