UI in osebni podatki: Kaj je dovoljeno in kaj povzroča globe

2026-05-24 · Sintaris · ai, gdpr, 152-fz, dpia, rag, privacy, on-prem

UI in osebni podatki: Kaj je dovoljeno in kaj povzroča globe

TL;DR. Če vaš projekt UI zadeva podatke oseb v EU — velja GDPR. Če podatke oseb v Rusiji — velja 152-FZ. Če obe skupini — oba zakona hkrati. V večini primerov se to ne reši z „izbiro prave oblačne storitve", ampak z arhitekturo pipeline-a: kje leži dokument, kje vektorji, kje poziv, kam gre zahtevek do LLM-ja, kdo vidi dnevnike. Sledi praktična analiza vzorcev, ki prestanejo revizije, in tistih, ki ne — na podlagi izkušenj SINTARIS pri uvajanju sistemov RAG v EU in SND.

1. Problem: „Povežimo ChatGPT z našim CRM-jem"

Ta zahteva pride pri skoraj vsakem prvem projektu. V podjetju že sedi CRM z imeni strank, telefonskimi številkami, včasih medicinskimi ali finančnimi podrobnostmi. Nekdo je videl demo ChatGPT — in naloga je: „Naredite, da bo prodajnik vprašal — in sistem odgovoril."

Tehnično je to dva dni dela. Pravno je to potencialna globa do 4 % svetovnega prometa po GDPR (člen 83) in/ali do 18 milijonov rubljev po spremenjenem 152-FZ. In to ni teoretična grožnja — Roskomnadzor in evropski nadzorni organi (BfDI v Nemčiji, Garante v Italiji) že izrekajo takšne globe za „posredovanje osebnih podatkov tretji osebi brez pravne podlage."

Cilj tega članka je pokazati, da meja ni tam, kjer jo navadno rišejo („OpenAI = slabo, lokalni LLM = dobro"). Meja je v tem, kako natančno podatki tečejo skozi sistem — kateri postanejo vaš upravljalec, kateri obdelovalec — in kje morate imeti dokumentirano pravno podlago.

2. Za koga je to relevantno

Mala in srednja podjetja s podatki strank: klinike, šole, odvetniki, agencije, B2B-prodaja, vsaka e-trgovina.
Startupe, ki so „hitro vključili GPT" v produkt, pravni pregled pa odložili za pozneje.
Vodjem IT-oddelkov, ki jim poslovanje prinese idejo o UI-asistentU in vpraša: „Kdaj bomo uvedli?"
Samostojnim svetovalcem in strokovnjakom, ki svojo strokovnost unovčujejo prek UI-bota z naročnino.

Če vaš scenarij ne vsebuje nobenega imena stranke, e-poštnega naslova, številke računa ali diagnoze — tega članka ne potrebujete. Če vsebuje kar koli od navedenega — ga potrebujete.

3. Pogosta napaka

Vzorec, ki smo ga videli desetkrat:

Izvoz CRM-ja v CSV.
Nalaganje v indeks RAG prek standardnega n8n-delovnega toka.
Klic gpt-4o prek OpenAI API-ja zgoraj.
Prodajnik zapiše v Telegram: „Kaj smo lani meseca razpravljali z Novakom?" — bot odgovori.
Vse deluje, demo je uspel, naročnik je zadovoljen.

Zakaj je to nesprejemljivo z vidika regulatorjev:

Posredovanje osebnih podatkov tretji osebi brez pravne podlage. OpenAI postane obdelovalec, a brez DPA (pogodbe o obdelavi podatkov) in brez analize: kje fizično stojijo strežniki, kako dolgo se hranijo zahtevki (privzeto — da, hranijo se), kdo ima dostop.
Namen obdelave ni opredeljen in evidentiran. GDPR zahteva za vsako kategorijo podatkov izrecen in evidentiran namen. „Prodajniku lažje" ni namen.
Načelo minimizacije podatkov je kršeno. V indeks je šlo bistveno več, kot je potrebno za odgovarjanje na določen razred vprašanj.
DPIA (ocena učinka na varstvo podatkov) ni bila opravljena, čeprav je za „sistematično avtomatizirano obdelavo velikih količin osebnih podatkov" obvezna (člen 35 GDPR).

4. Tehnični pristop: Kje potegniti mejo

Ključna ideja, ki jo ponavljamo pri vsaki reviziji: Meja osebnih podatkov v sistemu UI mora biti vidna na arhitekturni shemi. Če ni vidna — je ni.

Osnovni model, ki ga uporabljamo:

[Surovi podatki] → [Sloj anonimizacije] → [Indeksiranje RAG]
                                         ↓
                                [Samo anonimni vektorji]
                                         ↓
                                [Zahtevek LLM-ju: brez imen]

Štirje pristopi, razvrščeni po ravni varnosti:

Pristop	Osebni podatki gredo do LLM-ja?	Skladnost z GDPR	Primer uporabe
Popolna anonimizacija pred indeksiranjem	Ne	Da	Znanjska baza brez osebnih podatkov
Psevdonimizacija + strogo upravljanje dostopa	Delno	Pogojno	Notranje analize
LLM na kraju samem (on-prem)	Ne (ostane lokalno)	Da	Regulirane panoge
Cloud LLM + DPA + SCCs	Da (z zaščito)	Pogojno	Kadar on-prem ni možen

4.1. Kontrolni seznam DPIA (kdaj je obvezna)

Po členu 35 GDPR je DPIA potrebna pri:

Sistematičnem ocenjevanju osebnih vidikov z avtomatizirano obdelavo.
Obdelavi posebnih kategorij podatkov v velikem obsegu.
Sistematičnem nadzoru javnih območij.

Za sisteme UI to pomeni: skoraj vedno, ko obdelujete podatke CRM-ja, medicinske podatke ali komunikacijske dnevnike.

5. Arhitekturni vzorci, ki prestanejo revizije

Vzorec 1: Popolni on-prem (priporočen za regulirane panoge)

Celoten tehnološki sklad na lastni infrastrukturi stranke: Ollama za sklepanje LLM, pgvector za shranjevanje vektorjev, MinIO za dokumente. Nobeni podatki ne zapustijo internega omrežja.

Vzorec 2: Hibridna arhitektura (neobčutljivi kontekst v oblak)

Samo anonimizirani ali neosebni kontekst se pošlje oblakom LLM. Osebni deli baze ostanejo na kraju samem. Uresničljivo s slojem usmerjanja, ki občutljive kontekste obdela lokalno.

Vzorec 3: Oblak + popolna dokumentacija za skladnost

Kadar on-prem ni možen: podpisati DPA z vsakim ponudnikom oblaka, dokumentirati pravno podlago za vsako kategorijo podatkov, opraviti in dokumentirati DPIA, pri prenosih v tretje države predvideti SCC (standardne pogodbene klavzule).

6. SINTARIS mini primer

Produkta Maria — obvestilnik naročil klinike in Clinic assistant prikazujeta ta pristop v praksi. Naloga: pacient mora prek Telegrama potrditi uro, prestaviti naročilo in prejeti kopijo recepta. Običajna skuvšina: vzeti gpt-4o-mini, mu hraniti celoten PostgreSQL CRM — in to je to.

Tehnična izvedba:

LLM se uporablja samo za razvrstitvev namena (confirm / reschedule / cancel / question / emergency).
V poziv gre: vrsta sporočila (besedilo / govor → prepis) + ime pacienta (ne polno ime) + mesto. Brez diagnoz, brez receptov, brez številk zavarovalnih polic.
Rezervacija sama — deterministična koda, ki prebere proste termine iz koledarja in neposredno zapiše v CRM.
Predaja recepta — ločen delovni tok: pacient se avtenticira z enkratno kodo, dokument se dostavi prek varnega kanala, dogodek se zapiše v revizijski dnevnik.

Rezultat: Stroški LLM — približno 2 €/mesec (razvrstitev so kratke zahteve), klici na recepcijo so se zmanjšali za 40–50 %, pravna dokumentacija se ujema na eni strani, ker osebni podatki fizično ne zapustijo perimetra.

Architekturne podrobnosti — v poglavju KB Clinic assistant § 9 „Security & data boundary“.

7. Kontrolni seznam (15 točk) pred začetkom UI-projekta z osebnimi podatki

Pravna podlaga za vsako kategorijo podatkov je opredeljena (člen 6 GDPR).
DPIA opravljena in dokumentirana, kjer je potrebna.
DPA podpisan z vsakim zunanjim ponudnikom, ki ima dostop do podatkov.
Minimizacija podatkov: samo minimum, ki je potreben za namen obdelave.
Informacije o lokaciji shranjevanja: fizična lokacija strežnika za vsako kategorijo podatkov je dokumentirana.
Roki hrambe za dnevnike in vektorje so določeni in tehnično uveljavljeni.
Klasifikacija podatkov: kateri so posebne kategorije po členu 9 GDPR?
Anonimizacija/psevdonimizacija pred posredovanjem oblakom LLM.
Delovni tok DSAR (dostop, izbris, popravek) kot koda.
Dnevnik revizije — nespremenljiv, z rokom hrambe.
Nadzor dostopa na ravni baze podatkov (RLS, ne samo na ravni aplikacije).
Šifriranje v mirovanju in med prenosom.
Ocena tveganja dobaviteljev za vsako UI-storitev v skladu.
Postopek pri kršitvah podatkov — kako se kršitev zazna in prijavi?
Vključen pooblaščenec za varstvo podatkov (kadar je zahtevano po GDPR).

8. Tveganja

Past „anonimizacija zadostuje." Šibko anonimizirani podatki (odstranjeno samo ime, a kombinacija naslova + poklica + starosti) so lahko re-identificirani. Preverite tveganja re-identifikacije vašega pristopa.
Vektorji kot osebni podatki. Vgradi vectorji se lahko delno invertirajo (Carlini et al., 2023). Vektorske baze podatkov obravnavajte kot baze osebnih podatkov.
Shranjevanje dnevnikov LLM. Preverite pravilnik o beleženju vašega ponudnika oblaka LLM. Mnogi privzeto shranjujejo pozive. To je prenos podatkov.
Rast obsega. Projekti, ki se začnejo s „samo interni dokumenti," v šestih mesecih prejmejo podatke strank v sistem. Vzpostavite postopek upravljanja od začetka.

9. Kaj storiti naprej

Če že imate UI-rešitev in ste negotovi glede skladnosti — prvi korak je UI-revizija (900–4500 €). Pregledamo arhitekturo, identificiramo podatkovne poti in dostavimo prednostni seznam ukrepov.

Če začenjate nov projekt — pri UI-pilotu (3000–12000 €, 4–8 tednov) že od začetka vgradimo arhitekturo, skladno s predpisi.

−25 % za slovenska podjetja od 1. do 30. junija 2026 — glejte pakete.

10. Viri

Uredba (EU) 2016/679 (GDPR) — zlasti čl. 6, 9, 13, 35, 83.
Zvezni zakon št. 152-FZ „O osebnih podatkih" (različica 2024), čl. 13.11 ZP RF.
ENISA (2022). Data Protection Engineering.
Carlini, N. et al. (2023). Extracting Training Data from ChatGPT. arXiv:2301.13188.
ICO (2023). Guidance on AI and Data Protection.
Lewis, P. et al. (2020). RAG for Knowledge-Intensive NLP Tasks. arXiv:2005.11401.

Sintaris izvaja UI-revizije, UI-pilote in implementacije Taris za MSP v EU in SND. Odkrivalni klic — brezplačno, 30 minut.