UI in osebni podatki: Kaj je dovoljeno in kaj povzroča globe
UI in osebni podatki: Kaj je dovoljeno in kaj povzroča globe
TL;DR. Če vaš projekt UI zadeva podatke oseb v EU — velja GDPR. Če podatke oseb v Rusiji — velja 152-FZ. Če obe skupini — oba zakona hkrati. V večini primerov se to ne reši z „izbiro prave oblačne storitve", ampak z arhitekturo pipeline-a: kje leži dokument, kje vektorji, kje poziv, kam gre zahtevek do LLM-ja, kdo vidi dnevnike. Sledi praktična analiza vzorcev, ki prestanejo revizije, in tistih, ki ne — na podlagi izkušenj SINTARIS pri uvajanju sistemov RAG v EU in SND.
1. Problem: „Povežimo ChatGPT z našim CRM-jem"
Ta zahteva pride pri skoraj vsakem prvem projektu. V podjetju že sedi CRM z imeni strank, telefonskimi številkami, včasih medicinskimi ali finančnimi podrobnostmi. Nekdo je videl demo ChatGPT — in naloga je: „Naredite, da bo prodajnik vprašal — in sistem odgovoril."
Tehnično je to dva dni dela. Pravno je to potencialna globa do 4 % svetovnega prometa po GDPR (člen 83) in/ali do 18 milijonov rubljev po spremenjenem 152-FZ. In to ni teoretična grožnja — Roskomnadzor in evropski nadzorni organi (BfDI v Nemčiji, Garante v Italiji) že izrekajo takšne globe za „posredovanje osebnih podatkov tretji osebi brez pravne podlage."
Cilj tega članka je pokazati, da meja ni tam, kjer jo navadno rišejo („OpenAI = slabo, lokalni LLM = dobro"). Meja je v tem, kako natančno podatki tečejo skozi sistem — kateri postanejo vaš upravljalec, kateri obdelovalec — in kje morate imeti dokumentirano pravno podlago.
2. Za koga je to relevantno
- Mala in srednja podjetja s podatki strank: klinike, šole, odvetniki, agencije, B2B-prodaja, vsaka e-trgovina.
- Startupe, ki so „hitro vključili GPT" v produkt, pravni pregled pa odložili za pozneje.
- Vodjem IT-oddelkov, ki jim poslovanje prinese idejo o UI-asistentU in vpraša: „Kdaj bomo uvedli?"
- Samostojnim svetovalcem in strokovnjakom, ki svojo strokovnost unovčujejo prek UI-bota z naročnino.
Če vaš scenarij ne vsebuje nobenega imena stranke, e-poštnega naslova, številke računa ali diagnoze — tega članka ne potrebujete. Če vsebuje kar koli od navedenega — ga potrebujete.
3. Pogosta napaka
Vzorec, ki smo ga videli desetkrat:
- Izvoz CRM-ja v CSV.
- Nalaganje v indeks RAG prek standardnega n8n-delovnega toka.
- Klic
gpt-4oprek OpenAI API-ja zgoraj. - Prodajnik zapiše v Telegram: „Kaj smo lani meseca razpravljali z Novakom?" — bot odgovori.
- Vse deluje, demo je uspel, naročnik je zadovoljen.
Zakaj je to nesprejemljivo z vidika regulatorjev:
- Posredovanje osebnih podatkov tretji osebi brez pravne podlage. OpenAI postane obdelovalec, a brez DPA (pogodbe o obdelavi podatkov) in brez analize: kje fizično stojijo strežniki, kako dolgo se hranijo zahtevki (privzeto — da, hranijo se), kdo ima dostop.
- Namen obdelave ni opredeljen in evidentiran. GDPR zahteva za vsako kategorijo podatkov izrecen in evidentiran namen. „Prodajniku lažje" ni namen.
- Načelo minimizacije podatkov je kršeno. V indeks je šlo bistveno več, kot je potrebno za odgovarjanje na določen razred vprašanj.
- DPIA (ocena učinka na varstvo podatkov) ni bila opravljena, čeprav je za „sistematično avtomatizirano obdelavo velikih količin osebnih podatkov" obvezna (člen 35 GDPR).
4. Tehnični pristop: Kje potegniti mejo
Ključna ideja, ki jo ponavljamo pri vsaki reviziji: Meja osebnih podatkov v sistemu UI mora biti vidna na arhitekturni shemi. Če ni vidna — je ni.
Osnovni model, ki ga uporabljamo:
[Surovi podatki] → [Sloj anonimizacije] → [Indeksiranje RAG]
↓
[Samo anonimni vektorji]
↓
[Zahtevek LLM-ju: brez imen]
Štirje pristopi, razvrščeni po ravni varnosti:
| Pristop | Osebni podatki gredo do LLM-ja? | Skladnost z GDPR | Primer uporabe |
|---|---|---|---|
| Popolna anonimizacija pred indeksiranjem | Ne | Da | Znanjska baza brez osebnih podatkov |
| Psevdonimizacija + strogo upravljanje dostopa | Delno | Pogojno | Notranje analize |
| LLM na kraju samem (on-prem) | Ne (ostane lokalno) | Da | Regulirane panoge |
| Cloud LLM + DPA + SCCs | Da (z zaščito) | Pogojno | Kadar on-prem ni možen |
4.1. Kontrolni seznam DPIA (kdaj je obvezna)
Po členu 35 GDPR je DPIA potrebna pri:
- Sistematičnem ocenjevanju osebnih vidikov z avtomatizirano obdelavo.
- Obdelavi posebnih kategorij podatkov v velikem obsegu.
- Sistematičnem nadzoru javnih območij.
Za sisteme UI to pomeni: skoraj vedno, ko obdelujete podatke CRM-ja, medicinske podatke ali komunikacijske dnevnike.
5. Arhitekturni vzorci, ki prestanejo revizije
Vzorec 1: Popolni on-prem (priporočen za regulirane panoge)
Celoten tehnološki sklad na lastni infrastrukturi stranke: Ollama za sklepanje LLM, pgvector za shranjevanje vektorjev, MinIO za dokumente. Nobeni podatki ne zapustijo internega omrežja.
Vzorec 2: Hibridna arhitektura (neobčutljivi kontekst v oblak)
Samo anonimizirani ali neosebni kontekst se pošlje oblakom LLM. Osebni deli baze ostanejo na kraju samem. Uresničljivo s slojem usmerjanja, ki občutljive kontekste obdela lokalno.
Vzorec 3: Oblak + popolna dokumentacija za skladnost
Kadar on-prem ni možen: podpisati DPA z vsakim ponudnikom oblaka, dokumentirati pravno podlago za vsako kategorijo podatkov, opraviti in dokumentirati DPIA, pri prenosih v tretje države predvideti SCC (standardne pogodbene klavzule).
6. SINTARIS mini primer
Produkta Maria — obvestilnik naročil klinike in Clinic assistant prikazujeta ta pristop v praksi. Naloga: pacient mora prek Telegrama potrditi uro, prestaviti naročilo in prejeti kopijo recepta. Običajna skuvšina: vzeti gpt-4o-mini, mu hraniti celoten PostgreSQL CRM — in to je to.
Tehnična izvedba:
- LLM se uporablja samo za razvrstitvev namena (
confirm/reschedule/cancel/question/emergency). - V poziv gre: vrsta sporočila (besedilo / govor → prepis) + ime pacienta (ne polno ime) + mesto. Brez diagnoz, brez receptov, brez številk zavarovalnih polic.
- Rezervacija sama — deterministična koda, ki prebere proste termine iz koledarja in neposredno zapiše v CRM.
- Predaja recepta — ločen delovni tok: pacient se avtenticira z enkratno kodo, dokument se dostavi prek varnega kanala, dogodek se zapiše v revizijski dnevnik.
Rezultat: Stroški LLM — približno 2 €/mesec (razvrstitev so kratke zahteve), klici na recepcijo so se zmanjšali za 40–50 %, pravna dokumentacija se ujema na eni strani, ker osebni podatki fizično ne zapustijo perimetra.
Architekturne podrobnosti — v poglavju KB Clinic assistant § 9 „Security & data boundary“.
7. Kontrolni seznam (15 točk) pred začetkom UI-projekta z osebnimi podatki
- Pravna podlaga za vsako kategorijo podatkov je opredeljena (člen 6 GDPR).
- DPIA opravljena in dokumentirana, kjer je potrebna.
- DPA podpisan z vsakim zunanjim ponudnikom, ki ima dostop do podatkov.
- Minimizacija podatkov: samo minimum, ki je potreben za namen obdelave.
- Informacije o lokaciji shranjevanja: fizična lokacija strežnika za vsako kategorijo podatkov je dokumentirana.
- Roki hrambe za dnevnike in vektorje so določeni in tehnično uveljavljeni.
- Klasifikacija podatkov: kateri so posebne kategorije po členu 9 GDPR?
- Anonimizacija/psevdonimizacija pred posredovanjem oblakom LLM.
- Delovni tok DSAR (dostop, izbris, popravek) kot koda.
- Dnevnik revizije — nespremenljiv, z rokom hrambe.
- Nadzor dostopa na ravni baze podatkov (RLS, ne samo na ravni aplikacije).
- Šifriranje v mirovanju in med prenosom.
- Ocena tveganja dobaviteljev za vsako UI-storitev v skladu.
- Postopek pri kršitvah podatkov — kako se kršitev zazna in prijavi?
- Vključen pooblaščenec za varstvo podatkov (kadar je zahtevano po GDPR).
8. Tveganja
- Past „anonimizacija zadostuje." Šibko anonimizirani podatki (odstranjeno samo ime, a kombinacija naslova + poklica + starosti) so lahko re-identificirani. Preverite tveganja re-identifikacije vašega pristopa.
- Vektorji kot osebni podatki. Vgradi vectorji se lahko delno invertirajo (Carlini et al., 2023). Vektorske baze podatkov obravnavajte kot baze osebnih podatkov.
- Shranjevanje dnevnikov LLM. Preverite pravilnik o beleženju vašega ponudnika oblaka LLM. Mnogi privzeto shranjujejo pozive. To je prenos podatkov.
- Rast obsega. Projekti, ki se začnejo s „samo interni dokumenti," v šestih mesecih prejmejo podatke strank v sistem. Vzpostavite postopek upravljanja od začetka.
9. Kaj storiti naprej
Če že imate UI-rešitev in ste negotovi glede skladnosti — prvi korak je UI-revizija (900–4500 €). Pregledamo arhitekturo, identificiramo podatkovne poti in dostavimo prednostni seznam ukrepov.
Če začenjate nov projekt — pri UI-pilotu (3000–12000 €, 4–8 tednov) že od začetka vgradimo arhitekturo, skladno s predpisi.
−25 % za slovenska podjetja od 1. do 30. junija 2026 — glejte pakete.
10. Viri
- Uredba (EU) 2016/679 (GDPR) — zlasti čl. 6, 9, 13, 35, 83.
- Zvezni zakon št. 152-FZ „O osebnih podatkih" (različica 2024), čl. 13.11 ZP RF.
- ENISA (2022). Data Protection Engineering.
- Carlini, N. et al. (2023). Extracting Training Data from ChatGPT. arXiv:2301.13188.
- ICO (2023). Guidance on AI and Data Protection.
- Lewis, P. et al. (2020). RAG for Knowledge-Intensive NLP Tasks. arXiv:2005.11401.
Sintaris izvaja UI-revizije, UI-pilote in implementacije Taris za MSP v EU in SND. Odkrivalni klic — brezplačno, 30 minut.