Taris: UI asistent, kjer podatki ostanejo pri stranki

2026-06-26 · Sintaris · taris, rag, on-prem, ollama, vendor-neutral, smb, ai-platform

Taris: UI asistent, kjer podatki ostanejo pri stranki

TL;DR. Taris je UI asistent, pri katerem podatki stranke ne odidejo k ponudniku. Osnovno načelo: model je vtičnik za stabilnim vmesnikom — ne center arhitekture. Znotraj: nevtralni LLM-razpošiljatelj, hibridni RAG (BM25 + gosta + RRF + prečni encoder rerank), večnajemniški Postgres s pgvector, po želji lokalni modeli prek Ollame. Ta članek opisuje, kako je Taris zgrajen, zakaj je tako zgrajen — in kje to prinaša prednosti za MSP v EU in SND.

1. Problem: „Vzamemo GPT-4 — in pozabimo na vse"

Ko lastnik malega podjetja vpraša „kateri UI asistent naj namestimo?", navadno dobi enega od dveh skrajnih odgovorov:

Taris je tretja pot: produktizirana osnova (razpošiljatelj modelov, hibridni RAG, večnajemniški Postgres, adapterji kanalov), ki jo uvedemo za stranko in pustimo pri stranki. Ne SaaS. Ne „gradimo iz nič." Polprodukt, ki ga je jasno prilagoditi.

2. Za koga je to relevantno

3. Pogosta napaka

Kar vidimo v 70 % „pilotov", začetih pred nami:

4. Tehnični pristop: Kaj je v Tarisu

Arhitektura — štiri neodvisne plasti:

flowchart LR
  subgraph Kanali
    TG[Telegram Bot]
    WEB[Spletni UI / PWA]
    VOICE[Glas]
    API[REST API]
  end
  subgraph Jedro
    GW[FastAPI Gateway]
    ORCH[Orkestrator agentov]
    DISP[LLM Razpošiljatelj]
    KB[Storitev KB]
    AUTH[Overjanje + RBAC]
  end
  subgraph Shramba
    PG[(Postgres + pgvector)]
    OBJ[(MinIO / S3)]
    LOG[(Revizijski dnevnik)]
  end
  subgraph Modeli
    LOCAL[Ollama / llama.cpp]
    CLOUD[OpenAI / Anthropic / Gemini / YandexGPT]
  end
  TG --> GW
  WEB --> GW
  VOICE --> GW
  API --> GW
  GW --> AUTH --> ORCH
  ORCH --> KB --> PG
  ORCH --> DISP
  DISP --> LOCAL
  DISP --> CLOUD
  ORCH --> LOG

Vsaka plast je zamenljiva — to je ključna točka. Kanali so adapterji. Model je vtičnik. Shramba je zaledni sistem. Orkestrator je edino mesto, kjer živi poslovna logika. Če OpenAI jutri potroji cene, Taris-namestitev preklopi z eno konfiguracijsko datoteko.

4.1. LLM-razpošiljatelj

class LLMProvider(Protocol):
    async def complete(
        self,
        messages: list[ChatMessage],
        *,
        max_tokens: int,
        temperature: float,
        tools: list[Tool] | None = None,
    ) -> ChatCompletion: ...

Sedem konkretnih ponudnikov: OpenAI, Anthropic, Gemini, YandexGPT, OpenRouter, Ollama, llama.cpp. Usmerjanje prek YAML:

default: openrouter:openai/gpt-4o-mini
routes:
  - match: { task: rerank }
    use:   ollama:bge-reranker-base
  - match: { task: summary, locale: ru }
    use:   yandexgpt:latest
  - match: { sensitive: true }
    use:   ollama:llama3.1:8b
fallback:
  - openrouter:anthropic/claude-3-5-sonnet
  - ollama:llama3.1:8b

4.2. Hibridni RAG z RRF

Pridobivanje — tri prehodne stopnje:

  1. Leksikalno (BM25) — Postgres FTS z jezikovno zavednim analizatorjem za RU/EN/DE/SL.
  2. Gosto — pgvector kosinus, privzeto text-embedding-3-small, za on-prem — bge-m3.
  3. Ojačanje metapodatkov — točno ujemanje pri oznakah (product, section, last_updated).

Združevanje — Reciprocal Rank Fusion:

$$ \text{score}(d) = \sum_{i \in \text{retrievers}} \frac{1}{k + \text{rank}_i(d)}, \quad k = 60 $$

Nato prečni encoder rerank (bge-reranker-base) na top-5. Empirični dobiček na našem internem zlatem setu o varnosti pri delu: recall@5 0,71 → 0,88 (RRF v primerjavi z gosto samo), stopnja utemeljenosti +0,07 po rerankanju. To ni „malce boljše" — to je razlika med „uporabno" in „vrniti denar stranki."

4.3. Večnajemniški Postgres z RLS

CREATE POLICY tenant_isolation ON chunks
  USING (tenant_id = current_setting('app.tenant_id')::int);

Vsaka povezava pred poizvedbo nastavi SET app.tenant_id = $1. Nemogoče je po naključju prebrati podatke drugega najemnika: baza podatkov to uveljavi sama.

5. Tabela: Katere komponente so zamenljive

Plast Privzeto Alternativa Stroški zamenjave
Vdelava text-embedding-3-small bge-m3 konfiguracija + re-indeksiranje
Rerankator bge-reranker-base mxbai-rerank konfiguracija
Vektorska shramba pgvector Qdrant docker-compose + migracija
LLM gpt-4o-mini claude-3-5-sonnet, llama3.1:8b konfiguracija
Kanal Telegram Splet / VK / Slack / WhatsApp adapter ~200 vrstic
Shramba datotek MinIO S3 / Nextcloud konfiguracija
Namestitev Docker Compose Kubernetes / Nomad manifesti

6. SINTARIS mini primer

Produkt Worksafety Superassistant je primer Taris v realni namestitvi. Naloga:

Tehnična izvedba:

Metrike po 90 dneh:

Podrobnosti: Worksafety § 6 RAG pipeline in OpenClaw § 8 AI dispatch.

7. Kontrolni seznam (15 točk) pri izbiri UI asistenta za MSP

  1. Vezanost na ponudnika preverjena: ali lahko v tednu dni zamenjate ponudnika LLM?
  2. Podatki — kje so dokumenti stranke fizično shranjeni?
  3. Vdelave — kje so shranjene? (pogosto pozabljeno: so tudi izpeljanke osebnih podatkov)
  4. DPA podpisan z vsakim ponudnikom LLM, ki ga uporabljate.
  5. Eval-set — ali ga imate, in koliko vprašanj je v njem?
  6. Navajanje virov — ali sistem generira sklicevanja na vire?
  7. Stopnja utemeljenosti — ali je izmerjena? (Če ne — nihče ne ve, ali model laže)
  8. Regresija pridobivanja testirana po vsaki spremembi poziva?
  9. Večnajemniška varnost — RLS na ravni baze podatkov, ne „dogovorjeno v kodi"?
  10. Lokalni modeli na voljo — ali obstaja načrt B, ko oblak pade?
  11. Strošek na žeton — nadziran v realnem času?
  12. DSAR + izbris — implementirano kot koda, ne ročni postopek?
  13. Revizijski dnevnik — prisoten, nespremenljiv, z zahtevanim rokom hrambe?
  14. Kanali — je dodajanje novega kanala < 500 vrstic ali prepisovanje jedra?
  15. Dokumentacija — v katerem jeziku, za koga, kako pogosto posodobljena?

8. Tveganja

9. Kaj storiti naprej

Če že imate UI asistenta in je čas za zamenjavo — izvajamo UI-revizijo za 900–4500 €. Če želite preizkusiti Taris — obstaja UI-pilot v 4–8 tednih za 3000–12000 € s fiksnim obsegom. −25 % za slovenska podjetja od 1. do 30. junija 2026 — glejte pakete.

Če želite najprej prebrati — oglejte si poglavja KB Taris (celoten opis) in OpenClaw (on-prem topologija).

10. Viri


Sintaris izvaja UI-revizije procesov, UI-pilote in implementacije Taris za MSP v EU in SND. Odkrivalni klic — brezplačno, 30 minut.