AI referenčná architektúra od F5
Marek Zacharda
Systems Engineer, F5
marek.zacharda@alef.com
Definícia a poslanie
Umelá inteligencia (AI) je odbor informatiky, ktorý sa zaoberá tvorbou systémov schopných vykonávať úlohy, ktoré typicky vyžadujú ľudskú inteligenciu — porozumenie jazyka, analýzu dát, rozhodovanie a generovanie obsahu. Dynamicky sa rozširuje využitie veľkých jazykových modelov (Large Language Models, LLM) a generatívnej AI (text, obrázky, multimodálne modely), ktoré vytvárajú nové výstupy na základe vstupných promptov a naučených vzorov.
Modely a agenti AI sú adoptované rýchlejšie než väčšina predchádzajúcich technológií. Hoci sa AI javí ako nový fenomén, jej vývoj má dlhodobé vedecké korene — výskum prebieha už desaťročia. Z pohľadu technologického a spoločenského vplyvu je najbližšou historickou paralelou rozmach internetu. Vývoj AI je však stále v počiatočnej fáze a jej aplikačný potenciál sa postupne naplno prejavuje.
Architektonické výzvy a zložky
AI aplikácie, najmä tie postavené na LLM, prinášajú do architektúry viacero nových komponentov oproti tradičným softvérovým aplikáciám. F5 vo svojich materiáloch zdôrazňuje, že popri inferencii (t.j. výpočte výstupov modelu – resp. použitie natrénovaného modelu na predpovedanie alebo rozhodovanie) sa pracuje najmä s:
- vektorovými databázami a indexmi — na rýchle vyhľadávanie vektorových dát
- Retrieval-Augmented Generation (RAG) —kombinácia externých relevantných dát s výstupmi modelu a zlepšuje presnosť aj aktuálnosť odpovedí
- API vrstvy a mikroservisy— AI komponenty sa typicky volajú ako služby cez REST/gRPC API, nasadené v kontajneroch alebo ako mikroslužby
- spracovaním veľkých dátových tokov, správa rôznych modelov, orchestráciou, monitoringom a bezpečnostnými vrstvami— naprieč celým reťazcom (pipeline).
Zraniteľnosť a bezpečnostné riziká AI
AI je jedna z najzraniteľnejších technológií nasadzovaných vo veľkom rozsahu. Objavujú sa nové typy útokov využívajúce špecifiká modelov:
- Prompt injection — vloženie škodlivých inštrukcií do promptu s cieľom manipulovať správanie modelu.
- Jailbreak attacks — obchádzanie bezpečnostných obmedzení modelu a nútenie generovať zakázaný/neetický obsah.
- Model stealing/distillation — nelegálne získavanie alebo replikovanie znalostí modelu s cieľom získať konkurenčnú výhodu alebo prístup k proprietárnym postupom.
- Data exfiltration — únik citlivých dát v dôsledku neoprávneného prístupu alebo manipulácie s modelom.
Dostupnosť a rozšírenie rizík
Keďže AI systémy sú široko dostupné, rozširuje sa spektrum rizikového správania: od neúmyselného šírenia nepresných informácií po úmyselné zneužitie.
Nepredvídateľnosť modelov
Modely AI sú nedeterministické — identický vstup nemusí viesť k identickému výstupu. To obmedzuje úplnú dôveru vo výsledky aj v samotné vstupy. Medzi prejavy patria:
- halucinácie — generovanie nepravdivých informácií prezentovaných ako fakty;
- únik dát (data leakage) — neúmyselné poskytnutie chránených informácií;
- eskalácia privilégií — získanie neoprávnených oprávnení alebo interných funkcií.
Projekt OWASP GenAI / OWASP LLM Top 10 identifikuje najkritickejšie riziká pri vývoji a nasadzovaní LLM. Podrobnosti:
F5 a AI
Nasadenie a varianty deploymentu
F5 v AI Reference Architecture opisuje štyri hlavné modely nasadenia:
- SaaS-hosted — model/služba poskytovaná treťou stranou ako SaaS; bez potreby správy infraštruktúry.
- Cloud-hosted — hostovanie vo verejnom cloude (AWS, Azure, Google) s flexibilným škálovaním a integráciou cloudových služieb.
- On-premises — nasadenie v privátnej infraštruktúre; vyššia kontrola, ale aj nároky na prevádzku.
- Edge-hosted — výpočty a inferencia bližšie k zdroju dát (IoT, kiosky); nižšia latencia a potenciálne vyššie súkromie.
Pri výbere modelu nasadenia treba zvážiť data gravity(teda umiestnenie množstva dát a ich potrebný presun z lokality na lokalitu), latenciu, náklady, spoľahlivosť, dostupnosť GPU, ako aj bezpečnostné požiadavky.
Oblasti rizík
Nižšie sú kľúčové oblasti, ktoré F5 prepája s bezpečnosťou a výkonnosťou AI architektúry — a zároveň adresuje hlavné riziká z:
- OWASP LLM Top 10
- Application Delivery Top 10 (F5)
- Dizajnové požiadavky (Design Requirements)
Referencia:
https://www.f5.com/resources/articles/the-application-delivery-top-10

Sedem stavebných blokov + bezpečnostné body
F5 definuje v AI kontexte sedem „building blocks“ — v každom bode odporúča začleniť ochranné vrstvy, sieťové služby (load balancery, L7 proxy, TLS akceleráciu) a kontroly integrity/viditeľnosti.
- Inferencia — proces generovania výstupu založeného na predtrénovaných AI modeloch Bezpečnosť: validácia vstupov, filtračné vrstvy, ochrana pred prompt injection a DoS.
- Inferencia s RAG — kombinácia inferencie s externými znalosťami (RAG) na zvýšenie presnosti a aktuálnosti. Bezpečnosť: správne spracovanie dát pred vstupom do modelu, zabezpečenie integrity údajov, dohľad nad tokmi a ochrana pred data poisoning.
- Integrácia externých služieb a agentov — prepojenie s externými API/službami; agentové správanie umožňuje autonómne rozhodnutia a kroky. Bezpečnosť: kontrola integrácií medzi používateľmi a dátami, presadzovanie pravidiel pre proprietárne a citlivé toky dát.
- RAG Corpus Management — údržba a aktualizácia znalostnej bázy pre RAG, organizácia neštruktúrovaných dát a zabezpečenie presnosti vyhľadávania. Bezpečnosť: bezpečnosť vkladania informácií, ochrana indexov, validácia vstupov do vyhľadávacej vrstvy.
- Jemné ladenie (Fine-tuning) — doladenie predtrénovaného modelu na špecifických datasetoch pre vyšší výkon v danom use-case. Bezpečnosť/prevádzka: monitorovanie, ochranné limity, detekcia anomálií v API volaniach, spoľahlivé vyvažovanie záťaže.
- Učenie — tréning modelu na veľkých datasetoch s iteráciami a optimalizáciami, aby sa vedel zovšeobecniť na nové údaje. Bezpečnosť: ochrana komponentov pred supply-chain útokmi, prevencia „backdoorov“, ochrana dát.
- Vývoj — tvorba, testovanie a nasadzovanie AI riešení; integrácia komponentov, škálovanie a produkčná pripravenosť. Prevádzka: optimalizácia latencie, presun výpočtov, geo-routovanie, bezpečné siete.
Praktické prínosy
Táto architektúra pomáha organizáciám:
- plánovať a nasadzovať AI aplikácie so zreteľom na škálovanie, diagnostiku úzkych miest a bezpečnostné riziká;
- zabezpečiť spoľahlivé fungovanie AI modelov v rôznych lokalitách (on-premises, cloud, edge);
- integrovať bezpečnostné opatrenia a sieťové služby priamo do AI reťazca.
Záver
Referenčná architektúra od F5 ponúka komplexný rámec pre bezpečné a efektívne nasadenie AI v širokej škále prostredí. Zvyšuje viditeľnosť, kontrolu a škálovateľnosť AI riešení.
Spoločnosť F5 pripravila aj interaktívnu mapu s popismi jednotlivých bodov AI architektúry:

https://www.f5.com/_internal-applications/reference-architecture/ai/diagrams/agentic-external-services-integration?view=insights
Zdrojový prehľad:
https://www.f5.com/resources/reference-architectures/ai-overview
Pre bližšie informácie nás neváhajte kontaktovať