On-prem AI model: kdy dává smysl a kdy ne
„Zakázali nám ChatGPT, protože kolega tam vkládal smlouvy." Tahle věta zazní v nějaké podobě na každém druhém meetingu. Reakce firem se dělí do dvou táborů - jedni AI úplně zakážou, druzí jdou do lokálního modelu, aniž by si položili otázku, jestli ho skutečně potřebují. Oba extrémy jsou špatně. Pojďme si rozložit, kdy on-prem AI skutečně dává smysl a kdy je to zbytečná komplikace.
Tři cesty, jak AI nasadit
Rozhodnutí o infrastruktuře AI není binární. V praxi existují tři varianty, které se volí podle citlivosti dat a compliance požadavků:
- Cloudové AI služby - volání do AI infrastruktury poskytovatele, typicky s EU regionem, zpracovatelskou smlouvou a jasnými pravidly pro retenci a použití dat.
- Privátní cloud v ČR nebo v infrastruktuře klienta - AI služba běží v izolované instanci u českého poskytovatele nebo v existujícím cloudovém účtu klienta.
- On-prem / lokální model - open-source model nasazený přímo u klienta, případně v hybridním nastavení (část zpracování lokálně, část v cloudu).
Každá varianta má své místo. Mýtus, že „lokální = bezpečnější = lepší", neplatí - má i své nevýhody, o kterých se málo mluví.
Kdy dává smysl cloudová AI
Pro většinu firemních procesů je cloud správná volba:
- Rychlé nasazení. Pilot můžete mít v provozu za týdny, ne měsíce.
- Nízké provozní náklady. Platíte za reálné využití, žádná investice do HW.
- Nejvyšší kvalita modelů. Nejvýkonnější frontier modely bývají dostupné jako cloudová služba dřív než jako lokálně provozovatelná varianta.
- Škálovatelnost. Objem vzroste desetinásobně, infrastruktura to ustojí bez vašeho zásahu.
Pokud jsou data, která do AI posíláte, obchodně citlivá, ale ne tajná - typicky dodavatelské faktury, atesty, normy, běžná obchodní korespondence - a máte uzavřenou zpracovatelskou smlouvu, je cloud nejracionálnější volba. Nejen z technického, ale i z ekonomického pohledu.
Kdy dává smysl privátní cloud
Privátní cloud (izolovaná instance u českého poskytovatele nebo v infrastruktuře klienta) je dobrá středí cesta pro firmy, kde:
- Interní IT politika neumožňuje zpracování dat mimo prostředí klienta.
- Compliance vyžaduje českou jurisdikci nebo aspoň EU region s přísnou kontrolou.
- Firma chce integraci s firemním IAM, logováním, auditem podle svých pravidel.
- Objem je dostatečný, aby se vyplatilo mít dedikovanou kapacitu.
Tahle varianta zachovává většinu výhod cloudu (kvalita modelů, škálování), ale dává víc kontroly nad tokem dat. Pro regulované odvětví (banky, pojišťovny, velké výrobní koncerny) to často bývá kompromis, se kterým projde interní IT schválení.
Kdy dává smysl on-prem
Lokální model ve vaší infrastruktuře má význam za specifických podmínek. Všechny by měly platit současně:
1. Data nesmí opustit firmu
Zdravotnická dokumentace, právní spisy, státní tajemství, průmyslové know-how s vysokou mírou utajení. U těchto dat není otázka, jestli cloudový poskytovatel „dává dobré garance" - interní nebo regulatorní pravidla prostě data ven nepustí.
2. Chcete model učit na vlastních datech
Tohle je jeden z nejsilnějších důvodů jít on-prem. Generický model nezná vaše zkratky, vaše číselníky, vaše zvyky. Lokální nebo dedikovaný model můžete ladit na vašich datech - a udělat z něj specialistu na konkrétní práci. V úloze, kterou řeší denně, pak může být praktičtější než obecný model bez doménového kontextu.
Data i provoz modelu zůstávají pod vaší kontrolou. Opravy od operátora se dají používat jako evaluační sada nebo tréninkový signál, pokud to odpovídá právům k datům a interním pravidlům. Kvalita pak může růst řízeně, ne nahodile.
3. Objem ospravedlní investici
On-prem vyžaduje HW infrastrukturu, integraci, provoz a údržbu. Pod určitým objemem (řekněme stovky dokumentů denně) je to dražší a komplikovanější než cloud. Nad tímto objemem se situace může obracet - menší specializovaný lokální model může být v provozu levnější než opakované volání velkého cloudového modelu.
4. Máte kompetenci nebo partnera, který se o to postará
On-prem model nejde nasadit a zapomenout. Vyžaduje monitoring, periodický refresh (data drift), verzování, evaluation pipeline. Pokud tohle nemá interní tým vlastník nebo externí partner, projekt se časem rozpadne.
Compliance paradox
Tady je zajímavá věc, která firmy překvapuje: v některých regulovaných oborech může být lokální model nejen akceptovatelný, ale provozně vhodnější než cloud.
Důvod: zdravotnictví, finance nebo právo často mají interní, smluvní nebo regulatorní omezení pro předávání dat třetím stranám. Mohou proto zvolit lokální model, ladit ho na interních datech a nasadit on-prem. Výsledek je:
- Data neopouštějí firmu.
- Znalost z oprav a evaluačních dat zůstává pod kontrolou firmy.
- Přesnost v konkrétní úloze může přesáhnout obecný model bez doménového kontextu.
- Provozní know-how je aktivum firmy, ne jen nastavení v cizí platformě.
U těchto odvětví nemusí být on-prem kompromis - může to být konkurenční výhoda.
Klíčový princip: lokální model a evaluační sada, které vycházejí z vašich dat a oprav, mohou být aktivum, ne jen operační náklad. V čase rostou v hodnotě, pokud je někdo systematicky udržuje.
Časté mýty
„On-prem je drahé." Záleží na horizontu. Za HW a nasazení se zaplatí víc na začátku. Ale při dostatečném objemu se infrastruktura zaplatí řádově v jednotkách měsíců - a pak může běžet v nižších jednotkových nákladech než cloudové volání.
„Cloudové modely jsou vždy lepší." Na generických úlohách často ano. Na úzce definované úloze s dobrou evaluační sadou může vyhrát specializované řešení. Klíčová otázka není jen „je model chytřejší", ale také „zná můj kontext".
„Musí se vybrat jedna cesta." Ne. Hybridní nasazení je běžné - citlivé dokumenty zůstávají lokálně, obecné úlohy (překlad, sumarizace) běží v cloudu. Workflow jen routuje požadavek tam, kam patří.
Jak se rozhodovat
Místo „cloud vs. on-prem" se ptejte:
- Jaké jsou nejcitlivější dokumenty v tomhle procesu? Pokud nesmí ven, máte odpověď na polovinu rozhodnutí.
- Chceme z vlastních dat udělat konkurenční výhodu? Pokud ano, on-prem s fine-tuningem má strategický smysl.
- Jaký je roční objem zpracovaných dokumentů? Pod několik tisíc ročně → cloud. Nad desítky tisíc měsíčně → začíná dávat smysl dedikovaná kapacita.
- Máme interní kapacitu nebo partnera pro údržbu? Bez tohoto on-prem postupně degraduje.
U firem, které řešíme, nejčastěji končíme u hybridního nasazení: workflow běží v privátním cloudu v ČR, citlivá místa využívají lokální model, obecné úlohy volají cloudovou službu. Architekturu ale vždy navrhujeme až v rámci auditu - ne jako výchozí produkt. Detaily najdete v sekci Bezpečnost.
Co si z toho odnést
On-prem není automaticky lepší ani horší než cloud. Je to nástroj pro specifické scénáře - a tam, kde sedí, může být levnější, přesnější a strategicky silnější než generické cloudové řešení.
Klíčové rozhodnutí neděláte ve chvíli, kdy si vybíráte poskytovatele. Děláte ho ve chvíli, kdy popisujete, jaká data, s jakým objemem, s jakou citlivostí a s jakým cílem chcete zpracovávat. Z toho vyplyne varianta. Ne naopak.