Předmět poptávky zahrnuje zejména: GPU Infrastruktura a Model Serving: Provozování lightweight GPU instancí (T4/L4) pro lokální hostování modelů. Implementace nástroje vLLM pro paralelní obsluhu embedding modelu (multilingual-e5-large) a velkých jazykových modelů (Gemma 3 12B / Llama 3.1 8B). Vývoj REST API pro
completedProgramování programového vybavení a poradenské služby