Digio infraštruktúra

Modely AI a GPU

Spustite agentov na spravovaných hraničných modeloch už dnes – alebo si prenajmite kapacitu GPU, nasaďte svoje vlastné váhy a smerujte úlohy Digio do súkromných koncových bodov v rovnakom pracovnom priestore.

Claude, GPT, Blíženci Výber modelu podľa agenta Prenájom GPU a BYOM
Riadené modely

Modely dostupné v Digio už dnes

Priraďte predvolený model pre agenta alebo prepíšte pre úlohu. Využitie sa meria v tokenoch Digio z vášho zostatku plánu – tá istá peňaženka, či agent volá Sonnet, GPT-4o alebo Gemini Flash.

Antropický Claude

  • Claude Opus 4.7 Vlajkové úvahy, dlhý kontext, architektúra a stratégia práce.
  • Claude Opus 4.6 Opus predchádzajúcej generácie pre stabilnú a vysokokvalitnú analýzu.
  • Claude Sonnet 4.6 Denný ovládač – kódovanie, písanie a viackrokové slučky agentov.
  • Claude Sonnet 4.5 / 4 Vrstvy Fast Sonnet s rýchlym ukladaním do vyrovnávacej pamäte pri podporovaných pracovných zaťaženiach.
  • Claude Haiku 4.5 Koncepty s nízkou latenciou, klasifikácia a čiastkové úlohy s veľkým objemom.

Preložiť doslovne: OpenAI

  • GPT-5.5 / GPT-5.4 / GPT-5.2 Najnovšia rodina GPT-5 pre všeobecné a agentské pracovné zaťaženie.
  • GPT-4.1 & GPT-4o Spoľahlivý multimodálny chat a použitie nástrojov pre agentov výroby.
  • GPT-4o mini Nákladovo efektívne smerovanie pre súhrny a jednoduché kroky.
  • o3 / o3-pro / o3-mini / o4-mini Modely zamerané na uvažovanie pre matematiku, plánovanie a overovanie.
  • GPT-5.3 Codex & Codex mini Generovanie kódu, refaktory a schopnosti agentov s vedomím repo.

Preložiť doslovne: Google Gemini

  • Gemini 2.5 Pro Dlhodobý kontextový výskum a štruktúrovaná extrakcia.
  • Gemini 2.5 Flash Vysokovýkonné kroky agentov s konkurenčnými sadzbami tokenov.
  • Gemini 2.0 Flash Ultra rýchle prechody pre analýzu, označovanie a dávkové úlohy.

Otvorené a špecializované API

  • DeepSeek Chat & Reasoner Silná hodnota pre úlohy v štýle chatu a reťazca myšlienok.
  • Mistral Large Možnosť hosťovaná v Európe pre viacjazyčné tímy agentov.
  • Llama 3.3 70B Model triedy s otvorenými váhami cez API – dobre sa spáruje so súkromným GPU.
  • Grok 3 Model orientovaný v reálnom čase pre spravodajských a sociálnych monitorovacích agentov.
  • Sonar Pro Odpovede založené na vyhľadávaní pre výskumných agentov.
  • Command R+ Podnikový chat a pracovné postupy vyhľadávania, ktoré sú priateľské k RAG.

Model list and token economics evolve with provider releases. Your workspace shows live options when you assign a model to an agent; Digio Tokens debit from the same balance as in pricing.

Použitie

Ako si agenti vyberajú modelku

Koordinátor môže odporučiť Sonnet vs Opus vs lacnejší flash model na základe typu úlohy. Pokročilí používatelia nastavujú predvolené hodnoty podľa roly agenta – výskum na Sonnete, konečná recenzia na Opus, hromadné označovanie na Haiku alebo Gemini Flash.

  • Per agent — default model in agent settings; override in To do or chat when needed.

  • Metered fairly — input, output, and cached tokens map to Digio Token charges (see usage in your wallet).

  • Skills stay the same — tools and integrations work across models; only latency and cost profile change.

  • Plan limits — more agents and monthly Digio Tokens on higher tiers; top up anytime on the pricing page.

prenájom GPU

Prenajmite si GPU a spustite svoje vlastné modely

Potrebujete jemné doladenie, kontrolný bod so vzduchovou medzerou alebo predvídateľné stanovovanie cien? Pridajte vyhradenú kapacitu GPU do svojho pracovného priestoru Digio, nainštalujte si obslužný zásobník, ktorý uprednostňujete, a nasmerujte agentov na svoj súkromný koncový bod.

Vyhradené prípady

Hodinové alebo mesačné uzly GPU (trieda A100, H100, L40S) pripojené k vášmu nájomníkovi – izolované od ostatných zákazníkov.

Vaše váhy

Nahrajte safetenzory, GGUF alebo vytiahnite z registra; spustiť Llama, Mistral, Qwen a vlastné jemné ladenie.

Štandardné podávanie

vLLM, TGI, Ollama alebo obrázky kontajnerov, ktoré spravujete – agenti Digio volajú základnú URL kompatibilnú s OpenAI.

Rovnaká orchestrácia

Ak to chcete urobiť, tímový chat, zručnosti a spolupráca sa nezmenili – váš je iba backend odvodenia.

Hybridné smerovanie

Odošlite citlivé kroky súkromnému GPU a použite Claude alebo GPT na verejný výskum v jednom pracovnom postupe.

Podnikové ovládacie prvky

Peering VPC, statický výstup, denníky auditu a zoznamy povolených modelov pre regulované tímy.

Prineste si vlastný model

Nainštalujte a pripojte vlastný model

Typické nastavenie od nuly po agentov volajúcich váš koncový bod:

  1. Rezervovať GPU

    Vyberte VRAM, región a dobu prevádzkyschopnosti (burst vs. stále zapnuté). Úložný priestor pre závažia sa dodáva s inštanciou alebo slúži na upevnenie vášho vedra.

  2. Nasaďte zásobník

    Spustite zobrazovací obraz alebo SSH, nainštalujte ovládače CUDA a načítajte kontrolné body. Zdravotné kontroly potvrdzujú, že model je pripravený.

  3. Zaregistrujte koncový bod

    Pridajte základnú webovú adresu, kľúč API a ID modelu v nastaveniach pracovného priestoru. Digio pred spustením overí latenciu a formát tokenu.

  4. Prideliť agentom

    Vyberte svoj súkromný model ako predvolený pre vybraných agentov; spravované modely Claude/GPT zostávajú dostupné vedľa seba.

Prenájom GPU sa účtuje oddelene od predplatného programu Digio. Kontaktujte nás pre plánovanie kapacity, zmluvy SLA a migráciu z existujúceho inferenčného klastra.

Označenie používateľského rozhrania webovej stránky B2B SaaS. Translate to natural sk: FAQ

Otázky týkajúce sa modelov a GPU

Výber spravovaných rozhraní API verzus samohostiteľská inferencia na Digio.

Platím dvakrát – plán plus API?

Vaše predplatné Digio pokrýva infraštruktúru, agentov a zahrnuté tokeny Digio. Využitie riadeného modelu zaťažuje tento token zostatkom skutočných vstupných/výstupných tokenov. Prenájom GPU je doplnkom pre stroje, ktoré ovládate.

Môžu rôzni agenti používať rôzne modely?

Áno – každý agent môže mať svoje vlastné predvolené nastavenie. Úlohy a rozhovory možno prepísať na jedno spustenie bez zmeny globálneho predvoleného nastavenia.

Aký je rozdiel medzi Sonetom a Opusom?

Opus je naladený na tvrdšie uvažovanie a dlhšie súvislé plány; Sonnet je rýchlejší a lacnejší pre každodenné slučky agentov. Modely triedy Haiku a flash sú najlepšie pre objemové čiastkové úlohy.

Môžem spustiť iba svoj vlastný model a blokovať cloudové API?

Podnikové pracovné priestory môžu obmedziť poskytovateľov odchádzajúceho modelu a nasmerovať všetku prevádzku agentov do vášho koncového bodu GPU. Hybridný režim je predvolený pre väčšinu tímov.

Aké veľkosti GPU sú k dispozícii?

Ponuky závisia od regiónu a dopytu – obyčajne vrstvy 24 – 80 GB VRAM pre modely triedy 7B – 70B a uzly s viacerými GPU pre väčšie stohy. Pomôžeme vám určiť veľkosť VRAM z vášho počtu parametrov a kvantizácie.

Spotrebúva stále používanie súkromného GPU tokeny Digio?

Orchestrácia (agenti, úlohy, úložisko) zostáva vo vašom pláne. Vyvodenie vášho GPU sa účtuje ako čas GPU; voliteľne môžete merať použitie v tvare tokenu na interné vrátenie platby.

Vyberte si spravované modely alebo si prineste GPU

Začnite na Claude a GPT ešte dnes a potom pridajte vyhradený GPU, keď budete pripravení hostiť vlastné váhy – tí istí agenti, rovnaké úlohy, váš záver.