NVIDIA oznámila spolupráci s Googlem na optimalizaci nových otevřených modelů Gemma 4. Výsledkem bude jejich efektivní běh napříč AI infrastrukturou NVIDIA — od RTX PC a DGX Spark až po platformy Jetson a GPU architektury Blackwell.

Nové modely umožňují vývojářům i nadšencům využívat novou generaci lokálních AI aplikací na běžných zařízeních.

Rodina Gemma 4 představuje kompaktní modely podporující pokročilé uvažování, programování, multimodální porozumění i práci s různými nástroji, čímž otevírá cestu nové třídě lokálních AI aplikací. Mezi hlavní novinky patří:

  • Modely E2B a E4B: Ultra efektivní modely s malými nároky na výkon, navržené pro nízkou latenci a plně offline inferenci na hraničních zařízeních, jako jsou telefony nebo Jetson Orin Nano — ideální pro real-time a always-on AI scénáře.
  • Modely 26B a 31B: Výkonnější modely optimalizované pro pokročilé uvažování, programování a agentní workflow, které efektivně běží na grafických kartách NVIDIA RTX a systémech DGX Spark pro vývojářské a pracovní stanice.

Díky bezproblémové podpoře nástrojů, jako jsou Ollama a llama.cpp i frameworků jako OpenClaw a Unsloth Studio mohou uživatelé používat inteligentní agenty, kteří pracují s daty v reálném čase.

Více informací naleznete na blogu RTX AI Garage a na technologickém blogu NVIDIA.

Napsat komentář