FLUX.1 díky optimalizaci pro TensorRT přináší až 2x rychlejší běh a nižší zátěž VRAM

Blog RTX AI Garage představuje spolupráci společnosti NVIDIA s Black Forest Labs, jednou z předních světových výzkumných institucí zabývajících se AI. Její model FLUX.1 Kontext [dev], je díky tomu nyní optimalizován pro využití na GPU RTX s použitím NVIDIA TensorRT.

FLUX.1 Kontext [dev] kombinuje generování a úpravy obrázků v jediném intuitivním pracovním postupu. Na rozdíl od tradičních přístupů, které vyžadují složité kombinace modelů a řídicích sítí, umožňuje uživatelům řídit úpravy krok za krokem pomocí přirozeného jazyka a referenčních obrázků. Není nutné žádné dolaďování nebo složité nastavení. Mezi klíčové vlastnosti patří:

  • Konzistence postav: Zachování jedinečných rysů napříč scénami.
  • Lokalizované úpravy: Můžete změnit konkrétní prvky, aniž byste ovlivnili celý obraz.
  • Přenos stylu: Použití vzhledu referenčního obrázku na nové scény
  • Výkon v reálném čase: Generování s nízkou latencí podporuje rychlé opakování a zpětnou vazbu

Akcelerace na GPU RTX pomocí TensorRT přináší až 2x rychlejší inference a výrazně nižší spotřebu VRAM. Proč je to důležité?

  • Úpravy v reálném čase: Optimalizace TensorRT umožňují interaktivní úpravy v reálném čase na systémech poháněných RTX.
  • Intuitivní iterace: Cílené změny – předefinování detailů, zachování konzistence znaků nebo přenesení stylů bez ztráty kvality nebo tvůrčí kontroly.
  • Zjednodušení pracovních postupů: Eliminace potřeby více modelů nebo složitých postupů. Vše od generování obrázků až po jemné úpravy probíhá v jednom zjednodušeném a dostupném nástroji.
  • Škálovatelná přístupnost: Díky otevřeným váhám dostupným v Hugging Face a bezproblémové integraci do nástrojů, jako je ComfyUI, může více lidí experimentovat, vytvářet prototypy a zavádět pokročilá řešení pro úpravu obrázků .

FLUX.1 Kontext [dev] je k dispozici na Hugging Face (Torch a TensorRT). Nadšenci do AI, kteří mají zájem o testování těchto modelů, si mohou stáhnout varianty Torch a používat je v programu ComfyUI. Společnost Black Forest Labs také zpřístupnila online playground pro testování modelu. Mikroslužba NVIDIA NIM se očekává v srpnu. Pro pokročilé uživatele a vývojáře NVIDIA pracuje na vzorovém kódu pro snadnou integraci pipeline TensorRT do pracovních postupů. Repozitář DemoDiffusion vyjde ještě tento měsíc.

Stable Diffusion s nižšími nároky na VRAM a vyšším výkonem na RTX GPU

Stable Diffusion 3.5 je jedním z nejvýkonnějších modelů pro generování obrázků, které jsou v současné době k dispozici a které dokáží převést psaný vstup na fotorealistické vizuály.

RTX AI Garage, rozebírá, jak se společnosti NVIDIA a Stability AI spojily, aby byl SD3.5 rychlejší, lehčí a přístupnější na počítačích a pracovních stanicích s RTX. Díky kvantizaci modelu na přesnost FP8 pomocí NVIDIA TensorRT nyní SD3.5 Large vyžaduje pouze ~11 GB VRAM, což představuje 40% snížení. A běží až 2,3x rychleji ve srovnání s BF16 PyTorch. Tím se odemyká lokální nárůst výkonu pro širší škálu systémů.

Mezi hlavní výhody patří:

  • Nižší nároky na VRAM : Stabilní Diffusion 3.5 Large nyní potřebuje pouze 11 GB VRAM, takže je praktické pro mnohem více notebooků a stolních počítačů.
  • Vyšší výkon: Akcelerace TensorRT zdvojnásobuje nebo téměř zdvojnásobuje rychlost inference pro modely Large i Medium.
  • Optimalizováno pro nejnovější GPU RTX: GeForce RTX řady 40 a 50 a RTX PRO s architekturami Ada a Blackwell jsou nyní díky vylepšeným jádrům Tensor ještě lépe vybaveny pro zpracování těchto modelů.
  • Nová sada TensorRT for RTX SDK : K dispozici je nyní samostatná sada SDK s 8x menší velikostí instalace a just-in-time (JIT) enginem pro snadnější nasazení .
Exit mobile version