FLUX.2 zlepšuje kvalitu lokálně generovaných obrázků. RTX PC nabízejí důležité optimalizace pro hladký chod

Black Forest Labs dnes oznámili FLUX.2, novou rodinu modelů pro generování obrázků, které dokážou lokálně na RTX PC vytvářet fotorealistické obrázky v rozlišení až 4 megapixely.
Obsah generovaný pomocí FLUX.2 představuje výrazný posun v kvalitě zobrazení: nabídne realistické světlo, přesnější fyziku a až čtyřnásobné rozlišení oproti běžným modelům, čímž je potlačen typický „AI vzhled“. Velikost těchto modelů však může zatěžovat běžný hardware na hranici možností. Proto NVIDIA ve spolupráci s autory představuje důležité optimalizace už při vydání:

FP8 kvantizace: NVIDIA a Black Forest Labs zde využívají přesnost FP8, čímž snižují požadavky na VRAM o 40 %, přičemž kvalita obrazu zůstala srovnatelná.

Vylepšený „weight streaming“: NVIDIA ve spolupráci s ComfyUI vylepšila funkci, která umožňuje spouštět velmi velké modely na GPU GeForce RTX tím, že přesouvá část dat do systémové RAM, když je paměť GPU nedostatečná.

Každý může na své GeForce RTX začít s novými modely experimentovat. Stačí aktualizovat ComfyUI a získat šablony FLUX.2 nebo navštívit stránku Black Forest Labs na Hugging Face a stáhnout model weights.

Více podrobností o konfiguraci těchto optimalizací a nastavení pro maximální výkon na PC s GeForce RTX najdete v aktuálním blogu RTX AI Garage.

FLUX.1 díky optimalizaci pro TensorRT přináší až 2x rychlejší běh a nižší zátěž VRAM

Blog RTX AI Garage představuje spolupráci společnosti NVIDIA s Black Forest Labs, jednou z předních světových výzkumných institucí zabývajících se AI. Její model FLUX.1 Kontext [dev], je díky tomu nyní optimalizován pro využití na GPU RTX s použitím NVIDIA TensorRT.

FLUX.1 Kontext [dev] kombinuje generování a úpravy obrázků v jediném intuitivním pracovním postupu. Na rozdíl od tradičních přístupů, které vyžadují složité kombinace modelů a řídicích sítí, umožňuje uživatelům řídit úpravy krok za krokem pomocí přirozeného jazyka a referenčních obrázků. Není nutné žádné dolaďování nebo složité nastavení. Mezi klíčové vlastnosti patří:

  • Konzistence postav: Zachování jedinečných rysů napříč scénami.
  • Lokalizované úpravy: Můžete změnit konkrétní prvky, aniž byste ovlivnili celý obraz.
  • Přenos stylu: Použití vzhledu referenčního obrázku na nové scény
  • Výkon v reálném čase: Generování s nízkou latencí podporuje rychlé opakování a zpětnou vazbu

Akcelerace na GPU RTX pomocí TensorRT přináší až 2x rychlejší inference a výrazně nižší spotřebu VRAM. Proč je to důležité?

  • Úpravy v reálném čase: Optimalizace TensorRT umožňují interaktivní úpravy v reálném čase na systémech poháněných RTX.
  • Intuitivní iterace: Cílené změny – předefinování detailů, zachování konzistence znaků nebo přenesení stylů bez ztráty kvality nebo tvůrčí kontroly.
  • Zjednodušení pracovních postupů: Eliminace potřeby více modelů nebo složitých postupů. Vše od generování obrázků až po jemné úpravy probíhá v jednom zjednodušeném a dostupném nástroji.
  • Škálovatelná přístupnost: Díky otevřeným váhám dostupným v Hugging Face a bezproblémové integraci do nástrojů, jako je ComfyUI, může více lidí experimentovat, vytvářet prototypy a zavádět pokročilá řešení pro úpravu obrázků .

FLUX.1 Kontext [dev] je k dispozici na Hugging Face (Torch a TensorRT). Nadšenci do AI, kteří mají zájem o testování těchto modelů, si mohou stáhnout varianty Torch a používat je v programu ComfyUI. Společnost Black Forest Labs také zpřístupnila online playground pro testování modelu. Mikroslužba NVIDIA NIM se očekává v srpnu. Pro pokročilé uživatele a vývojáře NVIDIA pracuje na vzorovém kódu pro snadnou integraci pipeline TensorRT do pracovních postupů. Repozitář DemoDiffusion vyjde ještě tento měsíc.

Stable Diffusion s nižšími nároky na VRAM a vyšším výkonem na RTX GPU

Stable Diffusion 3.5 je jedním z nejvýkonnějších modelů pro generování obrázků, které jsou v současné době k dispozici a které dokáží převést psaný vstup na fotorealistické vizuály.

RTX AI Garage, rozebírá, jak se společnosti NVIDIA a Stability AI spojily, aby byl SD3.5 rychlejší, lehčí a přístupnější na počítačích a pracovních stanicích s RTX. Díky kvantizaci modelu na přesnost FP8 pomocí NVIDIA TensorRT nyní SD3.5 Large vyžaduje pouze ~11 GB VRAM, což představuje 40% snížení. A běží až 2,3x rychleji ve srovnání s BF16 PyTorch. Tím se odemyká lokální nárůst výkonu pro širší škálu systémů.

Mezi hlavní výhody patří:

  • Nižší nároky na VRAM : Stabilní Diffusion 3.5 Large nyní potřebuje pouze 11 GB VRAM, takže je praktické pro mnohem více notebooků a stolních počítačů.
  • Vyšší výkon: Akcelerace TensorRT zdvojnásobuje nebo téměř zdvojnásobuje rychlost inference pro modely Large i Medium.
  • Optimalizováno pro nejnovější GPU RTX: GeForce RTX řady 40 a 50 a RTX PRO s architekturami Ada a Blackwell jsou nyní díky vylepšeným jádrům Tensor ještě lépe vybaveny pro zpracování těchto modelů.
  • Nová sada TensorRT for RTX SDK : K dispozici je nyní samostatná sada SDK s 8x menší velikostí instalace a just-in-time (JIT) enginem pro snadnější nasazení .
Exit mobile version