Tento týden AI Decoded upozorňuje na nové nástroje pro vývojáře Windows, které byly oznámeny na konferenci Microsoft Ignite a které umožňují vytvářet a optimalizovat aplikace využívající umělou inteligenci na RTX AI PC.
- Model NVIDIA Nemovision-4B-Instruct, který bude brzy k dispozici, využívá nejnovější frameworky NVIDIA VILA a NVIDIA NeMo určené pro přenos znalostní databáze z velkých modelů na malé, odebírání nadbytečných parametrů a kvantizaci k tomu, aby na GPU RTX fungoval s požadovanou přesností.
- Společnost NVIDIA také brzy představí rodinu Mistral NeMo Minitron 128k Instruct, sadu velkokontextových malých jazykových modelů navržených pro optimalizované a efektivní digitální interakce s lidmi.
- NVIDIA také oznámila aktualizace nástroje NVIDIA TensorRT Model Optimizer (ModelOpt), který vývojářům umožňuje vytvářet modely umělé inteligence pro PC, které jsou při akcelerac GPU RTX rychlejší a přesnější. Vývojářům to usnadňuje nasazení v celém ekosystému PC využívajících ONNX Runtime.
Blog s podrobnostmi: https://blogs.