Hewlett Packard Enterprise představuje komplexní portfolio pro generativní umělou inteligenci
Společnost Hewlett Packard Enterprise (HPE) na konferenci NVIDIA GTC oznámila aktualizaci jednoho z nejkomplexnějších oborových portfolií s nativní umělou inteligencí. Záměrem je podpořit provoz aplikací generativní umělé inteligence (GenAI), deep learningu a strojového učení (ML). Mezi aktualizace patří:
- Dostupnost dvou společně vyvinutých řešení GenAI od společností HPE a NVIDIA.
- Náhled na software HPE Machine Learning Inference.
- Referenční architektura pro podnikové vyhledávání rozšířené o generování (RAG).
- Podpora vývoje budoucích produktů založených na nové architektuře NVIDIA Blackwell.
„Abychom dodrželi náš slib o GenAI a efektivně využili celý životní cyklus AI, musí být řešení ze své podstaty hybridní,“ řekl Antonio Neri, prezident a generální ředitel společnosti HPE a dodal: „Umělá inteligence je hybridní cloudovou pracovní zátěží. Pomocí ní se modely trénují a ladí jak v on-premises, tak v kolokačním centru nebo veřejném cloudu a nechybí možnost provádět inferenci na okraji sítě. Se společností NVIDIA spolupracujeme dlouhodobě na inovacích, a nadále budeme dodávat navržená softwarová a hardwarová řešení využívající umělou inteligenci, která firmám pomáhá urychlit vývoj a nasazení GenAI“.
„Generativní umělá inteligence dokáže proměnit data z připojených zařízení, data center a cloudů na poznatky, které mohou být průlomovými skrz celé odvětví,“ uvedl Jensen Huang, zakladatel a generální ředitel společnosti NVIDIA a dodal: „Se společností HPE dále rozvíjíme spolupráci, což podnikům umožní dosáhnout nebývalé produktivity pomocí využití jejich soukromých dat k vývoji a nasazení nových aplikací poháněných umělou inteligencí a změní jejich podnikání“.
Výcvik a ladění GenAI s využitím superpočítačů
Superpočítačové řešení HPE pro generativní AI, oznámené na konferenci SC23, je k dispozici pro organizace hledající předem nakonfigurované a vyzkoušené řešení pro vývoj a trénování velkých modelů AI. Vytvořeno je na míru zákazníkům, kteří chtějí urychlit své projekty v oblasti GenAI a deep learningu. Pohání ho NVIDIA technologie a může podporovat až 168 čipů GH200 Grace Hopper SuperChip. Řešení umožňuje velkým podnikům, výzkumným institucím a vládním subjektům zefektivnit proces vývoje modelů díky softwarovému balíku pro AI/ML, který pomáhá urychlit projekty v oblasti generativní umělé inteligence a deep learningu, včetně velkých jazykových modelů (LLM), doporučovacích systémů a vektorových databází. Toto řešení dodáváno se službami a nastavením na klíč je určeno k použití ve výzkumných AI centrech a velkých podnicích s cílem zkrátit dobu potřebnou k dosažení návratnosti investic a dvakrát až třikrát zrychlit výcvik. Další informace jsou k dispozici zde.
Ladění a inference GenAI pro velké podniky
Řešení společnosti HPE pro podniky zaměřené na generativní umělou inteligenci, které bylo poprvé uvedeno na konferenci Discover Barcelona 2023, je dostupné na přímo nebo prostřednictvím služby HPE GreenLake s flexibilním a škálovatelným modelem platby za použití. Předkonfigurované řešení bylo vyvinuto se společností NVIDIA, a je navrženo tak, aby zkrátilo dobu implementace a snížilo náklady tím, že nabídne kombinaci výpočetního výkonu, úložiště, softwaru, sítě a konzultačních služeb, které organizace potřebují k tvorbě aplikací s GenAI. Toto kompletní řešení poskytuje rychlost, škálovatelnost a kontrolu potřebnou k přizpůsobení základních modelů s využitím soukromých dat a nasazení aplikací GenAI v rámci hybridního cloudu.
Díky vysoce výkonnému výpočetnímu AI clusteru a softwaru od společností HPE a NVIDIA je řešení ideální pro nenáročné doladění modelů, RAG (retrieval-augmented generation) a škálování inference. Doba doladění modelu Llama 2 se 70 miliardami parametrů provozovaného na tomto řešení lineárně klesá s počtem uzlů a na 16 uzlovém systému trvá pouhých šest minut. Rychlost a výkon podnikům přinese rychlejší návratnosti investic díky vylepšené produktivitě prostřednictvím aplikací s AI, jako jsou virtuální asistenti, inteligentní chatboti a firemní vyhledávání.
Řešení je založeno na serverech HPE ProLiant DL380a Gen11 s předkonfigurovanými grafickými procesory NVIDIA, síťovým připojením přes platformu NVIDIA Spectrum-X Ethernet a jednotkami NVIDIA BlueField-3 DPUs. Kromě platformy strojového učení a analytiky HPE je obohaceno o software NVIDIA AI Enterprise 5.0 s novou NVIDIA NIM mikroslužbou pro optimalizované odvozování generativních modelů umělé inteligence a NVIDIA NeMo Retriever a další datové rámce a AI knihovny.
Experti společnosti HPE Services pomohou podnikům s návrhem, nasazením a správou řešení, včetně nastavení použití vhodných technik ladění modelů, a to s cílem pomoci překlenout nedostatek odborníků na umělou inteligenci. Další informace jsou k dispozici zde.
Od prototypu k produktivitě
Společnosti HPE a NVIDIA spolupracují na softwarových řešeních, která pomohou podnikům udělat další krok a přeměnit experimentální projekty v oblasti AI a ML do produkce. Software HPE Machine Learning Inference, dostupný v rámci technologického náhledu, umožňuje organizacím rychle a bezpečně nasazovat ML modely ve velkém měřítku. Nová nabídka je propojena s knihovnami NVIDIA a poskytuje předem sestavené kontejnery s optimalizovanými základními modely NVIDIA.
Firmám, které potřebují rychle budovat a nasazovat GenAI aplikace využívající vlastní data, vytvořila společnost HPE referenční architekturu pro podnikový RAG. Založena je na mikroslužbě NVIDIA NeMo Retriever. Nabídka se skládá z komplexního datového základu HPE Ezmeral Data Fabric Software a HPE GreenLake pro File Storage. Nová referenční architektura poskytne podnikům plán pro tvorbu chatovacích robotů, generátorů nebo kopilotů na míru.
S cílem pomoci s přípravou dat, trénováním AI a inferenci, řešení spojuje celé spektrum open-sourcových nástrojů a řešení HPE Ezmeral Unified Analytics Software a software HPE AI, který zahrnuje software pro správu dat strojového učení HPE, vývojové prostředí pro strojové učení HPE a nový software pro inferenci strojového učení HPE. Software HPE pro umělou inteligenci je k dispozici jak na superpočítačích HPE, tak na podnikových výpočetních řešeních pro GenAI, aby podnikům poskytl konzistentní prostředí pro správu jejich pracovních úloh v oblasti umělé inteligence.
Řešení nové generace postavené na architektuře NVIDIA Blackwell
Společnost HPE bude budoucí produkty vyvíjet na nově oznámené architektuře NVIDIA Blackwell, která obsahuje inferenční engine pro zrychlení pracovních úloh GenAI. Další podrobnosti a dostupnost chystaných produktů HPE se superčipem NVIDIA GB200 Grace Blackwell, HGX B200 a HGXB100 budou oznámeny později.