Google Cloud ماشین های مجازی ابررایانه جدیدی A3 را معرفی می کند که برای تامین انرژی LLM ساخته شده اند

همانطور که در ماه‌های اخیر شاهد بودیم که LLM و هوش مصنوعی مولد در آگاهی ما فریاد می‌زنند، واضح است که این مدل‌ها برای آموزش و اجرا به مقدار زیادی قدرت محاسباتی نیاز دارند. با درک این موضوع، Google Cloud امروز در Google I/O یک ماشین مجازی ابررایانه جدید A3 را معرفی کرد.

A3 برای رسیدگی به نیازهای قابل توجه این موارد استفاده تشنه منابع ساخته شده است.

این شرکت در بیانیه‌ای نوشت: «VMهای GPU A3 برای ارائه بالاترین کارایی آموزش برای بارهای کاری امروزی ML، کامل با CPU مدرن، حافظه میزبان بهبودیافته، پردازنده‌های گرافیکی NVIDIA نسل بعدی و ارتقاء شبکه اصلی ساخته شده‌اند.

به طور خاص، این شرکت در حال تجهیز این ماشین‌ها به پردازنده‌های گرافیکی NVIDIA H100 و ترکیب آن با یک مرکز داده تخصصی برای به دست آوردن قدرت محاسباتی بسیار زیاد با توان پردازشی بالا و تأخیر کم است. یک بسته.

اگر به دنبال مشخصات هستید، در نظر بگیرید که از 8 پردازنده گرافیکی NVIDIA H100، پردازنده های نسل چهارم اینتل Xeon مقیاس پذیر، 2 ترابایت حافظه میزبان و پهنای باند دوبخشی 3.6 ترابایت بر ثانیه بین 8 پردازنده گرافیکی از طریق فناوری های NVSwitch و NVLink 4.0، دو تا NVIA طراحی شده است. به به حداکثر رساندن توان بین چند پردازنده گرافیکی مانند آنچه در این محصول وجود دارد کمک می کند.

این ماشین‌ها می‌توانند تا ۲۶ اگزافلاپس قدرت ارائه دهند که به بهبود زمان و هزینه مربوط به آموزش مدل‌های یادگیری ماشینی بزرگ‌تر کمک می‌کند. علاوه بر این، بارهای کاری روی این ماشین های مجازی در شبکه تخصصی مرکز داده مشتری گوگل اجرا می شود که این شرکت آن را به عنوان «26000 GPU بسیار به هم پیوسته» توصیف می کند. این “پیوندهای نوری قابل تنظیم مجدد با پهنای باند کامل را فعال می کند که می توانند توپولوژی را در صورت نیاز تنظیم کنند.” این شرکت می گوید این رویکرد همچنین باید به کاهش هزینه اجرای این حجم کاری کمک کند.

ایده این است که به مشتریان قدرت بسیار زیادی داده شود که برای آموزش بارهای کاری سخت‌تر طراحی شده است، خواه شامل مدل‌های یادگیری ماشینی پیچیده باشد یا LLMهایی که برنامه‌های مولد هوش مصنوعی را اجرا می‌کنند، و این کار را به روشی مقرون‌به‌صرفه‌تر انجام دهند.

گوگل A3 را به چند روش ارائه خواهد کرد: مشتریان می توانند آن را خودشان اجرا کنند، یا اگر ترجیح می دهند، به عنوان یک سرویس مدیریت شده که گوگل بیشتر کارهای سنگین را برای آنها انجام می دهد. رویکرد خود انجام دهید شامل اجرای ماشین‌های مجازی A3 در موتور گوگل کوبرنتس (GKE) و موتور محاسباتی گوگل (GCE) است، در حالی که سرویس مدیریت‌شده ماشین‌های مجازی A3 را بر روی Vertex AI، پلتفرم یادگیری ماشین مدیریت‌شده شرکت اجرا می‌کند.

در حالی که ماشین های مجازی A3 جدید امروز در Google I/O معرفی می شوند، فعلاً فقط با ثبت نام در لیست انتظار پیش نمایش در دسترس هستند.