همانطور که در ماههای اخیر شاهد بودیم که LLM و هوش مصنوعی مولد در آگاهی ما فریاد میزنند، واضح است که این مدلها برای آموزش و اجرا به مقدار زیادی قدرت محاسباتی نیاز دارند. با درک این موضوع، Google Cloud امروز در Google I/O یک ماشین مجازی ابررایانه جدید A3 را معرفی کرد.
A3 برای رسیدگی به نیازهای قابل توجه این موارد استفاده تشنه منابع ساخته شده است.
این شرکت در بیانیهای نوشت: «VMهای GPU A3 برای ارائه بالاترین کارایی آموزش برای بارهای کاری امروزی ML، کامل با CPU مدرن، حافظه میزبان بهبودیافته، پردازندههای گرافیکی NVIDIA نسل بعدی و ارتقاء شبکه اصلی ساخته شدهاند.
به طور خاص، این شرکت در حال تجهیز این ماشینها به پردازندههای گرافیکی NVIDIA H100 و ترکیب آن با یک مرکز داده تخصصی برای به دست آوردن قدرت محاسباتی بسیار زیاد با توان پردازشی بالا و تأخیر کم است. یک بسته.
اگر به دنبال مشخصات هستید، در نظر بگیرید که از 8 پردازنده گرافیکی NVIDIA H100، پردازنده های نسل چهارم اینتل Xeon مقیاس پذیر، 2 ترابایت حافظه میزبان و پهنای باند دوبخشی 3.6 ترابایت بر ثانیه بین 8 پردازنده گرافیکی از طریق فناوری های NVSwitch و NVLink 4.0، دو تا NVIA طراحی شده است. به به حداکثر رساندن توان بین چند پردازنده گرافیکی مانند آنچه در این محصول وجود دارد کمک می کند.
این ماشینها میتوانند تا ۲۶ اگزافلاپس قدرت ارائه دهند که به بهبود زمان و هزینه مربوط به آموزش مدلهای یادگیری ماشینی بزرگتر کمک میکند. علاوه بر این، بارهای کاری روی این ماشین های مجازی در شبکه تخصصی مرکز داده مشتری گوگل اجرا می شود که این شرکت آن را به عنوان «26000 GPU بسیار به هم پیوسته» توصیف می کند. این “پیوندهای نوری قابل تنظیم مجدد با پهنای باند کامل را فعال می کند که می توانند توپولوژی را در صورت نیاز تنظیم کنند.” این شرکت می گوید این رویکرد همچنین باید به کاهش هزینه اجرای این حجم کاری کمک کند.
ایده این است که به مشتریان قدرت بسیار زیادی داده شود که برای آموزش بارهای کاری سختتر طراحی شده است، خواه شامل مدلهای یادگیری ماشینی پیچیده باشد یا LLMهایی که برنامههای مولد هوش مصنوعی را اجرا میکنند، و این کار را به روشی مقرونبهصرفهتر انجام دهند.
گوگل A3 را به چند روش ارائه خواهد کرد: مشتریان می توانند آن را خودشان اجرا کنند، یا اگر ترجیح می دهند، به عنوان یک سرویس مدیریت شده که گوگل بیشتر کارهای سنگین را برای آنها انجام می دهد. رویکرد خود انجام دهید شامل اجرای ماشینهای مجازی A3 در موتور گوگل کوبرنتس (GKE) و موتور محاسباتی گوگل (GCE) است، در حالی که سرویس مدیریتشده ماشینهای مجازی A3 را بر روی Vertex AI، پلتفرم یادگیری ماشین مدیریتشده شرکت اجرا میکند.
در حالی که ماشین های مجازی A3 جدید امروز در Google I/O معرفی می شوند، فعلاً فقط با ثبت نام در لیست انتظار پیش نمایش در دسترس هستند.