انویدیا Rubin CPX، تراشه هوش مصنوعی قدرتمند NVIDIA معرفی شد

سروش شکوئی‌پورتاریخ انتشار: 1404/06/25آخرین بروزرسانی: 1404/06/25

0 زمان مطالعه: 3 دقیقه

تراشه جدید انویدیا Rubin CPX با مشخصات رده بالا و جذاب خود معرفی شده است! این تراشه، پردازنده‌های مرکزی Vera CPU و پردازنده‌های گرافیکی Rubin GPU را ترکیب می‌کند و هدف آن پردازش در مقیاس بسیار بزرگ (Massive-Context Processing) عنوان شده است. برای آشنایی با این تراشه سوپرقدرتمند که نسل بعدی کارت گرافیک‌های سرور را متحول خواهد کرد، با فالنیک همراه باشید!

تراشه انویدیا Rubin CPX استنتاج هوش مصنوعی را چندین برابر سریع‌تر می‌کند

کاربرد انویدیا Rubin CPX در استنتاج هوش مصنوعی

پردازنده گرافیکی جدید NVIDIA با طراحی اختصاصی به‌همراه پلتفرم نسل بعدی این غول دنیای تکنولوژی معرفی شده است. این پردازنده گرافیکی به‌طور خاص برای پردازش زمینه‌ای عظیم، کدنویسی نرم‌افزار مبتنی بر توکن و تولید ویدئو‌های هوش مصنوعی مولد هدف‌گذاری شده است.

تراشه انویدیا Rubin CPX نسخه مشتق‌شده از پردازنده گرافیکی نسل بعدی Rubin انویدیا است که جانشین پردازنده‌های گرافیکی Blackwell به‌شمار می‌آید. این تراشه برای استنتاج در زمینه‌های بسیار بزرگ طراحی شده است. از نظر کاربرد عملی، NVIDIA Rubin CPX بر دستیابی به بالاترین عملکرد و بیشترین درآمد مبتنی بر توکن در پردازش‌های بلند مدت تمرکز دارد.

ارائه‌دهندگان هوش مصنوعی مولد مانند ChatGPT، Google Gemini و Perplexity خدمات خود را از طریق فروش توکن عرضه می‌کنند و مدل‌های آنها پردازش‌ها را انجام می‌دهند. یک کوئری ساده ممکن است 100 توکن هزینه دشته باشد، درحالی‌که یک کوئری پیچیده با استدلال پیشرفته ممکن است بیش از 100 برابر توکن مصرف کند. هر چه یک ارائه‌دهنده بتواند توکن‌ها را سریع‌تر و کارآمدتر پردازش کند، درآمد بیشتری تولید خواهد کرد.

به گفته شار ناراسیمهان (Shar Narasimhan)، مدیر محصول در گروه دیتاسنتر انویدیا، استنتاج اغلب به‌عنوان یک گام منفرد در فرآیند هوش مصنوعی در نظر گرفته می‌شود، اما در واقع شامل 2 بار کاری است: فاز زمینه (Context) یا پر کردن اولیه (Prefill) و فاز رمزگشایی (Decode). هر یک از این دو فاز نیازمندی‌های متفاوتی از زیرساخت هوش مصنوعی دارند.

فاز زمینه (پر کردن اولیه) محاسبات‌محور و فاز رمزگشایی (تولید) حافظه‌محور است. تا امروز پردازنده‌های گرافیکی مجبور بودند هر دو وظیفه را انجام دهند، درحالی‌که در واقع تنها در یکی از آنها کارایی بالایی دارند. ناراسیمهان توضیح داد که تراشه انویدیا Rubin CPX به‌طور ویژه برای بهبود عملکرد محاسباتی در فاز زمینه مهندسی شده است.

او افزود: «این تراشه به‌طور چشمگیری بهره‌وری و کارایی کارخانه‌های هوش مصنوعی را افزایش خواهد داد». این افزایش کارایی از طریق تولید انبوه توکن‌ها محقق می‌شود. در هوش مصنوعی، به‌ویژه هوش مصنوعی مولد، توکن‌ها معادل با واحدهای کاری هستند؛ بنابراین هر چه توکن‌های بیشتری تولید شود، درآمد بیشتری حاصل خواهد شد.

مشخصات فنی تراشه انویدیا Rubin CPX، از توان پردازشی 30 پتافلاپس تا حافظه GDDR7

تراشه Rubin دارای دو دای (Die) با توان پردازشی 25 پتافلاپس به ازای هر دای است. همچنین این تراشه از اتصال NVLink پشتیبانی می‌کند و به 288 گیگابایت حافظه پرسرعت HBM4 مجهز است.

در مقابل، تراشه انویدیا Rubin CPX دارای یک دای (Die) با توان پردازشی 30 پتافلاپس است. این تراشه از NVLink پشتیبانی نمی‌کند و از 128 گیگابایت حافظه GDDR7 بهره می‌برد. بنابراین Rubin CPX برای نیازهای خاص با زمینه‌های بزرگ که به حافظه زیادی نیاز ندارند، بهینه شده است. CPX نسبت به نسخه استاندارد Rubin ارزان‌تر خواهد بود، هرچند انویدیا قیمت آن را اعلام نکرده است.

مدل‌های هوش مصنوعی ممکن است برای پردازش ویدئو، تا 1 میلیون توکن برای یک ساعت محتوا نیاز داشته باشند. تولید این میزان توکن می‌تواند ساعت‌ها یا حتی روزها طول بکشد! هر چه سیستم بتواند توکن‌های بیشتری تولید کند، شرایط برای پردازش در مقیاس بزرگتر فراهم‌تر خواهد بود.

تراشه انویدیا Rubin CPX تا 30 پتافلاپس توان پردازشی با دقت NVFP4 ارائه می‌دهد. این تراشه به‌جای استفاده از حافظه HBM (که گران‌تر است)، از 128 گیگابایت حافظه GDDR7 بهره می‌برد. انویدیا می‌گوید GDDR7 کارایی کافی دارد و Rubin CPX نسبت به سیستم‌های GB300 NVL72، سه برابر سرعت بیشتری در توانایی‌های مربوط به حوزه Attention ارائه می‌دهد.

انویدیا Rubin CPX در پیکربندی‌های مختلف عرضه می‌شود. از جمله Vera Rubin NVL144 CPX که می‌تواند با بستر محاسباتی مقیاس‌پذیر Quantum‐X800 InfiniBand ترکیب شود. همچنین امکان ترکیب این پیکربندی با پلتفرم شبکه اترنت Spectrum-XTM (همراه با فناوری Spectrum-XGS انویدیا و کارت شبکه‌های پرسرعت Nvidia ConnectX-9 SuperNIC) وجود دارد.

رک Vera Rubin NVL144 CPX، میزبان تراشه انویدیا Rubin CPX

انویدیا همچنین از یک رک جدید به نام Vera Rubin NVL144 CPX نیز رونمایی می‌کند. آقای ناراسیمهان در این رابطه گفت: «NVL144 CPX به ارائه‌دهندگان خدمات هوش مصنوعی این امکان را می‌دهد تا سودآوری خود را به‌طور چشمگیری افزایش دهند؛ به‌طوری‌که به ازای هر 100 میلیون دلار سرمایه‌گذاری در زیرساخت، می‌توانند تا 5 میلیارد دلار درآمد برای خود ایجاد کنند».

این سیستم در 2 پیکربندی عرضه می‌شود:

پیکربندی تک‌رک: شامل 144 پردازنده گرافیکی Rubin CPX GPU، 144 پردازنده گرافیکی Rubin GPU و 36 پردازنده مرکزی Vera CPU. این پیکربندی در مجموع 8 اگزافلاپس توان محاسباتی NVFP4، همراه با 100 ترابایت حافظه سریع و 1.7 پتابایت در ثانیه پهنای باند حافظه را ارائه می‌دهد. انویدیا گفته است که این پیکربندی، 7.5 برابر سریع‌تر از مدل رده‌بالای فعلی GB300 NVL72 است.
پیکربندی دو رک: در این حالت، پردازنده‌های Vera CPU و Rubin GPU در یک رک قرار دارند و رک دوم به‌طور اختصاصی به Rubin CPX برای پردازش زمینه (پر کردن اولیه) اختصاص داده می‌شود. بنابراین مشتریان می‌توانند رک‌ها را بدون سرور CPX، با سرورهای ترکیبی CPX یا با رک جداگانه CPX خریداری کنند.

انتظار می‌رود Nvidia Rubin CPX در پایان سال 2026 در دسترس باشد.