انویدیا Rubin CPX، تراشه هوش مصنوعی قدرتمند NVIDIA معرفی شد

تراشه جدید انویدیا Rubin CPX با مشخصات رده بالا و جذاب خود معرفی شده است! این تراشه، پردازندههای مرکزی Vera CPU و پردازندههای گرافیکی Rubin GPU را ترکیب میکند و هدف آن پردازش در مقیاس بسیار بزرگ (Massive-Context Processing) عنوان شده است. برای آشنایی با این تراشه سوپرقدرتمند که نسل بعدی کارت گرافیکهای سرور را متحول خواهد کرد، با فالنیک همراه باشید!
تراشه انویدیا Rubin CPX استنتاج هوش مصنوعی را چندین برابر سریعتر میکند

پردازنده گرافیکی جدید NVIDIA با طراحی اختصاصی بههمراه پلتفرم نسل بعدی این غول دنیای تکنولوژی معرفی شده است. این پردازنده گرافیکی بهطور خاص برای پردازش زمینهای عظیم، کدنویسی نرمافزار مبتنی بر توکن و تولید ویدئوهای هوش مصنوعی مولد هدفگذاری شده است.
تراشه انویدیا Rubin CPX نسخه مشتقشده از پردازنده گرافیکی نسل بعدی Rubin انویدیا است که جانشین پردازندههای گرافیکی Blackwell بهشمار میآید. این تراشه برای استنتاج در زمینههای بسیار بزرگ طراحی شده است. از نظر کاربرد عملی، NVIDIA Rubin CPX بر دستیابی به بالاترین عملکرد و بیشترین درآمد مبتنی بر توکن در پردازشهای بلند مدت تمرکز دارد.
ارائهدهندگان هوش مصنوعی مولد مانند ChatGPT، Google Gemini و Perplexity خدمات خود را از طریق فروش توکن عرضه میکنند و مدلهای آنها پردازشها را انجام میدهند. یک کوئری ساده ممکن است 100 توکن هزینه دشته باشد، درحالیکه یک کوئری پیچیده با استدلال پیشرفته ممکن است بیش از 100 برابر توکن مصرف کند. هر چه یک ارائهدهنده بتواند توکنها را سریعتر و کارآمدتر پردازش کند، درآمد بیشتری تولید خواهد کرد.
به گفته شار ناراسیمهان (Shar Narasimhan)، مدیر محصول در گروه دیتاسنتر انویدیا، استنتاج اغلب بهعنوان یک گام منفرد در فرآیند هوش مصنوعی در نظر گرفته میشود، اما در واقع شامل 2 بار کاری است: فاز زمینه (Context) یا پر کردن اولیه (Prefill) و فاز رمزگشایی (Decode). هر یک از این دو فاز نیازمندیهای متفاوتی از زیرساخت هوش مصنوعی دارند.
فاز زمینه (پر کردن اولیه) محاسباتمحور و فاز رمزگشایی (تولید) حافظهمحور است. تا امروز پردازندههای گرافیکی مجبور بودند هر دو وظیفه را انجام دهند، درحالیکه در واقع تنها در یکی از آنها کارایی بالایی دارند. ناراسیمهان توضیح داد که تراشه انویدیا Rubin CPX بهطور ویژه برای بهبود عملکرد محاسباتی در فاز زمینه مهندسی شده است.
او افزود: «این تراشه بهطور چشمگیری بهرهوری و کارایی کارخانههای هوش مصنوعی را افزایش خواهد داد». این افزایش کارایی از طریق تولید انبوه توکنها محقق میشود. در هوش مصنوعی، بهویژه هوش مصنوعی مولد، توکنها معادل با واحدهای کاری هستند؛ بنابراین هر چه توکنهای بیشتری تولید شود، درآمد بیشتری حاصل خواهد شد.
مشخصات فنی تراشه انویدیا Rubin CPX، از توان پردازشی 30 پتافلاپس تا حافظه GDDR7
تراشه Rubin دارای دو دای (Die) با توان پردازشی 25 پتافلاپس به ازای هر دای است. همچنین این تراشه از اتصال NVLink پشتیبانی میکند و به 288 گیگابایت حافظه پرسرعت HBM4 مجهز است.
در مقابل، تراشه انویدیا Rubin CPX دارای یک دای (Die) با توان پردازشی 30 پتافلاپس است. این تراشه از NVLink پشتیبانی نمیکند و از 128 گیگابایت حافظه GDDR7 بهره میبرد. بنابراین Rubin CPX برای نیازهای خاص با زمینههای بزرگ که به حافظه زیادی نیاز ندارند، بهینه شده است. CPX نسبت به نسخه استاندارد Rubin ارزانتر خواهد بود، هرچند انویدیا قیمت آن را اعلام نکرده است.
مدلهای هوش مصنوعی ممکن است برای پردازش ویدئو، تا 1 میلیون توکن برای یک ساعت محتوا نیاز داشته باشند. تولید این میزان توکن میتواند ساعتها یا حتی روزها طول بکشد! هر چه سیستم بتواند توکنهای بیشتری تولید کند، شرایط برای پردازش در مقیاس بزرگتر فراهمتر خواهد بود.
تراشه انویدیا Rubin CPX تا 30 پتافلاپس توان پردازشی با دقت NVFP4 ارائه میدهد. این تراشه بهجای استفاده از حافظه HBM (که گرانتر است)، از 128 گیگابایت حافظه GDDR7 بهره میبرد. انویدیا میگوید GDDR7 کارایی کافی دارد و Rubin CPX نسبت به سیستمهای GB300 NVL72، سه برابر سرعت بیشتری در تواناییهای مربوط به حوزه Attention ارائه میدهد.
انویدیا Rubin CPX در پیکربندیهای مختلف عرضه میشود. از جمله Vera Rubin NVL144 CPX که میتواند با بستر محاسباتی مقیاسپذیر Quantum‐X800 InfiniBand ترکیب شود. همچنین امکان ترکیب این پیکربندی با پلتفرم شبکه اترنت Spectrum-XTM (همراه با فناوری Spectrum-XGS انویدیا و کارت شبکههای پرسرعت Nvidia ConnectX-9 SuperNIC) وجود دارد.
رک Vera Rubin NVL144 CPX، میزبان تراشه انویدیا Rubin CPX

انویدیا همچنین از یک رک جدید به نام Vera Rubin NVL144 CPX نیز رونمایی میکند. آقای ناراسیمهان در این رابطه گفت: «NVL144 CPX به ارائهدهندگان خدمات هوش مصنوعی این امکان را میدهد تا سودآوری خود را بهطور چشمگیری افزایش دهند؛ بهطوریکه به ازای هر 100 میلیون دلار سرمایهگذاری در زیرساخت، میتوانند تا 5 میلیارد دلار درآمد برای خود ایجاد کنند».
این سیستم در 2 پیکربندی عرضه میشود:
- پیکربندی تکرک: شامل 144 پردازنده گرافیکی Rubin CPX GPU، 144 پردازنده گرافیکی Rubin GPU و 36 پردازنده مرکزی Vera CPU. این پیکربندی در مجموع 8 اگزافلاپس توان محاسباتی NVFP4، همراه با 100 ترابایت حافظه سریع و 1.7 پتابایت در ثانیه پهنای باند حافظه را ارائه میدهد. انویدیا گفته است که این پیکربندی، 7.5 برابر سریعتر از مدل ردهبالای فعلی GB300 NVL72 است.
- پیکربندی دو رک: در این حالت، پردازندههای Vera CPU و Rubin GPU در یک رک قرار دارند و رک دوم بهطور اختصاصی به Rubin CPX برای پردازش زمینه (پر کردن اولیه) اختصاص داده میشود. بنابراین مشتریان میتوانند رکها را بدون سرور CPX، با سرورهای ترکیبی CPX یا با رک جداگانه CPX خریداری کنند.
انتظار میرود Nvidia Rubin CPX در پایان سال 2026 در دسترس باشد.