کارت شبکه HPE InfiniBand MCX653106A-ECAT HDR100/Ethernet 100Gb 2-Port QSFP56 Adapter P06251-B21
–
مقدمه: ورود به عصر محاسبات Exascale با راهحلهای HDR InfiniBand
–
در عصر کنونی، که مرزهای دانش توسط شبیهسازیهای عظیم علمی، مدلهای یادگیری عمیق و تحلیلهای کلانداده جابهجا میشود، تقاضا برای توان محاسباتی و پهنای باند شبکه به طور تصاعدی در حال افزایش است. دیتاسنترهای مدرن برای همگام شدن با این نیازها، نه تنها به پردازندهها و شتابدهندههای سریعتر، بلکه به یک بستر ارتباطی نیاز دارند که بتواند دادهها را با کمترین تأخیر و بالاترین بازده بین هزاران گره محاسباتی جابهجا کند. در این چشمانداز، فناوری InfiniBand به عنوان ستون فقرات بسیاری از سریعترین ابررایانههای جهان، نقشی بیبدیل ایفا میکند. کارت شبکه HPE InfiniBand HDR100/Ethernet 100Gb 2-Port QSFP56 Adapter با شماره قطعه MCX653106A-ECAT و پارت نامبر P06251-B21، یک راهحل پیشرفته است که با بهرهگیری از نسل جدید فناوری HDR InfiniBand و مبتنی بر کنترلر NVIDIA Mellanox ConnectX-6، عملکردی استثنایی را برای خوشههای محاسباتی با کارایی بالا (HPC)، زیرساختهای هوش مصنوعی (AI) و محیطهای ذخیرهسازی پیشرفته به ارمغان میآورد.
این آداپتور دو پورته که از طریق رابط QSFP56 متصل میشود، قادر است تا ۲۰۰ گیگابیت بر ثانیه پهنای باند دوطرفه (با احتساب مجموع دو پورت) را با تأخیری زیر میکروثانیه فراهم کند. این محصول نه صرفاً یک کارت شبکه، بلکه یک موتور ارتباطی هوشمند است که با تخلیه بار پردازشی پروتکلهای ارتباطی از روی CPU، به هستههای پردازشی اجازه میدهد تا تمام توان خود را بر روی اجرای برنامههای کاربردی متمرکز کنند. MCX653106A-ECAT که برای سرورهای HPE ProLiant DL و Apollo طراحی شده، پلی میان دنیای InfiniBand و Ethernet ایجاد کرده و سازمانها را قادر میسازد تا پیچیدهترین چالشهای محاسباتی عصر دیجیتال را با کارایی و مقیاسپذیری بیسابقهای حل کنند. این آداپتور به طور خاص برای مشتریانی طراحی شده است که سیستمهای HPC را با سرورهای HPE ProLiant XL و HPE ProLiant DL Gen10 و Gen10 Plus خود در دیتاسنتر مستقر میکنند.
–
معماری سختافزاری و کنترلر ConnectX-6 VPI: تلفیق انعطافپذیری و قدرت
–
در قلب کارت شبکه MCX653106A-ECAT، نسل ششم از خانواده پرافتخار NVIDIA Mellanox ConnectX، یعنی کنترلر ConnectX-6 VPI (Virtual Protocol Interconnect) نهفته است. این تراشه یک جهش نسلی در فناوری شبکه محسوب میشود و برای اولین بار، قابلیتهای اتصال چندگانه را در یک تراشه واحد ارائه میدهد. ConnectX-6 VPI به عنوان یک کارت شبکه هوشمند (Smart NIC)، از استانداردهای InfiniBand با سرعتهای HDR, HDR100, EDR, FDR, QDR, DDR و SDR و همچنین اترنت با سرعتهای ۲۰۰، ۱۰۰، ۵۰، ۴۰، ۲۵ و ۱۰ گیگابیت بر ثانیه پشتیبانی میکند. این انعطافپذیری فوقالعاده، به سازمانها این امکان را میدهد که یک زیرساخت شبکه واحد را برای انواع مختلف بارهای کاری، از HPC سنتی گرفته تا ابرهای مدرن، به کار گیرند.
رابط ارتباطی این آداپتور با سرور از طریق گذرگاه PCI Express 3.0 با ۱۶ لاین (x16) برقرار میشود که پهنای باند کافی برای پشتیبانی از حداکثر توان عملیاتی دو پورت را فراهم میکند. نکته قابل توجه این است که این کارت با PCIe 4.0 نیز سازگار است. ابعاد فیزیکی آن که شامل یک براکت بلند (tall bracket) میشود، برای نصب در انواع سرورهای رکمونت طراحی شده است. وزن تقریبی این آداپتور ۲۳۰ گرم است. دو پورت QSFP56 آن، زیرساخت لازم برای پهنای باند ۲۰۰ گیگابیت بر ثانیه (با استفاده از HDR) را فراهم میکنند و با کابلها و سوئیچهای HDR InfiniBand سازگاری کامل دارند.
–
قابلیتهای کلیدی و موتورهای تخلیه بار پردازشی
–
آنچه MCX653106A-ECAT را از یک کارت شبکه ساده متمایز میکند و آن را به یک جزء حیاتی در کلاسترهای HPC تبدیل میسازد، مجموعهای از موتورهای سختافزاری پیشرفته است که عملیات پیچیده شبکه را به طور کامل از دوش CPU برمیدارند. این قابلیتها که تحت عنوان “Offloading Mechanisms” شناخته میشوند، نقشی اساسی در افزایش کارایی و مقیاسپذیری سیستمهای موازی ایفا میکنند. این ویژگیهای کلیدی را میتوان در شش حوزه زیر دستهبندی کرد:
| پهنای باند انبوه و تأخیر بسیار پایین | نرخ پیام استثنایی |
| تخلیه بار تطبیق تگ MPI (MPI Tag Matching) | تخلیه بار MPI Rendezvous |
| مسیریابی تطبیقی بر روی انتقال مطمئن (Adaptive Routing on Reliable Transport) | امنیت پیشرفته با شتابدهی سختافزاری |
–
پهنای باند انبوه و تأخیر بسیار پایین
این آداپتور قادر است تا ۲۰۰ گیگابیت بر ثانیه پهنای باند دوطرفه را با تأخیری کمتر از ۰.۶ میکروثانیه فراهم کند. این سطح از کارایی، عامل اصلی در مقیاسپذیری برنامههای موازی است، جایی که هزاران هسته پردازشی باید به طور مداوم با یکدیگر همگامسازی شوند. چنین تأخیر پایینی برای همگرایی سریع الگوریتمهای توزیعشده در یادگیری ماشین و دینامیک سیالات محاسباتی حیاتی است.
نرخ پیام استثنایی
توانایی پردازش بیش از ۲۱۵ میلیون پیام در ثانیه (Mpps)، این آداپتور را قادر میسازد تا در کاربردهایی که با حجم عظیمی از بستههای کوچک سروکار دارند، عملکردی بینظیر از خود نشان دهد. این ویژگی برای کتابخانههای ارتباطی مانند MPI (Message Passing Interface) که ستون فقرات برنامههای HPC هستند، بسیار حیاتی است و مستقیماً به کاهش زمان اجرای کارهای موازی منجر میشود.
تخلیه بار تطبیق تگ MPI (MPI Tag Matching)
این یک شتابدهنده سختافزاری حیاتی برای برنامههای HPC است. عملیات تطبیق تگ MPI که به طور سنتی توسط CPU انجام میشود و میتواند بسیار زمانبر باشد، به طور کامل به آداپتور منتقل میشود. نتیجه این کار، کاهش چشمگیر سربار CPU و افزایش پهنای باند مؤثر در برنامههای موازی مبتنی بر MPI است.
تخلیه بار MPI Rendezvous
علاوه بر تطبیق تگ، پروتکل انتقال داده Rendezvous که برای ارسال پیامهای بزرگ در MPI استفاده میشود نیز توسط سختافزار شتابدهی میشود. این قابلیت، کارایی را در تبادل دیتاستهای عظیم بین گرههای محاسباتی که در شبیهسازیهای علمی و تحلیل دادهها رایج است، بهبود میبخشد.
مسیریابی تطبیقی بر روی انتقال مطمئن (Adaptive Routing on Reliable Transport)
برخلاف شبکههای سنتی که از مسیرهای ایستا استفاده میکنند، این ویژگی به آداپتور اجازه میدهد تا به طور پویا بهترین مسیر را برای ترافیک بر اساس شرایط لحظهای شبکه انتخاب کند. این قابلیت نه تنها پهنای باند را متعادلتر میکند، بلکه از ایجاد گلوگاههای ترافیکی نیز جلوگیری میکند.
امنیت پیشرفته با شتابدهی سختافزاری
ConnectX-6 VPI از رمزنگاری بلوکی XTS-AES در سطح سختافزار برای محافظت از دادههای در حال انتقال (Data-in-Motion) پشتیبانی میکند. این ویژگی امنیت را بدون تحمیل هیچگونه سربار اضافی بر عملکرد CPU یا پهنای باند شبکه تضمین میکند.
–
کاربردهای اصلی: از هوش مصنوعی و یادگیری ماشین تا ذخیرهسازی
–
کارت شبکه MCX653106A-ECAT به دلیل کارایی بالا و معماری همهکاره خود، در طیف گستردهای از حیاتیترین و مدرنترین کاربردهای سازمانی و تحقیقاتی به کار گرفته میشود. هر یک از این کاربردها از قابلیتهای خاص InfiniBand و ConnectX-6 بهره میبرند:
کاربردهای کارت شبکه HPE InfiniBand MCX653106A-ECAT HDR100 100Gb 2-port
کلاسترهای هوش مصنوعی و یادگیری عمیق (AI/ML Clusters)
آموزش مدلهای عظیم زبانی (LLM) و شبکههای عصبی پیچیده نیازمند همگامسازی سریع و مداوم پارامترها بین دهها یا صدها GPU است. تأخیر بسیار پایین (کمتر از ۰.۶ میکروثانیه) و پهنای باند بالای ۱۰۰ گیگابیت بر ثانیه در هر پورت این آداپتور، زمان آموزش را به شدت کاهش میدهد. فناوریهایی مانند GPUDirect RDMA نیز از طریق این آداپتور پشتیبانی میشوند و امکان انتقال مستقیم داده از حافظه یک GPU به GPU دیگر را بدون دخالت CPU فراهم میکنند.
ذخیرهسازی NVMe over Fabrics (NVMe-oF)
این آداپتور یک جزء کلیدی در SANهای مبتنی بر NVMe است. پهنای باند ۱۰۰ گیگابیت بر ثانیه در هر پورت و تأخیر بسیار پایین، امکان دسترسی به حافظههای Flash از طریق شبکه را با کارایی تقریباً محلی (Local) فراهم میکند. MCX653106A-ECAT برای شتابدهی به پروتکلهای NVMe-oF طراحی شده و برای ساخت راهحلهای ذخیرهسازی بسیار سریع و کارآمد مناسب است.
ابررایانهها و مراکز HPC (Supercomputing & HPC)
چه برای پیشبینی آب و هوا، شبیهسازیهای دینامیک مولکولی، یا تحقیقات ژنومیک، برنامههای علمی به شدت به ارتباطات کارآمد و کمتأخیر وابسته هستند. InfiniBand استاندارد طلایی برای این محیطها است. MCX653106A-ECAT با پشتیبانی از MPI Offload و پهنای باند ۲۰۰ گیگابیت بر ثانیه، برای ساخت کلاسترهای عظیم با هزاران گره که نیازمند تبادل پیوسته و عظیم داده هستند، ایدهآل است.
تحلیل دادههای بزرگ (Big Data Analytics)
فریمورکهایی مانند Apache Spark و Hadoop میتوانند از پهنای باند بالا و تأخیر کم InfiniBand بهرهمند شوند تا سرعت همگامسازی دادهها و پردازش پرسوجوها را افزایش دهند.
زیرساختهای ابری (Cloud Infrastructure)
با افزایش تقاضا برای خدمات ابری با کارایی بالا، فراهمکنندگان خدمات ابری به دنبال راهحلهایی برای ارائه عملکرد قابل پیشبینی و ایزوله به مشتریان خود هستند. InfiniBand به دلیل قابلیتهای QoS پیشرفته و مجازیسازی I/O، یک انتخاب عالی برای ساخت ابرهای HPC و AI است.
–
سازگاری با سرورهای HPE ProLiant و ملاحظات استقرار
–
کارت شبکه MCX653106A-ECAT با پارت نامبر P06251-B21 و پارت نامبر قطعه یدکی P23666-B21، به طور کامل برای خانوادههای سرور HPE ProLiant و Apollo طراحی و تأیید شده است. این کارت با سرورهای رکمونت HPE ProLiant DL Gen10 و Gen10 Plus، از جمله DL325, DL345, DL365 و DL380 Gen10 سازگاری کامل دارد. همچنین این آداپتور برای سیستمهای HPE Apollo XL که برای بارهای کاری HPC و AI طراحی شدهاند نیز در دسترس است.
نکته مهم در استقرار این است که MCX653106A-ECAT یک کارت مستقل (Stand-up) با براکت بلند است و از هر دو استاندارد PCIe 3.0 و 4.0 پشتیبانی میکند. برای دستیابی به حداکثر کارایی، باید از کابلها و سوئیچهای HDR InfiniBand یا اترنت ۱۰۰ گیگابیتی استفاده شود. همچنین، این کارت از سیستمعاملهای CentOS، FreeBSD، Windows و Red Hat Enterprise Linux پشتیبانی میکند.
–
سوالات متداول
۱. مفهوم Virtual Protocol Interconnect (VPI) در کنترلر ConnectX-6 این کارت چیست؟
فناوری VPI به این معناست که یک پورت فیزیکی میتواند بهصورت پویا بین حالتهای InfiniBand و Ethernet تغییر وضعیت دهد و دیگر نیازی به کارتهای مجزا برای هر پروتکل نیست. این قابلیت انعطافپذیری بینظیری به دیتاسنترها میدهد تا یک زیرساخت واحد را برای تمامی بارهای کاری HPC، AI و ابری بهکار گیرند.
۲. تخلیه بار تطبیق تگ MPI (MPI Tag Matching Offload) دقیقاً چه کمکی به برنامههای HPC میکند؟
در برنامههای موازی مبتنی بر MPI، تطبیق پیامهای دریافتی با درخواستهای ارسالی میتواند بخش قابل توجهی از چرخههای CPU را مصرف کند. ConnectX-6 این عملیات را بهطور کامل در سختافزار انجام میدهد و با آزادسازی CPU، پهنای باند مؤثر در تبادل میلیونها پیام کوچک را به شدت افزایش میدهد.
۳. مسیریابی تطبیقی (Adaptive Routing) در InfiniBand چگونه بر پایداری کلاستر تأثیر میگذارد؟
بهجای استفاده از یک مسیر ایستا، این آداپتور بهطور پویا و بر اساس ازدحام لحظهای شبکه، بهترین مسیر را برای هر بسته انتخاب میکند. این کار از ایجاد گلوگاههای ترافیکی جلوگیری کرده و تضمین میکند که خرابی یک لینک یا سوئیچ منجر به توقف کامل ارتباطات در کلاسترهای عظیم HPC نشود.
۴. تأخیر کمتر از ۰.۶ میکروثانیه در این کارت، چه مزیتی برای آموزش مدلهای عظیم هوش مصنوعی دارد؟
در آموزش توزیعشده مدلهای بزرگ مانند LLMها، دهها یا صدها GPU باید گرادیانها را در هر تکرار آموزشی با یکدیگر همگامسازی کنند. تأخیر Sub-microsecond این کارت، زمان این همگامسازی جمعی (All-reduce) را به حداقل رسانده و باعث میشود GPUها زمان کمتری را در انتظار بمانند و راندمان آموزش افزایش یابد.
۵. فناوری SHARP (Scalable Hierarchical Aggregation) چه نقشی در افزایش کارایی دارد؟
SHARP که توسط سوئیچهای هوشمند پشتیبانی میشود، عملیات جمعی (Collectives) را از CPU به شبکه منتقل میکند. به جای ارسال چندباره دادهها بین گرهها، محاسبات کاهش (Reduction) مستقیماً روی سوئیچ انجام میشود که این کار پهنای باند مصرفی شبکه را چندین برابر کاهش داده و سرعت عملیات را افزایش میدهد.
۶. تفاوت بین InfiniBand HDR100 و EDR در این آداپتور چیست؟
این کارت با سرعت ۱۰۰ گیگابیت بر ثانیه در هر پورت (HDR100) کار میکند که دو برابر سرعت EDR (حدود ۱۰۰ گیگ در مجموع دو لین) است. HDR100 از مدولاسیون PAM4 و ۲ لاین ۵۰ گیگابیتی استفاده میکند، در حالی که EDR از ۴ لاین ۲۵ گیگابیتی بهره میبرد و همین باعث افزایش چگالی و کاهش هزینه کابلکشی میشود.
۷. آیا میتوان یک پورت را برای InfiniBand و پورت دیگر را برای Ethernet پیکربندی کرد؟
بله، به لطف معماری ConnectX-6 VPI، این کارت دارای دو پورت کاملاً مستقل است. شما میتوانید یک پورت را برای اتصال به شبکه پرسرعت InfiniBand (برای ارتباطات HPC) و پورت دیگر را برای اتصال به شبکه اترنت (برای ذخیرهسازی یا مدیریت) پیکربندی کنید.
۸. کارت MCX653106A-ECAT با کدام خانواده از سرورهای HPE سازگار است؟
این کارت به طور خاص برای سرورهای رکمونت HPE ProLiant DL Gen10 و Gen10 Plus (شامل DL325، DL345، DL365، DL380) و همچنین سرورهای بهینهشده HPE Apollo طراحی شده است. برای نصب، یک اسلات PCIe 3.0 یا 4.0 با ۱۶ لاین مورد نیاز است.
۹. شتابدهی سختافزاری NVMe over Fabrics در این کارت چه کاربردی دارد؟
این آداپتور با تخلیه بار پردازشی پروتکل NVMe-oF، امکان دسترسی به حافظههای NVMe راه دور را با تأخیر تقریباً محلی فراهم میکند. این قابلیت برای ساخت شبکههای ذخیرهسازی فوقسریع (SAN) که پهنای باند چندین گیگابایت بر ثانیهای نیاز دارند، حیاتی است.
۱۰. رمزنگاری سختافزاری XTS-AES چه لایه امنیتی را بدون افت کارایی فراهم میکند؟
ConnectX-6 یک موتور رمزنگاری بلوکی دارد که ترافیک Data-in-Motion را با الگوریتم XTS-AES و کلیدهای ۲۵۶ یا ۵۱۲ بیتی رمزنگاری میکند. این عملیات کاملاً در سختافزار و بدون مصرف CPU یا کاهش پهنای باند انجام میشود و امنیت دادههای حساس را در سطح کلاستر تضمین میکند.
–
جمعبندی نهایی: MCX653106A-ECAT، موتور محرکه مراکز داده آینده
–
کارت شبکه HPE InfiniBand MCX653106A-ECAT HDR100/Ethernet 100Gb Adapter P06251-B21 فراتر از یک کارت شبکه ساده، یک پلتفرم شتابدهنده هوشمند ارتباطات است که برای پاسخگویی به سختگیرانهترین نیازهای محاسباتی عصر ابر و هوش مصنوعی طراحی شده است. این آداپتور با بهرهگیری از کنترلر قدرتمند NVIDIA Mellanox ConnectX-6 و فناوری InfiniBand، نهتنها پهنای باند ۲۰۰ گیگابیت بر ثانیه و تأخیر زیر ۰.۶ میکروثانیه را ارائه میدهد، بلکه با قابلیتهای منحصربهفردی چون شتابدهی سختافزاری MPI، مسیریابی تطبیقی و پشتیبانی از NVMe-oF، استاندارد جدیدی را در کارایی و انعطافپذیری تعریف میکند.
MCX653106A-ECAT با ایجاد پلی میان دو دنیای InfiniBand و Ethernet، سازمانها را قادر میسازد تا یک زیرساخت شبکه یکپارچه برای تمامی بارهای کاری خود، از HPC سنتی و شبیهسازیهای علمی گرفته تا مدرنترین کلاسترهای AI/ML و ریزسرویسهای ابری، بنا نهند. این قابلیت همگرایی، پیچیدگیهای مدیریتی و هزینههای زیرساخت را به طور چشمگیری کاهش میدهد. برای دیتاسنترهایی که به دنبال دستیابی به عملکرد در مقیاس Exascale، کاهش زمان دستیابی به نتایج علمی و تجاری، و ساختن زیرساختی مقاوم برای چالشهای فردا هستند، MCX653106A-ECAT نه یک انتخاب، بلکه یک الزام استراتژیک برای موفقیت و پیشتازی در میدان رقابت جهانی است.
–
–
در پناه ایزد منان 😉






شما هم میتوانید در مورد این کالا نظر بدهید.
برای ثبت نظر، از طریق دکمه زیر اقدام نمایید. اگر این محصول را قبلا از استوک سرور خریده باشید، نظر شما به عنوان مالک محصول ثبت خواهد شد.
افزودن دیدگاه جدیدهیچ دیدگاهی برای این محصول نوشته نشده است.