شرکت DeepSeek که با مدل R1 خود دنیای هوش مصنوعی را متحول کرد، اکنون طبق گزارشهای یک افشاگر مشهور هوش مصنوعی در شبکه اجتماعی X، در حال آمادهسازی برای عرضه مدل جدید بهبودیافته DeepSeek R2 است که بر اساس این اطلاعات با زیرساخت شتابدهنده هوش مصنوعی بومی جهشی ۵۱۲ پتافلاپسی را به نمایش خواهد گذاشت.
به گفته رسانه TechPowerUp، این مدل با بهرهگیری از خوشههای تراشه Ascend 910B هواوی، یک Huawei Atlas 900 احتمالی و چارچوب آموزش توزیعشده اختصاصی DeepSeek، این شتابدهندهها را به نرخ بهرهوری چشمگیر ۸۲ درصد میرساند که معادل ۵۱۲ پتافلاپس عملکرد FP16 یا نیمی از یک اگزافلاپس قدرت محاسباتی است.
در صورت صحت این اطلاعات، این دستاورد قابل توجه، نمایانگر گام بلند DeepSeek در عرصه توسعه زیرساختهای هوش مصنوعی بومی و تلاش برای کاهش وابستگی به فناوریهای خارجی است.
قدرتنمایی سختافزاری با همکاری غولهای فناوری
بر اساس دادههای آزمایشگاهی هواوی، این میزان قدرت تقریباً ۹۱ درصد عملکرد خوشههای A100 قدیمیتر انویدیا را ارائه میدهد، در حالی که DeepSeek ادعا میکند هزینه آموزش به ازای هر واحد را به میزان قابل توجه ۹۷.۳ درصد کاهش داده است.
پشتوانه DeepSeek R2، اکوسیستمی از شرکا قرار دارد. شرکت Tuowei Information، یک OEM پیشرو در خانواده Ascend، بیش از نیمی از سفارشهای سختافزاری ابررایانهای DeepSeek را مدیریت میکند، در حالی که Sugon رکهای سرور با خنککننده مایع را ارائه میدهد که قادر به تحمل تا ۴۰ کیلووات در هر واحد هستند.
برای کنترل مصرف انرژی، فرستندههای سیلیکون-فوتونیک Innolight نیز ۳۵ درصد صرفهجویی در مقایسه با راهکارهای سنتی به ارمغان میآورند.
توزیع جغرافیایی و مراکز داده قدرتمند
از نظر جغرافیایی نیز، عملیات بین مراکز اصلی تقسیم شده است. شرکت Runjian Shares مرکز ابررایانهای جنوب چین را تحت قراردادهایی به ارزش سالانه بیش از ۵ میلیارد یوان اداره میکند و شرکت Zhongbei Communications یک ذخیره ۱۵۰۰ پتافلاپسی در شمال غرب برای اوج تقاضاها نگهداری میکند.
در بخش نرمافزار نیز، DeepSeek R2 از استقرار خصوصی و تنظیم دقیق پشتیبانی میکند و از طریق پلتفرم Yun Sai Zhilian، ابتکارات شهر هوشمند را در ۱۵ استان تقویت میکند. نود(گره) شمال چین که توسط Yingbo Digital از زیرمجموعههای Hongbo Shares نظارت میشود، ۳۰۰۰ پتافلاپس دیگر به این مجموعه اضافه میکند.
جایگزین بومی در برابر غولهای بینالمللی
در صورت کمبود قدرت محاسباتی، هواوی آماده است تا سیستم CloudMatrix 384 خود را مستقر کند، که به عنوان یک جایگزین داخلی برای GB200 NVL72 انویدیا معرفی شده است. این سیستم دارای ۳۸۴ شتابدهنده Ascend 910C است که ۱.۷ برابر پتافلاپس کلی و ۳.۶ برابر ظرفیت HBM بیشتر از خوشه NVL72 ارائه میدهد.
با این حال، از نظر عملکرد به ازای هر تراشه به طور قابل توجهی عقبتر است و تقریباً چهار برابر بیشتر برق مصرف میکند. با این وجود، انتظار میرود عرضه مدل R2 به آرامی انجام شود. امیدواریم در آینده نزدیک شاهد عرضه رسمی و بنچمارکها آن باشیم.