تحولی در هوش مصنوعی: ظهور DeepSeek و چالش جدید برای OpenAI

در دنیای هوش مصنوعی، این باور وجود داشت که توسعه مدلهای زبانی پیشرفته نیازمند منابع فنی و مالی قابلتوجهی است. به همین دلیل، دولت آمریکا متعهد شد از پروژه Stargate به ارزش ۵۰۰ میلیارد دلار که توسط دونالد ترامپ اعلام شده بود، حمایت کند.
اما شرکت چینی DeepSeek این تصور را به چالش کشیده است. در ۲۰ ژانویه ۲۰۲۵، این شرکت مدل زبانی DeepSeek-R1 را با هزینهای بسیار کمتر از سایر شرکتها منتشر کرد. علاوه بر این، DeepSeek مدلهای خود را تحت مجوز متنباز عرضه کرده و استفاده از آن را بهصورت رایگان امکانپذیر ساخته است.

چند روز پس از انتشار، دستیار هوش مصنوعی DeepSeek – که یک اپلیکیشن موبایلی با رابط چتبات است – در صدر فهرست App Store اپل قرار گرفت و حتی اپلیکیشن ChatGPT از OpenAI را پشت سر گذاشت. این موفقیت ناگهانی باعث افت ارزش سهام بسیاری از شرکتهای فناوری از جمله Nvidia، مایکروسافت، متا، اوراکل و برودکام در ۲۷ ژانویه ۲۰۲۵ شد، زیرا سرمایهگذاران در ارزشگذاری غولهای هوش مصنوعی مستقر در آمریکا تجدیدنظر کردند.
DeepSeek چیست؟
DeepSeek یک شرکت توسعهدهنده هوش مصنوعی مستقر در هانگژو، چین است که در می ۲۰۲۳ توسط لیانگ ونفنگ (فارغالتحصیل دانشگاه ژجیانگ) تأسیس شد. او همچنین یکی از بنیانگذاران High-Flyer، یک صندوق سرمایهگذاری الگوریتمی در چین است که مالکیت DeepSeek را بر عهده دارد.

این شرکت تمرکز ویژهای بر توسعه مدلهای زبانی متنباز دارد. اولین مدل DeepSeek در نوامبر ۲۰۲۳ منتشر شد، اما پس از انتشار مدل DeepSeek-R1 در ژانویه ۲۰۲۵ توانست شهرتی جهانی کسب کند. DeepSeek علاوه بر مدلهای خود، خدماتی نظیر رابط وب، اپلیکیشن موبایل و API نیز ارائه میدهد.
مقایسه DeepSeek و OpenAI
DeepSeek به عنوان جدیدترین رقیب OpenAI شناخته میشود. در حالی که OpenAI با معرفی ChatGPT در سال ۲۰۲۲ جایگاه خود را بهعنوان پیشگام هوش مصنوعی تثبیت کرد، DeepSeek با رویکردی متفاوت و متنباز، به چالشی جدی برای آن تبدیل شده است.

| ویژگی | OpenAI | DeepSeek |
|---|---|---|
| سال تأسیس | ۲۰۱۵ | ۲۰۲۳ |
| مقر اصلی | سانفرانسیسکو، آمریکا | هانگژو، چین |
| تمرکز توسعه | قابلیتهای گسترده AI | مدلهای متنباز و بهینه |
| مدلهای کلیدی | GPT-4o، o1 | DeepSeek-V3، R1 |
| مدلهای خاص | DALL-E (تولید تصویر)، Whisper (تشخیص گفتار) | DeepSeek Coder (کدنویسی)، Janus Pro (مدل بینایی) |
| هزینه API (به ازای یک میلیون توکن) | o1: $۱۵ (ورودی)، $۶۰ (خروجی) | R1: $۰.۵۵ (ورودی)، $۲.۱۹ (خروجی) |
| سیاست متنباز | محدود | تقریباً متنباز |
| روش آموزش | یادگیری نظارتشده و ریزتنظیمات دستوری | یادگیری تقویتی |
| هزینه توسعه | صدها میلیون دلار برای مدل o1 (تخمینی) | کمتر از ۶ میلیون دلار برای مدل R1 |
نوآوریهای DeepSeek در آموزش مدلها
DeepSeek از روش متفاوتی برای آموزش مدل R1 خود استفاده کرده که به زمان کمتر، پردازندههای هوش مصنوعی کمتر و هزینه کمتر نیاز دارد. هدف این شرکت، دستیابی به هوش عمومی مصنوعی (AGI) است و پیشرفتهای آن در استدلال، گامی مهم در این راستا محسوب میشود.
طبق مقالهای که DeepSeek منتشر کرده، برخی از نوآوریهای کلیدی مدل R1 عبارتاند از:
- یادگیری تقویتی: این مدل از یک سیستم یادگیری تقویتی در مقیاس بزرگ استفاده کرده که بر وظایف استدلالی تمرکز دارد.
- مهندسی پاداش: این سیستم از یک مکانیزم پاداش مبتنی بر قوانین استفاده میکند که عملکرد بهتری نسبت به مدلهای پاداش عصبی رایج دارد.
- فشردهسازی دانش (Distillation): DeepSeek با استفاده از تکنیکهای انتقال دانش، توانسته قابلیتهای پیچیده را در مدلهایی با تنها ۱.۵ میلیارد پارامتر بگنجاند.
- شبکه رفتار نوظهور: DeepSeek کشف کرده که الگوهای استدلالی پیچیده میتوانند بهطور طبیعی از طریق یادگیری تقویتی ایجاد شوند، بدون اینکه بهصورت صریح برنامهریزی شده باشند.
مدلهای زبانی DeepSeek
از زمان تأسیس، DeepSeek چندین مدل مختلف منتشر کرده است که با هر نسل، عملکرد و قابلیتهای آن بهبود یافتهاند:
✅ DeepSeek Coder – منتشر شده در نوامبر ۲۰۲۳: اولین مدل متنباز این شرکت، مخصوص وظایف کدنویسی.
✅ DeepSeek LLM – منتشر شده در دسامبر ۲۰۲۳: نسخه اولیه مدل زبان عمومی این شرکت.
✅ DeepSeek-V2 – منتشر شده در می ۲۰۲۴: نسخه دوم مدل زبانی با هزینه آموزش کمتر و عملکرد قویتر.
✅ DeepSeek-Coder-V2 – منتشر شده در ژوئیه ۲۰۲۴: مدل ۲۳۶ میلیارد پارامتری با پنجره متنی ۱۲۸,۰۰۰ توکنی، مناسب برای چالشهای پیچیده کدنویسی.
✅ DeepSeek-V3 – منتشر شده در دسامبر ۲۰۲۴: مدل جدیدی با معماری Mixture-of-Experts که ۶۷۱ میلیارد پارامتر دارد.
✅ DeepSeek-R1 – منتشر شده در ژانویه ۲۰۲۵: مدل استدلالی پیشرفته که مستقیماً با مدل o1 از OpenAI رقابت میکند، اما با هزینهای بسیار کمتر.
✅ Janus-Pro-7B – منتشر شده در ژانویه ۲۰۲۵: مدل بینایی که قادر به درک و تولید تصاویر است.
چرا DeepSeek در آمریکا نگرانی ایجاد کرده است؟
با وجود هیاهوی فراوان پیرامون انتشار مدل DeepSeek-R1، این موضوع باعث نگرانیهای جدی در ایالات متحده شده و منجر به افت بازار سهام شرکتهای فناوری شده است. در ۲۷ ژانویه ۲۰۲۵، شاخص Nasdaq Composite در ابتدای بازار ۳.۴٪ افت کرد، در حالی که سهام Nvidia با ۱۷٪ کاهش، حدود ۶۰۰ میلیارد دلار از ارزش بازار خود را از دست داد.

دلایل اصلی نگرانی در آمریکا شامل موارد زیر است:
🔹 اختلال در هزینهها – شرکت DeepSeek مدعی است که مدل R1 را با کمتر از ۶ میلیون دلار توسعه داده است. این هزینه پایین، مدل اقتصادی شرکتهای فناوری آمریکایی را که میلیاردها دلار در هوش مصنوعی سرمایهگذاری کردهاند، تهدید میکند. همچنین، هزینه استفاده از DeepSeek بسیار کمتر از OpenAI است.
🔹 دستاورد فنی علیرغم تحریمها – صادرات تراشههای شتابدهنده و پردازندههای گرافیکی پیشرفته از آمریکا به چین محدود شده است. با این حال، DeepSeek توانسته است بدون استفاده از تکنولوژی پیشرفته آمریکا، مدلی در سطح جهانی توسعه دهد.
🔹 تهدید مدل تجاری – برخلاف OpenAI که فناوری خود را اختصاصی و پولی نگه داشته است، DeepSeek یک مدل متنباز و رایگان ارائه داده که ساختار درآمدی شرکتهای آمریکایی را که برای خدمات هوش مصنوعی اشتراک ماهانه دریافت میکنند، به چالش میکشد.
🔹 نگرانیهای ژئوپلیتیکی – به دلیل اینکه DeepSeek یک شرکت چینی است، این موضوع سلطه فناوری آمریکا در هوش مصنوعی را به چالش میکشد. مارک آندرسن، سرمایهگذار مشهور حوزه فناوری، این اتفاق را “لحظه اسپوتنیک” هوش مصنوعی نامیده است، مشابه رقابت فضایی دهه ۱۹۵۰ که با پرتاب ماهواره اسپوتنیک توسط شوروی، آمریکا را دچار شوک کرد.
ممنوعیت DeepSeek
برخی کشورها و سازمانهای دولتی، به دلایل امنیتی، اخلاقی و حریم خصوصی، DeepSeek را ممنوع کردهاند. دادههای کاربران در چین ذخیره میشود و نگرانی اصلی این است که اطلاعات کاربران ممکن است به دولت چین منتقل شود. همچنین، این مدل زبانی با دیدگاه چینی آموزش دیده که برخی کشورها آن را نگرانکننده میدانند.
📌 مکانهایی که DeepSeek در آنها ممنوع شده است:
✅ ادارات دولتی استرالیا
✅ دولت مرکزی هند
✅ ایتالیا
✅ ناسا
✅ وزارت صنعت کره جنوبی
✅ نهادهای دولتی تایوان
✅ دولت ایالت تگزاس
✅ کنگره آمریکا
✅ نیروی دریایی آمریکا
✅ پنتاگون
حمله سایبری به DeepSeek
محبوبیت ناگهانی DeepSeek توجه هکرها را نیز به خود جلب کرده است.
📅 ۲۷ ژانویه ۲۰۲۵، این شرکت از حملات گسترده سایبری علیه خدمات خود خبر داد و برای مدتی، ثبتنام کاربران جدید را محدود کرد. این حملات دقیقاً زمانی رخ داد که اپلیکیشن هوش مصنوعی DeepSeek از نظر دانلود در App Store اپل از ChatGPT پیشی گرفت.
🔹 با این حال، DeepSeek خدمات خود را برای کاربران فعلی حفظ کرد.
🔹 در ۲۸ ژانویه، این شرکت اعلام کرد که مشکل شناسایی و برطرف شده است.
🔹 ماهیت دقیق این حمله مشخص نشد، اما بسیاری حدس میزنند که حمله DDoS علیه API و پلتفرم چت تحت وب این شرکت انجام شده باشد.
افشای اطلاعات DeepSeek
📅 ۲۹ ژانویه ۲۰۲۵، تیم تحقیقاتی Wiz Research (متعلق به شرکت امنیت ابری Wiz Inc.) گزارشی منتشر کرد که نشان میداد پایگاه دادهای از DeepSeek بهصورت عمومی در دسترس قرار گرفته است.
🔴 این یک اشتباه امنیتی فاجعهبار محسوب میشود، چرا که اطلاعات حساسی به بیرون درز کرده است:
✅ تاریخچه چت کاربران
✅ دادههای داخلی و لاگهای سیستم
✅ کلیدهای API
✅ جزئیات عملیاتی
🔹 DeepSeek بلافاصله پایگاه داده را آفلاین کرد، اما مدت زمان دقیقی که این اطلاعات در معرض دید بوده، نامشخص است.




