تلنگری برای دولتها
مجید فرزانه- فعال هوش مصنوعی
از زمانی که ChatGPT ارائه شد، تقریبا تمام فعالان هوش مصنوعی منتظر یک حرکت بزرگ از سمت چین بودند. شاید به همین دلیل بود که دولت آمریکا، صادرات پردازندههای گرافیکی انویدیا به چین را ممنوع کرد. اما چین با معرفی مدل زبانی بزرگ و متن باز«دیپسیک»، نشان داد که چندان هم نیازی به آخرین تکنولوژی پردازندهها ندارد. شاید فکر کنید که «دیپسیک» یک تکنولوژی جدید و متفاوت است، اما اگر نگاهی به مقاله علمی این مدل زبانی بیندازید، متوجه میشوید صرفا یک بهینهسازی روی مدلهای موجود است. در واقع مهندسان چینی بهدلیل محدودیتهای سختافزاری، تلاش کردهاند چند تکنیک را برای بهبود استفاده کنند:
فشردهسازی دادههای ورودی تا 93درصد
استفاده از پیشبینیهای چندتوکنی به جای تکتوکن
استفاده از تکنیک چندیسازی در مدل هوش مصنوعی (استفاده از 8 بیت برای هر پارامتر به جای 32بیت)
همین 3تکنیک بهظاهر ساده باعث شده DeepSeek حدود 45برابر کارآمدتر باشد؛ این یعنی، نیاز کمتر به سختافزار، مصرف انرژی و تولید CO2 کمتر و همچنین عدمنیاز به سرمایهگذاریهای عظیم روی سختافزارهای انویدیا. بههمین دلیل یکباره شرکت انویدیا حدود 500میلیارد دلار از ارزشش را از دست میدهد! اما این یک خبر خوب فقط برای چین نیست. DeepSeek متنباز است و همه میتوانند رایگان از آن استفاده کنند. حتی این امکان وجود دارد که شرکتهای کوچک و متوسط نیز در سرورهای خودشان این مدل را داشته باشند. در واقع این پیشرفت باعث کارآمدترشدن هوش مصنوعی در تمام جهان خواهد شد و حتی شرکتهایی که امروزه سهامشان سقوط کرده، در مدت کوتاهی با بهکارگیری تکنیکهای گفتهشده، مجددا بهینهتر رشد خواهند کرد. شاید کل این خبرها تلنگری برای دولتها باشد که همواره ایجاد محدودیت در دسترسی به تکنولوژی با شکست مواجه میشود. مهندسی یعنی «خلق در محدودیت».