فشرده سازی LLM به معنی کاهش حجم و حافظه مورد نیاز برای ذخیره و استفاده از مدل‌های زبانی پیچیده و حجیم است. این مدل‌ها اغلب شامل پارامترهای بسیار زیادی هستند که لازم است در حافظه ذخیره شوند و برای پردازش اطلاعات استفاده شوند. فشرده سازی مدل‌های زبانی بزرگ می‌تواند بهبود عملکرد و سرعت پردازش آنها را تا حدودی افزایش دهد و همچنین استفاده بهتری از حافظه و منابع محاسباتی را فراهم کند. فشرده سازی LLM ممکن است با استفاده از روش‌های مختلفی صورت گیرد.

در حالی که هنوز فاصله زیادی تا عرضه کامپیوترهای کوانتومی فیزیکی به بازار داریم، به نظر می ‌رسد علوم کامپیوتر کوانتومی ، که اصول کوانتومی را برای مدیریت محاسبات پیچیده در حوزه‌ هایی مانند مالی و هوش مصنوعی به کار می ‌برد، به سرعت در حال پیشرفت است.

در آخرین توسعه کامپیوترهای کوانتومی، یک استارت ‌آپ به نام Multiverse Computing ، تلاش‌ های جدیدی را برای همکاری نزدیک ‌تر با شرکت ‌های هوش مصنوعی که در حال ساخت و بهره‌ برداری از مدل ‌های زبانی بزرگ (LLM) هستند، آغاز کرده است. مدیرعامل Enrique Lizaso Olmos ، بهینه ‌سازی را به عنوان محور فعالیت‌های خود در نظر گرفته است.

به عبارت دیگر، همانطور که محاسبات پیشرفته‌ تر می‌ شوند، هزینه ‌های محاسباتی نیز گران‌ تر می شود و اجرای مداوم آن‌ ها بسیار پیچیده است. Multiverse ادعا می کند که پلتفرم نرم ‌افزاری خود به نام Singularity ، قادر است مدل ‌های پیچیده و پیش ‌بینی‌ های متعدد را به صورت کارآمد اجرا و بهینه ‌سازی کند.

در حوزه هوش مصنوعی، تمرکز بر روی استفاده از پلتفرمی برای فشرده ‌سازی LLM است. محصول جدیدی به نام CompactifAI به محاسباتی که به طور مداوم هنگام ساخت و پرس و جو مدل‌ های زبانی بزرگ انجام می ‌شود، می‌ پردازد تا نویز بیشتری را حذف کرده و سرعت کار را در تولید نتایج افزایش دهد و در نتیجه باعث افزایش قابلیت اعتماد در LLM شود.

این شرکت ادعا می ‌کند سرویس هایی که به مشتریان از طریق رابط‌ های برنامه‌ نویسی کاربردی (API) ارائه می شود، می‌ تواند مدل‌ های زبانی بزرگ را با استفاده از شبکه‌ های تانسوری(tensor networks) ‌الهام گرفته از کواتنوم، به بیش از ۸۰٪ فشرده کند و همچنان نتایج دقیقی تولید ‌کند .

اگر این ادعا درست باشد، می‌ تواند تأثیرات بزرگی بر روی نحوه خرید و استفاده از پردازنده‌ ها توسط شرکت ‌ها داشته باشد و یکی از چالش های بزرگ در این صنعت را حل کند.

در حالی که به نظر می رسد Multiverse با مشتریان ارتباط برقرار کرده است، اما آنچه که باید دیده شود، این است که توانمندی Multiverse برای بالا بردن سطح شرکت، به هدف دستیابی به تکنولوژی و هوش مصنوعی عمیق ، چگونه خواهد بود.

با مطالعه مقاله زیر می توانید اطلاات بیشتری درباره ی مدل های زبانی بزرگ LLMs بدست آورید:

استفاده از هوش مصنوعی مولد (Gen AI) در SRE:حل چالش های SRE با مدل های زبانی بزرگ (LLM)