ElevenLabs، شرکت شبیه سازی صدا، ابزار جدیدی را معرفی کرده است که به کاربران امکان میدهد بدون نیاز به دانش تخصصی در زمینه موسیقی، افکتهای صوتی زیبا و حرفهای ایجاد کنند.
ابزار افکت های صوتی، به کاربران اجازه میدهد تا با تایپ دستورهایی مانند “صدای اموج توفنده”، “صدای برخورد آهن آلات به هم”، “صدای غوغای پرندهها” و “صدای موتور ماشین مسابقهای” قطعه ای از صدا را تولید کنند.
این ابزار ، همچنین می تواند با دستورهایی مانند “قطعات موسیقی با گیتار”، “تکنوازی ساکسوفون جاز” و “قطعات موسیقی تکنو” ، کلیپ های موسیقی را تا ۲۲ ثانیه تولید کند.
مطالب مرتبط : پیش بینی آب و هوا با هوش مصنوعی و فیزیک
ابزار تولید افکتهای صوتی چگونه عمل می کند؟
ElevenLabs از یک مدل هوش مصنوعی پیشرفته برای تولید افکتهای صوتی استفاده میکند. این مدل با آموزش بر روی صدها ساعت از آهنگهای موجود، قطعات موسیقی تولید میکند.
از نظر فنی، این مدل از معماریهای مختلف شبکههای عصبی مانند شبکههای مکرر (RNN)، شبکههای عصبی بازگشتی (LSTM) و شبکههای عصبی مکرر با دروازههای GRU استفاده میکند. این مدلها با توجه به ویژگیهای موسیقی، قطعات موسیقی جدید را نمونه برداری و تولید می کند .
هوش مصنوعی پیشرفته این افکتها را برای کاربران تولید میکند و دیگر نیازی به جستجو در پایگاههای داده یا خرید از مجموعههای صدا نیست.
ElevenLabs اعلام کرده است که از کتابخانه صوتی Shutterstock حاوی آهنگ های مجاز، به عنوان ابزاری برای آموزش مدل خود استفاده کرده است. کاربرانی که در مرحله آزمایشی آلفا از این ابزار استفاده کردهاند، شامل توسعه دهندگان بازیهای ویدیویی، تولید کنندگان فیلم، سازندگان محتوای رسانههای اجتماعی و بازاریابان بودهاند.
این ابزار به دستورهایی که سیاست محتوای ممنوع و استفاده از آن را نقض می کند، اجازه تولید صدا را نمی دهد. این محتوای ممنوع شامل موضوعاتی مانند خودکشی، تهدید ایمنی کودکان و تقلب است.
در حال حاضر تنها چند شرکت و استارتآپ در حال کار بر روی تولید صدای مبتنی بر هوش مصنوعی هستند.
Harmonai با پشتیبانی مالی از Stability AI، Dance Diffusion را منتشر کرده است؛
گوگل بر روی MusicLM کار کرده است؛
OpenAI دارای Jukebox است؛
و Meta مدل AudioCraft خود را دارد.
TikTok و Adobe نیز با ابزارهای تولید موسیقی مبتنی بر هوش مصنوعی آزمایش کردهاند .