انویدیا بهتازگی مدل هوش مصنوعی جدیدی به نام Fugatto معرفی کرده که میتواند دستورات متنی کاربران را به صدا تبدیل کند یا با استفاده از این دستورها، فایلهای صوتی را ویرایش کند.
انویدیا پادشاه مطلق بازار تراشههای هوش مصنوعی است و در ساخت مدلهای نرمافزاری هوش مصنوعی نیز از پیشگامان به حساب میآید. انویدیا جدیدترین مدل هوش مصنوعی خود را «چاقوی سوئیسی برای صدا» توصیف میکند. این مدل میتواند ابزاری بسیار کاربردی برای تولیدکنندگان محتواهای ویدیویی باشد.
Fugatto هنوز بهصورت عمومی در دسترس کاربران قرار نگرفته است
به گفته انویدیا، مدل «Foundational Generative Audio Transformer Opus 1» یا بهاختصار Fugatto میتواند دستوراتش را متنی از کاربران دریافت کند و منطبق با این دستورات، فایلهای صوتی بسازد. کاربران همچنین میتوانند از Fugatto برای ویرایش فایلهای صوتی ازپیشساختهشده نیز استفاده کنند.
این مدل هوش مصنوعی را تیمی از متخصصان این حوزه در سراسر جهان ساختهاند. همچنین انویدیا میگوید این موضوع قابلیتهای چندزبانی و چندلهجهای Fugatto را قویتر کرده است.
«رافائل واله»، یکی از محققان این پروژه و مدیر تحقیقات صوتی کاربردی در انویدیا، دراینباره میگوید قصد آنها ساخت مدلی بوده که صدا را مانند انسانها درک و تولید کند. انویدیا برخی سناریوهای احتمالی برای استفاده از این مدل در دنیای واقعی را فهرست کرده است. Fugatto میتواند در این سناریو کاربرد داشته باشد.
برای مثال، تولیدکنندگان موسیقی میتوانند از این مدل هوش مصنوعی برای تولید نمونههای اولیه آهنگ استفاده کنند و بهراحتی آن را ویرایش کنند. مردم عادی، تولیدکنندگان محتوا و توسعهدهندگان بازیهای ویدیویی نیز میتوانند نهایت استفاده را از قابلیتهای مدل Fugatto ببرند. البته Fugatto هنوز بهصورت عمومی در دسترس کاربران قرار ندارد و انویدیا نیز نگفته چه زمانی دسترسی عمومی به آن فراهم میشود.
شرکتهای متا و گوگل نیز پیشازاین مدلهای هوش مصنوعی مشابهی معرفی کرده بودند که میتوانست دستورات متنی کاربران را به صدا تبدیل کند. مدل هوش مصنوعی گوگل MusicLM نام دارد و کاربران میتوانند از طریق وبسایت AI Test Kitchen به آن دسترسی داشته باشند.
source