انویدیا به‌تازگی مدل هوش مصنوعی جدیدی به نام Fugatto معرفی کرده که می‌تواند دستورات متنی کاربران را به صدا تبدیل کند یا با استفاده از این دستورها، فایل‌های صوتی را ویرایش کند.

انویدیا پادشاه مطلق بازار تراشه‌های هوش مصنوعی است و در ساخت مدل‌های نرم‌افزاری هوش مصنوعی نیز از پیشگامان به حساب می‌آید. انویدیا جدیدترین مدل هوش مصنوعی خود را «چاقوی سوئیسی برای صدا» توصیف می‌کند. این مدل می‌تواند ابزاری بسیار کاربردی برای تولیدکنندگان محتواهای ویدیویی باشد.

Fugatto هنوز به‌صورت عمومی در دسترس کاربران قرار نگرفته است

به گفته انویدیا، مدل «Foundational Generative Audio Transformer Opus 1» یا به‌اختصار Fugatto می‌تواند دستوراتش را متنی از کاربران دریافت کند و منطبق با این دستورات، فایل‌های صوتی بسازد. کاربران همچنین می‌توانند از Fugatto برای ویرایش فایل‌های صوتی ازپیش‌ساخته‌شده نیز استفاده کنند.

این مدل هوش مصنوعی را تیمی از متخصصان این حوزه در سراسر جهان ساخته‌اند. همچنین انویدیا می‌گوید این موضوع قابلیت‌های چندزبانی و چندلهجه‌ای Fugatto را قوی‌تر کرده است.

«رافائل واله»، یکی از محققان این پروژه و مدیر تحقیقات صوتی کاربردی در انویدیا، دراین‌باره می‌گوید قصد آنها ساخت مدلی بوده که صدا را مانند انسان‌ها درک و تولید کند. انویدیا برخی سناریوهای احتمالی برای استفاده از این مدل در دنیای واقعی را فهرست کرده است. Fugatto می‌تواند در این سناریو کاربرد داشته باشد.

هوش مصنوعی Fugatto

برای مثال، تولیدکنندگان موسیقی می‌توانند از این مدل هوش مصنوعی برای تولید نمونه‌های اولیه آهنگ استفاده کنند و به‌راحتی آن را ویرایش کنند. مردم عادی، تولیدکنندگان محتوا و توسعه‌دهندگان بازی‌های ویدیویی نیز می‌توانند نهایت استفاده را از قابلیت‌های مدل Fugatto ببرند. البته Fugatto هنوز به‌صورت عمومی در دسترس کاربران قرار ندارد و انویدیا نیز نگفته چه زمانی دسترسی عمومی به آن فراهم می‌شود.

شرکت‌های متا و گوگل نیز پیش‌ازاین مدل‌های هوش مصنوعی مشابهی معرفی کرده بودند که می‌توانست دستورات متنی کاربران را به صدا تبدیل کند. مدل هوش مصنوعی گوگل MusicLM نام دارد و کاربران می‌توانند از طریق وب‌سایت AI Test Kitchen به آن دسترسی داشته باشند.

source