مایکروسافت به گسترش تعداد صدا های تولید شده توسط هوش مصنوعی TTS (متن به گفتار) برای مشتریان خدمات Azure AI خود ادامه می دهد. امروز، این شرکت گسترش بزرگی را برای کاربران مستقر در هند اعلام کرد.

در یک پست وبلاگی، مایکروسافت اعلام کرد که 11 صدای جدید تمام زن و مرد انگلیسی (هند) و هندی را در تمام مناطق Azure اضافه کرده است. به طور خاص، این سرویس اکنون دارای شش صدای جدید برای انگلیسی (هند) و پنج صدای جدید برای هندی (هند) است. مایکروسافت می گوید همه آنها دارای ویژگی های صوتی منحصر به فرد هستند.

 

انقلاب صدا در Azure با هوش مصنوعی جدید

 

علاوه بر این، صدای پیش‌ فرض انگلیسی (هند) و هندی هوش مصنوعی قبلاً منتشر شده توسط شرکت را ارتقا داده است تا هنگام استفاده طبیعی‌ تر به نظر رسیده و بیان‌ گر بیشتری داشته باشد. این به دلیل یک ویژگی جدید به نام Styles است. مایکروسافت اظهار داشت:

اکنون می‌توانید صدا ها را بر اساس لحن احساسی مورد نیاز «همدل»، «خبرخوان» و «شاد» کنید. این تغییرات ماهیت پویاتر را به صدا های پیش‌ فرض موجود می‌آورند.

سرانجام، مایکروسافت پشتیبانی از زبان‌ های هندی بیشتری را اعلام کرد و سه مکان جدید (آسام، پنجابی و اوریا) را با صدا های زن و مرد اضافه کرد. این بدان معناست که اکنون 13 زبان محلی مختلف هندی با صدا های Azure AI این شرکت در دسترس است که بیش از 90 درصد بازار هند را پوشش می‌دهد.

مایکروسافت همچنین برخی از جزئیات فنی در مورد نحوه افزودن تمام این صدا های جدید AI هندی برای مشتریان Azure را فاش کرد.

سبک‌ها در Neerja و Swara: علاوه بر سبک پیش‌ فرض موجود، ما ورودی‌ های سبک و داده‌ های آموزشی را برای ایجاد گفتار در 3 سبک دیگر: شاد، خبرخوان و همدل، که می‌توان بر اساس نیاز تجاری استفاده کرد، ادغام کرده‌ایم. صدا های جدید دو زبانه en-IN و hi-IN: ما از واژگان دو زبانه پیشرفته و تکنیک‌ های مدل‌ سازی آکوستیک برای فعال کردن انتقال‌ های یکپارچه بین کلمات انگلیسی و هندی برای ساخت صدا های جدید، هر کدام با یک شخصیت منحصر به فرد، استفاده کردیم. مکان‌ های جدید هندی: ما از داده‌ های با کیفیت بالا برای هر یک از این مکان‌ ها برای ساخت صدا های TTS، با استفاده از آخرین پیشرفت‌ های تکنولوژیکی در مدل‌ سازی، مانند DelightfulTTS2 و MuLanTTS، استفاده کردیم.

صداهای جدید AI هندی روند امسال مایکروسافت برای گسترش تعداد صداهای AI در سراسر جهان برای کاربران Azure را ادامه می‌دهند. این شرکت اکنون بیش از 400 صدای TTS را پوشش می‌دهد که بیش از 140 زبان و مکان را پوشش می‌دهد.

source