مایکروسافت به گسترش تعداد صدا های تولید شده توسط هوش مصنوعی TTS (متن به گفتار) برای مشتریان خدمات Azure AI خود ادامه می دهد. امروز، این شرکت گسترش بزرگی را برای کاربران مستقر در هند اعلام کرد.
در یک پست وبلاگی، مایکروسافت اعلام کرد که 11 صدای جدید تمام زن و مرد انگلیسی (هند) و هندی را در تمام مناطق Azure اضافه کرده است. به طور خاص، این سرویس اکنون دارای شش صدای جدید برای انگلیسی (هند) و پنج صدای جدید برای هندی (هند) است. مایکروسافت می گوید همه آنها دارای ویژگی های صوتی منحصر به فرد هستند.
علاوه بر این، صدای پیش فرض انگلیسی (هند) و هندی هوش مصنوعی قبلاً منتشر شده توسط شرکت را ارتقا داده است تا هنگام استفاده طبیعی تر به نظر رسیده و بیان گر بیشتری داشته باشد. این به دلیل یک ویژگی جدید به نام Styles است. مایکروسافت اظهار داشت:
اکنون میتوانید صدا ها را بر اساس لحن احساسی مورد نیاز «همدل»، «خبرخوان» و «شاد» کنید. این تغییرات ماهیت پویاتر را به صدا های پیش فرض موجود میآورند.
سرانجام، مایکروسافت پشتیبانی از زبان های هندی بیشتری را اعلام کرد و سه مکان جدید (آسام، پنجابی و اوریا) را با صدا های زن و مرد اضافه کرد. این بدان معناست که اکنون 13 زبان محلی مختلف هندی با صدا های Azure AI این شرکت در دسترس است که بیش از 90 درصد بازار هند را پوشش میدهد.
مایکروسافت همچنین برخی از جزئیات فنی در مورد نحوه افزودن تمام این صدا های جدید AI هندی برای مشتریان Azure را فاش کرد.
سبکها در Neerja و Swara: علاوه بر سبک پیش فرض موجود، ما ورودی های سبک و داده های آموزشی را برای ایجاد گفتار در 3 سبک دیگر: شاد، خبرخوان و همدل، که میتوان بر اساس نیاز تجاری استفاده کرد، ادغام کردهایم. صدا های جدید دو زبانه en-IN و hi-IN: ما از واژگان دو زبانه پیشرفته و تکنیک های مدل سازی آکوستیک برای فعال کردن انتقال های یکپارچه بین کلمات انگلیسی و هندی برای ساخت صدا های جدید، هر کدام با یک شخصیت منحصر به فرد، استفاده کردیم. مکان های جدید هندی: ما از داده های با کیفیت بالا برای هر یک از این مکان ها برای ساخت صدا های TTS، با استفاده از آخرین پیشرفت های تکنولوژیکی در مدل سازی، مانند DelightfulTTS2 و MuLanTTS، استفاده کردیم.
صداهای جدید AI هندی روند امسال مایکروسافت برای گسترش تعداد صداهای AI در سراسر جهان برای کاربران Azure را ادامه میدهند. این شرکت اکنون بیش از 400 صدای TTS را پوشش میدهد که بیش از 140 زبان و مکان را پوشش میدهد.
source