شرکت ElevenLabs که در زمینه تولید صدا با هوش مصنوعی فعالیت دارد، مدت‌هاست که با دیپ‌فیک دست‌و‌پنجه نرم می‌کند. فناوری هوش مصنوعی مولد صدا، درحالی که کارکردهای مفید بسیاری دارد، اما پتانسیل آن برای سوءاستفاده نیز زیاد است. اکنون مدیرعامل ElevenLabs گفته است قراردادن واترمارک دیجیتالی روی صداهای هوش مصنوعی می‌تواند راه‌حل مقابله با دیپ‌فیک‌های صوتی باشد.

براساس گزارش آتلانتیک، «متی استانیشفسکی» (Mati Staniszewski)، مدیرعامل و هم‌بنیان‌گذار ElevenLabs، ضمن اشاره‌ به اینکه مقابله با سوءاستفاده‌گران یک بازی موش‌وگربه خواهد بود، می‌گوید که واترمارک دیجیتالی می‌تواند راه‌حلی برای کاهش دیپ‌فیک‌ها باشد.

قراردادن واترمارک دیجیتالی برای مقابله با دیپ‌فیک‌ها

ElevenLabs که پس از راه‌اندازی نسخه بتا در سال 2023 به ارزش 1.1 میلیارد دلار رسید، از هوش مصنوعی برای تولید کلیپ‌های صوتی استفاده می‌کند. از ابزارهای این شرکت می‌توان برای تبدیل متن به گفتار، دوبله صدا به 29 زبان و شبیه‌سازی صداها بهره برد. این شرکت ادعا می‌کند که کاربرانش در سال گذشته میلادی بیش از 100 سال با این هوش مصنوعی صدا تولید کرده‌اند.

بااین‌حال، قانون‌گذاران نگران هستند که این فناوری پتانسیل خطرناکی برای سوءاستفاده داشته باشد. پیشرفت‌های هوش مصنوعی مولد صدا، با افزایش کلاهبرداری‌های تلفنی همراه بوده است که در آن کلاهبرداران خود را شخص دیگری معرفی می‌کنند.

بااین‌حال متی استانیشفسکی معتقد است که فناوری ElevenLabs می‌تواند بسیار سودمند باشد، برای مثال این فناوری می‌تواند به افراد مبتلا به بیماری‌های عصبی مانند ALS کمک کند تا اگر توانایی صحبت‌کردن خود را از دست داده‌اند، بتوانند دوباره صدای خود را بازیابند. همچنین از این فناوری می‌توان برای کمک به برقراری ارتباط میان مردم با زبان‌های مختلف استفاده کرد.

استانیشفسکی می‌گوید برای استفاده درست از پتانسیل این فناوری، کاربران باید بتوانند صداهای تولیدشده توسط هوش مصنوعی را از صدای انسان تشخیص دهند. به‌زعم او راه‌حل واقعی این است که به صورت دیجیتالی صداهای مصنوعی را واترمارک کرد.

source

توسط digitalwebmaster