Es posible que haya oído hablar de fotos y videos falsos. ¿Esos videos aterradores y realistas creados con inteligencia artificial? Ahora, Meta (anteriormente Facebook) parece haber desarrollado un nuevo modelo de IA llamado Voicebox que gira en torno a la voz. Es como un sistema de texto a voz supercargado que puede generar sonidos sintéticos a partir de un mensaje de texto.
Haga clic para obtener nuestro boletín electrónico gratuito de KURT con alertas de seguridad, consejos rápidos, reseñas técnicas y una manera fácil de volverse más inteligente
¿Qué es VoiceBox?
En esencia, Voicebox es un modelo de IA que crea voces sintéticas basadas en indicaciones de texto simples. En otras palabras, le das un texto y ella lo leerá en voz alta con una voz que suena humana. Es similar a la funcionalidad de texto a voz que puede usar en su teléfono o computadora, pero lleva las cosas a un nivel completamente nuevo.
Una cosa que distingue a Voicebox es su capacidad para repetir ciertos patrones vocales basados en una muestra de audio muy corta: ¡estamos hablando en menos de 2 segundos! Esto significa que es probable que tengas una voz artificial que se asemeje a tu personaje favorito o incluso a tu propia voz. Es casi como tener un actor de doblaje de guardia, listo para leer lo que quieras con el estilo de voz que elijas.
Modelos de voz de IA de la competencia
hice un discurso
Speechify y ElevenLabs también son jugadores en el juego de texto a voz. Speechify es una aplicación que convierte cualquier texto en audio. Puede leer en voz alta libros, artículos, notas, correos electrónicos, archivos PDF, fotos y páginas web. Speechify también afirma proporcionar funciones de reproducción de audio, edición de audio y muestreo de audio. Speechify ofrece cientos de audiolibros gratuitos y atemporales, tiene una aplicación de escritorio y está diseñado para ayudar a las personas con dificultades de lectura.

Meta logo en el teléfono (Costfoto/NurPhoto vía Getty Images)
Los hilos ‘Twitter Killer’ de Mark Zuckerberg atraen a los usuarios a la agregación de big data: “Privacidad casi nula
Once laboratorios
ElevenLabs, por otro lado, es una startup que utiliza inteligencia artificial para generar voces sintéticas con emociones contextualmente relevantes y comprensión del lenguaje natural. Proporciona una plataforma para crear y personalizar audio hablado de alta calidad en cualquier voz y estilo para diversas industrias, como videojuegos, animación, asistentes digitales, educación, entretenimiento, publicidad y podcasting. También disponen de una herramienta de detección y validación de voces sintéticas. ElevenLabs trabaja con actores que proporcionan muestras de sus voces y se les paga cuando se utilizan sus transcripciones de voz. Utilizan modelos patentados de aprendizaje profundo para crear sus discursos que son entregados por inteligencia artificial.
Ambos son geniales, pero no tienen la misma versatilidad que Voicebox, que puede imitar voces reales con solo unos segundos de audio. Es como comparar una navaja suiza con unas cuantas cucharas realmente buenas. Todos tienen sus usos, pero uno de ellos definitivamente es multipropósito.
Poder de la caja de voz
Pero no se trata solo de crear sonidos falsos. Voicebox también puede regular el audio eliminando el molesto ruido de fondo, digamos, un perro ladrando mientras intentas grabar. Y no se trata sólo del idioma inglés. Esta IA también habla francés, español, alemán, polaco y portugués, e incluso puede traducir sílabas de un idioma a otro manteniendo el mismo estilo de voz.
Muévete, Siri: el nuevo audiolibro de Apple, la IA suena como un humano

El logotipo de Meta (anteriormente Facebook) marca la entrada a la sede de la empresa en Menlo Park, California, el 9 de noviembre de 2022. – El propietario de Meta de Facebook despedirá a más de 11 000 empleados en “los cambios más difíciles que hemos realizado en la historia de Meta, “, dijo el jefe Mark Zuckerberg el miércoles. . (Josh Edelson/AFP vía Getty Images)
Meta Voice Box: ¿pirateo o amenaza?
Desafortunadamente, o afortunadamente, dependiendo de su posición en términos de IA, Meta no planea abrir Voicebox de código fuente de inmediato. Esto hizo que la gente se preguntara si estaban tratando de evitar algunos problemas potenciales. Por ejemplo, la tecnología de voz de IA puede usarse negativamente, como en campañas de acoso. O tal vez Meta tiene algunos planes futuros para ganar algo de dinero con este modelo.
Fuente de datos de entrenamiento masivo de Voicebox
Una de las cosas interesantes de Voicebox es que se basa en una gran cantidad de datos: más de 60 000 horas de habla de audiolibros en inglés y otras 50 000 horas de audiolibros multilingües. Meta dice que usaron audiolibros de dominio público como su principal fuente de datos, pero también usaron otras fuentes como podcasts, discursos y programas de radio. Sin embargo, algunos desafíos y limitaciones están asociados con el uso de audiolibros de dominio público, como la calidad, la consistencia, la alineación y la identidad del hablante. Meta afirma haber abordado algunos de estos problemas con la manipulación de datos y el diseño de formularios.
para mi alertas de seguridad, Regístrese para recibir el boletín gratuito CYBERGUY Report dirigiéndose a CYBERGUY.COM/NEWSLETTER
La espada de doble filo de la tecnología
La orden judicial ‘estúpida’ de Obama AG después de que el juez Biden contactara a las empresas de redes sociales
El auge de las voces de IA es un tema un poco delicado, especialmente para los actores de doblaje y, más recientemente, para los escritores. Les preocupa que las empresas utilicen IA para agrupar sus votos sin pagarles. El mercado de audiolibros está creciendo mucho y las empresas siempre buscan reducir costos, por lo que esto podría terminar siendo otro problema para los profesionales del audio.
Sin embargo, no se equivoque; No se trata solo de trabajos. Existen algunas preocupaciones reales sobre cuán profundamente se utilizan los votos falsos en las estafas. Por ejemplo, hubo un caso en el que se usó una voz sintética que se hizo pasar por un director ejecutivo en un robo importante. También existe la preocupación de que las voces falsas puedan usarse para manipular cosas como los sistemas biométricos de voz, que se usan para cosas como la banca en línea.
Verá, tan genial como se ve esta tecnología, tiene un lado más oscuro. Imagina que recibes una llamada de tu jefe pidiéndote que transfieras una gran cantidad de dinero para cerrar una cuenta. Haces lo que te dice porque, bueno, él es tu jefe. Excepto que no lo fue. correcto; Era una voz falsa generada por inteligencia artificial que sonaba exactamente como la de tu jefe. Salvaje, ¿verdad? Pero esta no es la trama de una película. ¡Ya pasó! Esta fue una de las primeras veces que se usó una voz falsa en un atraco, lo que dejó a los expertos en inteligencia artificial y a las fuerzas del orden rascándose la cabeza.

Kondo se mostró optimista sobre el futuro de la inteligencia artificial. (Jakob Borzycki/NurPhoto vía Getty Images)
DALLE-2 vs. BING CREATOR: ¿cuál destaca en esta demostración de IA?
Y no son solo los robos. Las voces falsas se pueden usar para engañar a los sistemas que dependen del reconocimiento de voz. Estamos hablando de cosas como la banca en línea, que utiliza su voz como una forma de identificación. Si los delincuentes pueden crear una voz falsa disfrazada sobre usted, es probable que obtengan acceso a sus cuentas. Es un poco como falsificar una firma pero con tu voz.
Contrarrestar la amenaza de las falsificaciones profundas
Por lo tanto, mientras nos maravillamos con las cosas asombrosas que puede hacer la tecnología, también es importante ser conscientes de los riesgos potenciales y estar un paso por delante. Es como un juego de alta tecnología del gato y el ratón, con expertos en inteligencia artificial y empresas que trabajan arduamente para detectar y detener estos votos falsos antes de que puedan causar algún daño.
Afortunadamente, hay personas que intentan resistir el posible abuso de los votos falsos. Por ejemplo, algunos países han comenzado a aprobar leyes para regular las falsificaciones profundas. Además, hay proyectos como Automatic Speaker Verification Spoofing y ASVspoof Countermeasures Challenge, donde los científicos e ingenieros están trabajando en formas de contrarrestar el ataque sónico profundo.
Las principales conclusiones de Kurt
Estamos en una era en la que la tecnología está evolucionando a pasos agigantados y cambiando la forma en que trabajamos, nos comunicamos e incluso escuchamos las cosas. Si bien el potencial de IA como Meta Voicebox es sin duda emocionante, está claro que también debemos andar con cuidado. Hay una delgada línea entre la innovación y la conquista, un equilibrio que todavía estamos logrando.

Los expertos argumentan que la diferencia entre la inversión en IA en China y EE. UU. es el hecho de que el modelo estadounidense está impulsado por empresas privadas, mientras que China adopta un enfoque gubernamental. (JOSEP LAGO/AFP vía Getty Images)
Haga clic aquí para la aplicación FOX NEWS
Con todos estos desarrollos y riesgos potenciales, ¿cómo se siente acerca del futuro de la inteligencia artificial y la tecnología de falsificaciones profundas? ¿Lo ves como una bendición o una maldición? Cuéntanos escribiéndonos a Cyberguy.com/Contacto
Para obtener más de mis alertas de seguridad, suscríbase a mi boletín gratuito CyberGuy Report dirigiéndose a Cyberguy.com/Newsletter
Copyright 2023 CyberGuy.com. Reservados todos los derechos.