La IA Genera Audios Plagados de Machismo, Racismo y Infracciones de Derechos de Autor
La inteligencia artificial (IA) ha avanzado significativamente en la creación de audios de alta calidad, desde melodías hasta transcripciones de voz y asistencia para personas con discapacidad visual. Sin embargo, un estudio reciente revela que estos avances están acompañados por un problema grave: la mayoría de los audios generados por la IA contienen contenido ofensivo y no autorizado, como machismo, racismo y infracciones de derechos de autor.
Contenido Ofensivo y No Autorizado
Un equipo de investigadores liderados por William Agnew, de la Universidad Carnegie Mellon, estudió 680.000 horas de audio de siete plataformas y 600 investigaciones en total. El análisis detectó que al menos el 35% de los audios analizados presentaban contenido protegido por copyright o derechos de autor. Además, se encontraron términos racistas y discriminatorios en plataformas como Free Music Archive y LibriVox.
Sesgos en los Conjuntos de Datos
Los investigadores advierten que los datos utilizados para entrenar a la IA han pasado por alto los sesgos, el lenguaje ofensivo y el uso de contenido con derechos de autor. Por ejemplo, la palabra «hombre» se relacionó con conceptos como guerra o historia, mientras que los términos ligados a la palabra «mujer» incluyeron tienda o mamá, asociados con los cuidados y la familia. En otros casos, se detectaron insultos como «perra». Esto sugiere que los estereotipos no se abordan adecuadamente, lo que puede perpetuar o incluso acelerar los prejuicios y concepciones distorsionadas de la realidad.
Implicaciones Sociales y Legales
El daño potencial de las tecnologías de audio generativo aún no se conoce completamente. Los científicos plantean que este tipo de contenido tendrá implicaciones sociales y legales que abarcan desde el derecho de publicidad de las personas, la desinformación y la propiedad intelectual, especialmente cuando estos sistemas están entrenados con datos utilizados sin autorización. La voz, como dato biométrico, está especialmente protegida y puede ser vulnerada si no está consentido su uso.
Conclusión
En conclusión, la IA generativa de sonido ha avanzado significativamente, pero estos avances están acompañados por un problema grave: la presencia de contenido ofensivo y no autorizado. Es fundamental abordar los sesgos en los conjuntos de datos para evitar que estos modelos perpetúen o amplifiquen prejuicios y concepciones distorsionadas de la realidad. Además, es crucial proteger la propiedad intelectual y los derechos de autor en la era digital.
¿Qué piensas sobre este tema? ¡Nos encantaría leer tu opinión en los comentarios!