¿Recuerdan los días en los que las publicaciones realizadas por una Inteligencia Artificial eran tan inofensivas como obvias? Es probable que en años pasados todos nos hubiéramos encontrado con este fenómeno.
PUBLICIDAD
Te topabas con una publicación en un sitio supuestamente informativo o páginas para descargar contenidos llenos de traducciones automáticas mal redactadas por una IA y eso equivalía a una alerta automática para abandonar el lugar.
Pero este 2023 las cosas cambiaron con la evolución de plataformas como ChatGPT, Bard y similares. Donde los contenidos resultantes son impresionantes y pueden hacerse pasar perfectamente por algo creado por un ser humano.
Con lo que nadie contaba es que al momento de asomarse a ver la evolución de este fenómeno los hombres de ciencia se toparían con la sorpresa de que buena parte de la web en realidad ya está infestado con contenido, páginas y textos creados por una IA.
Internet está plagado de contenido creado por Inteligencia Artificial
Un nuevo estudio ha revelado que una gran proporción de la web está formada ya por contenido de mala calidad generado y traducido por distintas clases de Inteligencia Artificial. El estudio, realizado por investigadores del Laboratorio de IA de Amazon Web Services (AWS), encontró por ejemplo que más de la mitad de todas las oraciones en Internet han sido traducidas a dos o más idiomas.
La mala calidad y la escala asombrosa de estas traducciones sugieren que se utilizaron modelos de inteligencia artificial basados en modelos de lenguaje grande (LLM) de generaciones pasadas, más rudimentarios, para crear y traducir el material.
El fenómeno es especialmente prominente en los “lenguajes de menores recursos”, o lenguajes con datos menos disponibles para entrenar modelos de IA de manera más efectiva.
PUBLICIDAD
Los investigadores creen que este contenido está siendo generado por una variedad de actores, incluidos estafadores, creadores de contenido de clickbait y personas que simplemente buscan ganar dinero con la publicidad sin generar contenido consistente, de calidad o incluso real.
El impacto de este contenido de mala calidad en la web es significativo ya que puede dificultar que los usuarios encuentren información precisa y útil. Además puede dañar la reputación de la web en el conjunto de su totalidad como fuente de información confiable.
Encima también puede dificultar que los investigadores de IA aprendan sobre idiomas de menores recursos. Los modelos de IA necesitan grandes cantidades de datos de alta calidad para entrenarse, pero si estos datos están contaminados con contenido de mala calidad, los modelos pueden aprender cosas equivocadas.
Este estudio es una señal de advertencia de que la Inteligencia Artificial generativa puede tener un impacto negativo en la web. Es importante que los usuarios, los motores de búsqueda y los investigadores de IA tomen medidas para abordar este problema.
Como una serpiente que se come su propia cola.