El rápido ascenso de la IA ha revelado el valor del big data, afirma Wes Morton (CEO, Creative Strategies).
Se avecina una guerra secreta, impulsada por la promesa de la inteligencia artificial (IA).
En las acogedoras salas de juntas de Silicon Valley, los ejecutivos planifican, juzgan y compiten para poseer el combustible del futuro. Estos combustibles sintéticos no son la IA o los sistemas de aprendizaje automático que tanto se promocionan en los medios, sino los océanos de datos que los alimentan.
Han surgido magnates de los medios, empresarios tecnológicos y titanes financieros, que protegen ferozmente sus recién descubiertas minas de oro de datos.
Un mercado multimillonario impulsado por la promesa de conocimientos, ventajas y riquezas que las nuevas formas de aprendizaje automático pueden extraer de grandes cantidades de datos patentados.
El campo de batalla está ambientado en 2024. Los ganadores serán el grupo de competidores que puedan combinar los conjuntos de datos más valiosos con inteligencia artificial avanzada que pueda almacenarlos para obtener información.
En la economía de la información, los datos se han convertido en municiones y la IA en un arma. Bienvenido a la armería.
Datos de armas
En un mundo digital, cada acción que realiza se rastrea, registra y almacena. Durante la última década, el seguimiento y la recopilación digitales han permitido a las empresas recopilar grandes cantidades de datos.
La información incluye sus preferencias de consumo, hábitos de gasto, preferencias de entretenimiento, historial de conducción, historial crediticio, historial médico, historial de búsqueda, historial de redes sociales, historial de viajes, antecedentes penales, antecedentes electorales, registros financieros, registros médicos, antecedentes laborales, lo que sea. ADN.
A pesar del seguimiento de multitudes, el gran volumen de ‘big data’ se ha vuelto inevitable para las empresas y los gobiernos. La explosión de la IA en 2023 en la conciencia colectiva de la comunidad empresarial cambió eso. La IA ha creado una epifanía visceral sobre el valor de los antiguos almacenes de datos en las salas de juntas de las corporaciones globales. Montañas de datos recopilados, antes estáticas, de repente adquirieron un enorme valor como combustible para un futuro digital.
La rama de la IA conocida como «aprendizaje automático» combina estadísticas, algoritmos, retroalimentación y una enorme potencia informática para examinar grandes cantidades de datos y extraer tendencias, correlaciones y patrones. Al mismo tiempo, los directivos están empezando a darse cuenta de que los sistemas semimágicos conocidos como IA son tan útiles como un bebé recién nacido sin conjuntos de datos basados en entrenamiento.
Open AI, Midjourney, Stable Diffusion, Dream Up, Bard, DALL-E, Anthropic y otras marcas que ahora valen miles de millones de dólares construyen sus modelos sobre conjuntos de datos abiertos y cerrados que sus sistemas procesan y entrenan. Desafortunadamente, gran parte de esos datos abiertos se estaban tirando, sin saberlo, a los patios traseros de otras empresas.
La conciencia colectiva sobre el oro de los datos, extraído y extraído mediante el aprendizaje automático, ha alimentado una avalancha enloquecedora de demandas, posiciones y alianzas estratégicas mientras las empresas luchan por proteger su nuevo combustible del futuro: los macrodatos.
La guerra pasa a la esfera pública
La diferencia central de los recientes conflictos empresariales de IA radica en la propiedad de los datos.
Construir una fuerza requiere tanto potencia de fuego como medios para difundirla. La recopilación de datos y la IA actúan como arsenales y armas. Un arma no puede disparar sin munición. Uno no tiene valor sin el otro. Los datos más valiosos generan la mayor potencia de fuego para los mecanismos relevantes de entrega de IA.
Algunos de esos datos son cerrados, propietarios y solo accesibles para determinadas empresas. Los correos electrónicos que escribe en Gmail, las imágenes de Recaptcha que reconoce y las búsquedas que escribe en Google, billones de terabytes de datos de clientes, pertenecen y son operados por Alphabet. Usted aceptó, al aceptar sus términos de servicio, que no leyó, utilizar sus datos para entrenar sus modelos de IA. Su servicio es «gratuito» porque extrae valor de su aportación humana, filtra sus aportaciones a través de modelos de aprendizaje automático y luego le vende productos en función de los resultados de esos modelos.
Mientras tanto, los datos abiertos comenzaron a impulsar el argumento y la posición de la empresa. El New York Times, en particular, demandó a Open AI y a sus nuevos propietarios en Microsoft por supuestamente utilizar millones de artículos de la publicación de noticias para desarrollar chatbots que ahora compiten con ella. El New York Times denuncia una violación masiva de los derechos de autor. De manera similar, autores cuyas novelas han sido destruidas con fines educativos han presentado demandas colectivas.
En el frente del arte generativo, en el que la IA entrena miles de millones de imágenes para recrearlas en originales, un juez federal falló en contra de un grupo de artistas que afirmaron que sus piezas se utilizaron para entrenar las IA de Midjourney y Deviant Art tomó una decisión complicada. Procedimiento de reclamación por infracción contra Stable Distribution.
Para los editores, una demanda contra Alphabet cubre los daños causados por el uso de la inteligencia artificial de búsqueda por parte de Google, que extrae el contenido del editor para mostrarlo en productos propiedad de Google. Productos como el ‘Panel de conocimiento’ y los ‘Fragmentos de características’ brindan respuestas rápidas a preguntas sobre el contenido de sitios web de terceros. Google genera ingresos publicitarios a partir de anuncios de búsqueda, mientras que los creadores de contenido no dirigen tráfico a su sitio web y, por tanto, sin compensación.
Batallas similares están teniendo lugar en todos los tribunales de Estados Unidos. Según John Kell de Fortune, «más de 100 casos relacionados con la IA se están abriendo paso en el sistema legal». Además, los gobiernos estatal y federal han iniciado audiencias sobre la nueva tecnología en anticipación a la regulación. Estas acciones amenazan con sofocar el desarrollo de la IA a medida que las empresas controlan los datos valiosos en los que se basan los modelos y los gobiernos regulan la aplicación de la IA.
Implicaciones para los consumidores
La tensión entre los modelos de IA y los datos editoriales, médicos, financieros y de consumo que los alimentan afectará dramáticamente la tecnología que se lleve al mercado.
La guerra general que se pone de relieve plantea preguntas fundamentales que necesitan respuesta.
¿Nos sentimos cómodos utilizando servicios que entrenan sus modelos de IA en función de nuestro comportamiento y nuestras aportaciones?
¿Quién es el dueño del trabajo creativo cuando la IA hace las portadas?
¿Deberían las empresas de inteligencia artificial compensar a escritores, periodistas y artistas y cómo?
¿Qué información confidencial compartimos y a la que accedemos libremente para crear mejores productos y experiencias?
¿Cómo controlarán los nuevos sistemas de IA cómo y por qué se han tomado medidas contra los individuos?
¿Qué límites deberíamos poner a los sistemas de IA?
La decisión fundamental del futuro de la IA cristalizará en un binario estricto. ¿Apuntaremos nuestros vastos arsenales de datos y el poder de la IA a resolver problemas sociales o centraremos nuestra atención en la autoexplotación?
Para los consumidores, como antes para los productos y servicios, tenemos el poder de votar con nuestro dólar. La recopilación masiva de nuestros datos personales para el uso comercial de la IA ya ha comenzado. El tren salió de la estación con nosotros y nuestros datos a bordo. Depende de todos nosotros montar juntos este tren fuera de control.
*Imagen de encabezado de Cole de Brito*