La inteligencia artificial y la infraestructura de datos están impulsando la demanda de nuevas empresas de código abierto

Un nuevo informe destaca la demanda de comenzar a construir herramientas y tecnologías de código abierto para la creciente revolución de la IA, mientras que las verticales de infraestructura de datos adyacentes también se están calentando.

Runa Capital, la firma de capital de riesgo (VC) que despegó de Silicon Valley y trasladó su sede a Luxemburgo en 2022, ha publicado el Runa Open Source Startup Index (ROSS) durante los últimos cuatro años, destacando las de más rápido crecimiento. Inicio de software comercial de código abierto (COSS). La empresa publica actualizaciones trimestrales, pero el año pasado elaboró ​​su primer informe anual y una visión general de todo el año 2022, algo que ahora repetirá para 2023.

Tendencias

Los datos están estrechamente relacionados con la IA porque la IA se basa en datos para aprender y hacer predicciones, y esto requiere infraestructura para gestionar la recopilación, el almacenamiento y el procesamiento de esos datos. Y en este informe, estas tendencias contradictorias chocaron.

En el índice ROSS del año pasado, LangChain, una startup de dos años de San Francisco que desarrolló un marco de código abierto para crear aplicaciones basadas en modelos de lenguaje a gran escala (LLM), ocupó el primer lugar. El proyecto insignia de la compañía superó las 72.500 estrellas en 2023, y Sequoia lideró una ronda Serie A de 25 millones de dólares en LangChain apenas el mes pasado.

Las 10 principales empresas emergentes de COSS en el índice ROSS de 2023

Las 10 principales empresas emergentes de COSS en el índice ROSS de 2023 Créditos de imagen: Runa capital

En otra parte del top 10 se encuentra Reflex, un marco de código abierto para crear aplicaciones web en Python puro, y la compañía detrás del producto obtuvo recientemente una inversión inicial de $ 5 millones; AITable, un creador de chatbot de IA basado en hojas de cálculo y algo parecido a un competidor de Airtable de código abierto; Sismo, una plataforma de privacidad que permite a los usuarios revelar selectivamente datos personales a aplicaciones; HPC-AI, que está construyendo una plataforma distribuida de desarrollo e implementación de IA en un esfuerzo por convertirse en algo parecido a OpenAI del sudeste asiático; y la base de datos de vectores de código abierto Qdrant, que recientemente obtuvo 28 millones de dólares para capitalizar la floreciente revolución de la IA.

Una revisión exhaustiva de las «50 tendencias más importantes» de las nuevas empresas de código abierto del año pasado revela que más de la mitad (26) están relacionadas con la inteligencia artificial y la infraestructura de datos.

Las 50 principales empresas emergentes de COSS en el índice ROSS de 2023

Las 50 principales empresas emergentes de COSS en el índice ROSS de 2023 Créditos de imagen: Runa capital

Es difícil comparar adecuadamente la gama de 2023 con la del año anterior desde una perspectiva vertical, porque las empresas a menudo cambian o modifican el posicionamiento de sus productos para adaptarse a lo que está de moda hoy. Con el revuelo de ChatGPT en pleno apogeo el año pasado, esto está provocando que las startups en etapa inicial cambien su enfoque, o incluso simplemente pongan más énfasis en el elemento «IA» existente de su producto.

Pero a medida que avanza el año de la IA productiva, es fácil ver por qué la demanda de componentes de código abierto podría aumentar, a medida que empresas de todos los tamaños intentan seguir el ritmo de los desarrolladores de IA patentados como OpenAI, Microsoft y esperan a Google.

Geografía

El software de código abierto también siempre ha estado muy extendido, con desarrolladores de todo el mundo. Este espíritu a menudo se traduce en una startup comercial de código abierto que puede no tener un centro de gravedad tradicional anclado en una sede física.

Sin embargo, el índice ROSS pone de alguna manera la geografía en escena, informando que 26 empresas en la lista tienen su sede en los Estados Unidos, aunque 10 de estas empresas se originaron en otros lugares y todavía tienen fundadores o empleados en otros lugares.

En total, las 50 primeras empresas procedían de 17 países diferentes, de las cuales 23 tenían su sede en Europa, un aumento del 20 por ciento en comparación con el año pasado. Francia contó con la mayor cantidad de titulares de COSS con siete, incluidos Sismo y Massa entre los 10 primeros, mientras que el Reino Unido pasó de solo un titular en 2022 a seis en 2023, y eso, desde una perspectiva europea, ocupó el segundo lugar.

Otras cosas interesantes que surgen del informe incluyen los lenguajes de programación: el índice ROSS registró 12 lenguajes utilizados por los 50 principales el año pasado, frente a 10 en 2022. Pero Typecript, un superconjunto de JavaScript desarrollado por Microsoft, siguió siendo el más popular, utilizado por un 38%. de las 50 iniciativas principales. Tanto Python como Rust aumentaron en popularidad, mientras que Go y JavaScript disminuyeron.

Índice ROSS: lenguajes de programación de tendencia

Índice ROSS: lenguajes de programación de tendencia. Créditos de imagen: Runa capital

Los 50 principales contribuyentes del índice ROSS ganaron colectivamente 12.000 contribuyentes para 2023, mientras que el recuento de estrellas de GitHub aumentó a un total de 500.000. El índice también revela que la financiación entre las 50 nuevas empresas de COSS alcanzó los 513 millones de dólares el año pasado, un aumento del 32% en 2022 y del 145% en 2021.

El índice ROSS: participantes, estrellas y financiación

El índice ROSS: participantes, estrellas y financiación Créditos de imagen: Runa capital

Metodología y contexto

Vale la pena analizar la metodología detrás de todo esto: ¿qué factores influyen en si una empresa se considera «de máxima tendencia»? Para empezar, todas las empresas están incluidas. debe tener al menos 1000 estrellas de GitHub (la métrica de GitHub se considera un «me gusta» en las redes sociales). Pero contar estrellas por sí solo no nos dice mucho sobre las tendencias, porque las estrellas se acumulan con el tiempo, por lo que es más probable que un proyecto que ha estado en GitHub durante 10 años que uno que ha estado en GitHub durante 10 años recopile más estrellas durante meses. En cambio, Runa mide el crecimiento relativo de las estrellas durante un período de tiempo determinado utilizando una tasa de crecimiento anual (AGR): esto compara el valor actual de la estrella con un período relativo en el pasado para ver qué ha crecido de manera más efectiva.

También hay un grado de destreza manual involucrado aquí, ya que el objetivo es lanzar exclusivamente «startups» de código abierto, por lo que el equipo de inversión de Runa está lanzando proyectos que pertenecen a una «organización comercial basada en productos», y deben haberse establecido hace menos de hace diez años con menos de 100 millones de dólares en fondos conocidos.

Definir lo que constituye «código abierto» tiene sus propios desafíos, ya que existe un espectro de cómo se ve una startup de «código abierto»; algunas se parecen más a «código abierto», con la mayoría de sus características clave detrás de una premisa cerrada. muro de pago, y algunas licencias son más restrictivas que otras. Por eso, para ello, los curadores de Runa decidieron que el comienzo debería ser sólo un producto que «rconvenientemente vinculados a sus repositorios de código abierto”, lo que obviamente implica un elemento de subjetividad a la hora de decidir cuáles pasan el corte.

Hay otros matices en el juego. El índice ROSS adopta una interpretación particularmente liberal de «código abierto»; por ejemplo, tanto Elastic como MongDB han abandonado sus raíces de código abierto con licencias que son «fuente disponible», para protegerse de ser aprovechados por los principales proveedores de la nube. Según la metodología del Índice ROSS, estas dos empresas calificarían como «código abierto», aunque sus licencias no han sido aprobadas oficialmente por la Iniciativa de Código Abierto, y estas empresas de muestra en particular ya no se describen a sí mismas como «código abierto».

Así, según la metodología de Runa, utiliza para su informe lo que él llama el «entendimiento comercial del código abierto», además de la propia licencia que la empresa adjunta a su proyecto. Esto significa que las licencias de fuente limitada como BSL (licencia de fuente comercial) y SSPL (licencia pública de servidor), que MongoDB introdujo en 2018 como parte de su transición desde el código abierto, son tan comunes como muchas empresas comerciales están en el menú. en relación con el índice ROSS.

«Esas licencias preservan el espíritu del OSS: todas sus libertades, excepto la redistribución limitada, que no afecta a los desarrolladores, pero da a los proveedores originales una ventaja competitiva a largo plazo», dijo Konstantin Vinogradov, socio general de Runa Capital con sede en Londres. explicó a TechCrunch. «Desde la perspectiva de VC, es simplemente un manual en evolución para el mismo tipo de empresas. La definición de código abierto se aplica a productos de software, no a empresas.

También están disponibles otros filtros interesantes. Por ejemplo, las empresas centradas principalmente en la prestación de servicios profesionales, o proyectos paralelos con apoyo activo limitado o sin un componente comercial, están incluidas en el Índice ROSS.

Para fines comparativos, existen listas y listas que realizan un seguimiento de «lo que está de moda» en el panorama del código abierto. Otra firma de capital de riesgo llamada Two Sigma Ventures, por ejemplo, mantiene el Open Source Index, que es similar en concepto al de Runa, excepto que cubre todo tipo de proyectos de código abierto (no sólo startups) y tiene filtros adicionales, incluida la capacidad para ver. por la métrica de «audiencia» de GitHub, que según algunos da una imagen más precisa de la verdadera popularidad de un proyecto.

El propio GitHub también publica una página de repositorios de tendencias que, al igual que Two Sigma Ventures, no se centra en el negocio detrás del proyecto.

Es por eso que el Índice ROSS ha surgido como una útil herramienta complementaria para saber qué «startups» de código abierto merecen especial atención.

Puede interesarte

Comprender el centro de datos CT de alto rendimiento

Todos ganan. Los contribuyentes se benefician. El trabajo duro gana. El círculo gana. Connecticut gana. …

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *