Almacenamiento de datos moderno y aprendizaje automático
23 diciembre 2023
No hay duda, retención de usuarios Es una métrica de rendimiento importante para muchas empresas y aplicaciones en línea. Analizaremos cómo podemos utilizar las capacidades de aprendizaje automático del almacén de datos integrado para ejecutar modelos de tendencias en datos de comportamiento del usuario para determinar la probabilidad. error de usuario. En esta historia, quiero centrarme en la preparación de bases de datos y el entrenamiento de modelos utilizando SQL estándar. Los almacenes de datos modernos lo permiten. De hecho, la retención es una métrica empresarial importante que comprende la mecánica del comportamiento del usuario. Proporciona una descripción general de alto nivel del éxito de nuestra aplicación a la hora de conseguir usuarios respondiendo una pregunta sencilla: ¿Es nuestra aplicación lo suficientemente buena para conseguir usuarios? Es un hecho conocido que retener a un usuario existente es más barato que adquirir uno nuevo.
En uno de mis artículos anteriores, escribí sobre el almacenamiento de datos moderno (1).
Los DWH modernos tienen muchas características y componentes útiles que los diferencian de otros tipos de plataformas de datos (2).
El soporte del modelo ML parece ser el componente DWH esencial cuando se trata de big data.
En esta historia usaré Regresión logística binaria, uno de los modelos de entrenamiento más rápidos. Mostraré cómo podemos usarlo para predecir la propensión del usuario a actualizar. En realidad, no necesitamos conocer todos los modelos de aprendizaje automático.
No podemos competir con proveedores de servicios en la nube como Amazon o Google en aprendizaje automático y ciencia de datos, pero debemos saber cómo utilizarlo.
Ya escribí en mi artículo aquí (3):
En este tutorial, aprenderemos cómo transformar datos de eventos sin procesar para crear una base de datos de entrenamiento para su ML…