Tecnología, Transformación Digital y Emprendimiento

Científico de datos vs ingeniero de datos (y cuál debería elegir)

Cuando iniciamos un proyecto de Machine Learning solemos cometer el error de creer que solo un científico de datos puede llevarlo a cabo y que debemos invertir grandes cantidades de dinero en un perfil sin ni siquiera entender cuál debe ser su rol y alcance dentro del proyecto. La realidad es que en un proyecto de Machine Learning debemos contar siempre con el perfil de un ingeniero de datos, en ocaciones necesitaremos los dos perfiles pero en muchas ocaciones también podemos ejecutar un proyecto solo con un ingeniero de datos, esto dependerá del tipo de proyecto, el diseño y las herramientas de desarrollo.

Portada Active Directory

Autenticación con Azure Active Directory B2C –End to End-

Hace poco tuve la necesidad de implementar un método de autenticación y autorización utilizando Azure Active Directory B2C, ya que este es un servicio relativamente nuevo en Azure me costó encontrar una documentación de inicio a fin -end to end- que ejemplifique mi necesidad. En este post veremos cómo implementar una autenticación con AADB2C en una aplicación web ASP.NET Core, una web API protegida, autorización mediante grupos y consumo del API de Microsoft Graph para consultar información de trabajo del usuario.

Machine Learning | Cómo hacer predicciones en batch usando ML.NET

El framework ML.NET es de gran utilidad para crear aplicaciones con Machine Learning de punta a punta -end to end-, es decir, desde el entrenamiento de un modelo con datos históricos hasta la inferencia o predicción de un resultado con nuevos datos. Cuando creamos una aplicación utilizando ML.NET Model Builder podemos hacer predicciones de un resultado o una predicción a la vez, pero hay ocaciones en que necesitamos hacer muchas predicciones a la vez en forma de batch. En este post haremos un ejercicio para crear una aplicación que predice la cancelación de una reserva de hotel y modificaremos el código para hacer predicciones en batch a partir de varios registros en un archivo .csv.

¿Por qué las empresas deberían tener un Agile Coach? (y no un consultor de proyectos)

La implementación de metodologías ágiles como Scrum es fundamental para la transformación digital de las empresas, y el rol del Agile Coach se está convirtiendo en uno de los más demandadas rápidamente. En las empresas tradicionales este es el rol del consultor o asesor de proyectos, pero ¿qué es un Agile Coach? y ¿cómo puede hacer que la empresa y sus trabajadores lleguen a conseguir sus objetivos marcados?

Machine Learning | Cómo generar nuevos datasets usando bootstrap y ML.NET

Bootstrap es una técnica de remuestreo utilizada para estimar estadísticas de una población mediante el muestreo de un conjunto de datos con reemplazo. En palabras más simples; imaginemos que tenemos una muestra de datos en un dataset y queremos generar una nueva muestra de igual o menor tamaño, entonces tomamos un dato del dataset original de manera aleatoria y la colocamos en un nuevo dataset, a la vez que devolvemos el dato seleccionado al dataset original, y repetimos el proceso hasta generar la nueva muestra deseada. Este enfoque de muestreo se llama muestreo con reemplazo (sampling with replacement)

Machine Learning | Trabajar con múltiples fuentes de datos usando ML.NET

Cuando desarrollamos modelos de machine learning normalmente debemos trabajar unificando datos de diferentes fuentes como archivos .csv, bases de datos o integraciones con APIs. Una de las ventajas de la programación orientada a objetos es que podemos desarrollar funciones para recuperar datos de múltiples fuentes e instanciarlos en un mismo objeto, sin depender de la compatibilidad de los paquetes que utilicemos. En este post veremos cómo instanciar el objeto de origen de datos (dataset) desde múltiples fuentes usando el framework ML.NET.

Machine Learning | 5 ventajas de la programación orientada a objetos para la ingeniería de datos

Para quienes hemos trabajado toda nuestra vida con lenguajes orientados a objetos como Java, C# o Ruby, cuando incursionamos en el mundo de la ciencia de datos nos puede resultar muy complicado el adaptarnos a lenguajes como Python que es muy popular en este campo debido a la facilidad de aprendizaje para quienes no tienen bases de programación, pero para quienes ya tenemos fuertes conocimientos de desarrollo el usar un lenguaje de programación orientado a objetos también puede tener muchas ventajas para usarlo en la ciencia e ingeniería de datos.

Machine Learning | Cómo predecir más de una categoría usando ML.NET

Una de las ventajas de usar el framework ML.NET para la ciencia e ingeniería de datos es la posibilidad de crear experimentos para la creación de modelos de Machine Learning de manera automatizada. En este post vamos a usar la clase MulticlassClassificationExperiment incluida en el paquete Microsoft.ML.AutoML para crear un modelo para predecir la probabilidad de cancelación o cambio en la reserva de un hotel.


Follow My Blog

Get new content delivered directly to your inbox.