• Introducción h2o Python

    Construcción del modelo. Detalles del modelo. Perfomance versus prediction. En este apartado tomamos un primer contacto con h2o para python. Previamente se ha instalado con las instrucciones que figuran en el siguiente enlace: http://h2o-release.s3.amazonaws.com/h2o/rel-wright/2/index.html. NOTA: Si el usuario tiene instalado ANACONDA, con el mismo también se instala...

  • Parámetro C en Clasificación

    División y escalado de los datos En post anteriores, se ha explicado los métodos existentes para trabajar con modelos de regresión logística, tanto con python como con R. En el caso de tabajar con Python y en concreto con scikit-learn, ya se ha comentado que existe un...

  • OpenTSDB

    Arquitectura Características principales de OpenTSDB. La tecnología mapreduce que descansa sobre Hadoop ha permitido desarrollar muchas herramientas dentro el mundo “BigData” para el tratamiento de datos masivos. Muchas de estas tecnología se engloban dentro del denominado ecosistema de Hadoop que facilitan mucho la labor dentro del apartado...

  • Regresión Logit con Python

    Datos utilizados Extracción de datos del modelo Evolución del modelo con parámetro C Otro ejemplo Inicio construcción del modelo Implementación del modelo Medidas de fiabilidad Acuracidad Precisión y recall F1 score Resumen fiabilidad Curva de Roc En un post anterior, ya se ha comentado la parte teórica...

  • Primeros pasos con Python

    Python. Tipos de datos. Datos numéricos. Cadena de caracteres. Valores de tipo Boolean. Tipos de colecciones. Tuplas Listas. Diccionarios. Instrucciones condicionales. loops en Python. Numpy. Indexando valores. Slicing Operaciones con arrays. Números aleatorios. Pandas. DataFrame. Series. Creando gráficos. En el presente post nos vamos a centrar en...

  • Clasificación Logit

    Construcción del modelo Matriz de confusión Librerías de R Curva de ROC En post anteriores, ya se ha presentado el modelo de regresión logística, y se ha mostrado alguna de sus aplicaciones, cómo se interpretan los parámetros obtenidos en la regresión, así como la probabilidad de pertenecer...

  • Presentación de Python

    Python es un lenguaje de programación libre de propósito general que es utilizado por una comunidad muy amplia de usuarios. A pesar de ser un lenguaje genérico, son muchos los módulos que hoy en día se han desarrollado para poder ser utilizados dentro de el campo de Big Data y...

  • Regresión Logit (Stepwise)

    Presentación de los datos Modelo paso a paso forward Método forward Método backward Utilización de Leave-One-Out Cross Validación En un post anterior ya se ha expuesto que se puede utilizar el criterio marcado por el indicador “IV” para seleccionar las variables que entrarían en el análisis. En...