Formación en bases de datos

ITAM- Instituto Tecnológico Autónomo de México

Diplomado en Herramientas de Minería de Datos para Soporte en la Toma de Decisiones

ITAM- Instituto Tecnológico Autónomo de México
En Magdalena Contreras

$ 50001-60000
¿Quieres hablar con un Asesor sobre este curso?

Información importante

Tipología Diplomados
Nivel Nivel iniciación
Lugar Magdalena contreras
Horas lectivas 120h
Duración 6 Meses
Inicio 05/08/2019
  • Diplomados
  • Nivel iniciación
  • Magdalena contreras
  • 120h
  • Duración:
    6 Meses
  • Inicio:
    05/08/2019
Descripción

Objetivo del curso: El programa cubre dos grandes necesidades: por un lado, contemplar los niveles de detalle y las dimensiones de vista consolidada que satisfagan las necesidades previsibles de las empresas; por otro lado, proporciona técnicas y herramientas para analizar los datos transaccionales de la empresa y de los correspondientes a la información del entorno. Destinatarios del curso: A personal responsable de las actividades directas de la formación del repositorio consolidado, o bien, de la elaboración de los modelos de minería de datos. Se requieren conocimientos previos de bases de datos relacionales y uso de hoja electrónica.

Instalaciones (1) y fechas
Dónde se imparte y en qué fechas
Inicio Ubicación Horario
05 ago 2019
Magdalena Contreras
Av. Camino a Santa Teresa 930, Col. Héroes de Padierna, 10700, Ciudad de México (Distrito Federal), México
Ver mapa
Lunes de 19:00 a 22:00 h. y Miércoles de 19:00 a 22:00 h.
Inicio 05 ago 2019
Ubicación
Magdalena Contreras
Av. Camino a Santa Teresa 930, Col. Héroes de Padierna, 10700, Ciudad de México (Distrito Federal), México
Ver mapa
Horario Lunes de 19:00 a 22:00 h. y Miércoles de 19:00 a 22:00 h.

Preguntas Frecuentes

· ¿Cuáles son los objetivos de este curso?

Proporcionarle al participante los conocimientos y las habilidades requeridas para obtener provecho de las herramientas de datawarehouse. El programa cubre dos grandes necesidades: por un lado, contemplar los niveles de detalle y las dimensiones de vista consolidada que satisfagan las necesidades previsibles de las empresas; por otro lado, proporciona técnicas y herramientas para analizar los datos transaccionales de la empresa y de los correspondientes a la información del entorno. Con este Diplomado, el participante podrá llevar a cabo los diseños de los repositorios para el primer caso, y conocerá las técnicas y las herramientas para llevar a cabo las tareas ya clásicas en las aplicaciones de minería de datos.

· ¿A quién va dirigido?

A personal responsable de las actividades directas de la formación del repositorio consolidado, o bien, de la elaboración de los modelos de minería de datos. Se requieren conocimientos previos de bases de datos relacionales y uso de hoja electrónica.

· ¿Qué pasa después de pedir información?

Gracias por su interés en nuestros programas. Recibirá un correo electrónico con información más clara del programa.

Opiniones

0.0
No valorado
Valoración del curso
97%
Lo recomiendan
4.6
excelente
Valoración del Centro

Reseñas de este curso

No hay opiniones de este curso todavía
* Reseñas reunidas por Emagister & iAgora

Logros de este Centro

2017

¿Cómo se consigue el sello CUM LAUDE?

Todos los cursos están actualizados

La valoración media es superior a 3,7

Más de 50 reseñas en los últimos 12 meses

Este centro lleva 12 años en Emagister.

¿Qué aprendes en este curso?

Base de datos
Datawarehouse
Minería
Hacking
Minería de Datos
Diseño de redes
Informática
Switches
TCP-IP
SQL

Profesores

Mtro. Rafael Gamboa
Mtro. Rafael Gamboa
Coordinador

Desde 1983, es profesor de tiempo completo en el Departamento Académico de Computación de la División de Ingenierías del ITAM. Sus áreas de interés son las plataformas distribuidas, la integración de aplicaciones, los lenguajes de programación, el análisis de datos, la conformación de repositorios consolidados de datos, la extracción de información de grandes volúmenes de datos y su incorporación en aplicaciones de índole transaccional y para soporte a la toma de decisiones.

Programa académico

MÓDULO 1
DATOS

Objetivo
Actualmente, los datos provienen de distintas fuentes. Por un lado, se tienen bases de datos relacionales, y por el otro, los datos conocidos como no estructurados provenientes de bitácoras o repositorios en JSON o XML, o en texto libre. En el primer módulo se examinan los conceptos y procesos para el tratamiento de los datos y para elaborar las tablas de hechos, o bien, repositorios o procesos de explotación especializados para uso en las labores de análisis de datos. Se estudian las técnicas para elaborar junturas de tablas y la formación de cuadros resumen, con las agrupaciones de conteo, suma, promedios y desviación estándar.

Temario
1. Tablas y gráficos dinámicos en MS Excel. Funciones de agregación. Atributos e ítems agregados. Gráficos de dispersión.
2. Bases de datos relacionales. Uso de MS Access. Repaso de atributos y relaciones. Consultas, uniones y junturas. Consolidación de cuadros resumen.
3. Python y uso de pandas. Dataframes. Consultas, uniones y junturas. Consolidación de cuadros resumen. Salida gráfica.
4. Transformación de datos. Atributos calculados.
5. Explotación de datos en repositorios públicos. Datos de INEGI. Procesos automatizados de descarga de tablas. Armado de tablas de hechos.

MÓDULO 2
TÉCNICAS

Objetivo

En el segundo módulo se presentan los fundamentos de las técnicas aplicadas a las actividades de elaboración y de prueba de conjeturas. El módulo inicia con la presentación de las técnicas estadísticas y continúa con las herramientas de modelado analítico. Se analizan los conceptos de correlación lineal y se revisan las distribuciones estadísticas más comunes. Se contemplan las transformaciones de los datos y su justificación. Se revisan los procedimientos para imputar datos faltantes de acuerdo con las distribuciones y correlaciones observadas en los datos o derivados de información adicional. Se contemplan los cuatro modelos básicos: clasificación y estimación de continuos como métodos supervisados, y asociaciones y conglomerados como métodos no supervisados, y se justifica su funcionamiento.

Temario
1. Variables continuas y variables discretas. La estadística como herramienta de exploración de los hechos representados por los datos. Creación de modelos. Variable objetivo y variables explicativas. Estadística descriptiva. Estimadores estadísticos principales. Histogramas y cruces de variables. Variables discretas y variables continuas. Combinaciones. Tratamiento. Elección de intervalos para los cruces de las variables continuas. Variables ordinales. Distribuciones de probabilidad. Supuestos y hechos importantes. Inferencia estadística.

2. Correlación lineal. Regresión lineal. Variable objetivo. Estimación como valor esperado. Variantes. Series de tiempo, autorregresión, estacionalidad. Pronóstico. La correlación y la covarianza. Relaciones lineales y relaciones no lineales. Análisis multidimensional. Análisis Discriminante. Componentes principales.

3. Concepto y medida de información e información mutua.

4. Técnicas analíticas / KDD. Modelos de clasificación. Modelos predictivos. Formación de conglomerados. Alternativas para formación de conglomerados. Reglas de asociaciones y técnicas de canasta.

5. Minería / analítica de datos. Método general de trabajo. Separación en datos de prueba y datos de entrenamiento para el caso de modelos con aplicación a futuro. Método de MultiFold para validación cruzada.

6. Clasificadores: Objetivo. Información y métricas básicas de ajuste. Área de la ROC. Función de utilidad. Lift. Score de corte. Árboles de clasificación, métodos bayesianos, regresión logística y su relación con el análisis discriminante. Redes neuronales como clasificadores. Arquitectura. Bosques aleatorios. Máquinas de soporte vectorial. Modelos KNN.

7. Pronóstico: Revisión de la regresión lineal. Correlación lineal como medida de bondad de ajuste. CART o árbol de regresiones, criterio de separación de los nodos u hojas. Redes neuronales como estimadores de continuos. Arquitecturas. Redes neuronales en series de tiempo. Arquitecturas. Modelos KNN.

8. Asociaciones: Problema básico de la canasta de productos. Método a priori. Métricas aplicables. Cadenas de Markov y patrones de comportamiento.

9. Conglomerados: Métricas de similitud y separación. Técnicas y métodos. Técnicas basadas en la distancia. Técnicas basadas en la similitud.

MÓDULO 3
APLICACIONES


Objetivo
En el tercer módulo se perfecciona el uso de los conceptos, las técnicas y las herramientas mediante el desarrollo de casos con volúmenes apreciables de datos. Se consideran situaciones en las que se parte de datos transaccionales para las labores de minería. Los datos se toman de repositorios públicos.

Temario
1. Patrones y relaciones entre elementos. Representación y formación de redes.

2. Sobrecarga y compensación en modelos de clasificación.

3. Exportación de los modelos. Inserción en aplicaciones transaccionales para automatización de decisiones.

4. Análisis exploratorio de los datos. Establecimiento de conjeturas. Establecimiento de los modelos. Entrenamiento, prueba y validación. Validación estadística de los resultados.

5. Minería de textos. Definición del dominio. Restricciones. Técnicas por medio de transformación de palabras. Técnicas por detección de patrones de expresiones.

6. Aplicaciones “establecidas”. Análisis de potenciales acreditados. Valuación de bienes. Análisis y pronóstico de ventas. Eficiencia de campañas publicitarias. Prospección de venta cruzada.

Los usuarios que se interesaron por este curso también han mostrado interés por...
Ver más cursos similares