Diplomado Presencial
Lugar:
Distrito Federal
Precio:
Duración:
96 horas
El Tecnológico de Monterrey es un sistema educativo de vanguardia, que tiene como misión formar personas íntegras, éticas, con una visión humanística y competitivas internacionalmente en su campo prof...
contactar con el responsable| Precio |
$1 IVA incluido
|
|
Diplomado |
|
Minería de datos aplicada a negocios (SPSS 15.0, Clementine 11.1) |
|
La minería de datos, entendida como la búsqueda de patrones dentro de grandes bases de datos utilizando para ello métodos estadísticos y de aprendizaje basado en computadora, está empezando a extenderse en nuestro país. Empresas en el sector de telecomunicaciones, financiero y de autoservicio están en el proceso de adquirir alguna solución tecnológica en este campo, por lo que surge una demanda por recursos humanos con conocimientos en minería de datos. Además, al enfrentar un ambiente más competitivo las empresas requieren de tecnologías que les permitan pronosticar, dentro de un marco probabilístico, el comportamiento de sus clientes y prospectos a fin de desarrollar estrategias de atracción o retención. |
|
|
|
Objetivo General: |
|
Diseñar y aplicar procedimientos de minería de datos a la toma de decisiones en los campos de mercadotecnia, negocios, planeación y recursos humanos, a través de la herramienta SPSS 15.0, Clementine 11.1 |
|
|
|
Dirigido a: |
|
Niveles de gerencia y analistas en las áreas de negocios, mercadotecnia, CRM, planeación, recursos humanos y finanzas. |
|
|
|
Contenido: |
|
|
|
Módulo: 1 |
|
Curso introductorio al data mining. |
|
Este módulo está orientado a la formación en los conceptos básicos y avanzados del data mining. Sirve además como curso integrador de las distintas herramientas de SPSS (SPSS 15.0, Clementine 11.1).
Objetivos específicos: Enunciar los elementos fundamentales de un proceso de minería de datos. Definir cada uno de los componentes del proceso de minería de datos. Identificar sus interrelaciones señalando los flujos de retroalimentación. Aplicar la metodología CRISP a un caso de negocio específico. |
|
|
|
Temario |
|
1. Definición de data mining: 1.1 Conceptos amplios y específicos de data mining. 1.2 Breve historia y estado actual. Data mining y estadísticas. 1.3 El valor del data mining. 1.4 Etapas en el data mining. 1.5 El método CRISP-DM. Requerimientos en data mining. 1.6 El data mining como ciencia o disciplina. 1.7 El data mining como arte. 1.8 Habilidades necesarias para el data mining. 1.9 Ejemplos de aplicaciones de data mining.
2. Business Understanding: comprendiendo el problema y planteando los objetivos. 2.1 El contexto del negocio. 2.2 Considerando las restricciones. 2.3 Seguimiento y evaluación de resultados.
3. Enmarcando los objetivos de análisis: el testeo de ideas versus la exploración (Knowledge discovery). 3.1 Definiendo el marco de las preguntas. 3.2 La importancia del grupo de comparación. 3.3 Muestreo. 3.4 Unidades relevantes de análisis. 3.5 Descripción. 3.6 Inferencia. 3.7 Automatización.
4. Preparación y comprensión de los datos: introducción. 4.1 Auditoría de datos. 4.2 Correspondencia entre la estructura de datos y los objetivos de análisis. 4.3 Tamaño del archivo de datos. 4.4 Construcción del archivo de datos. 4.5 Valores perdidos. 4.6 Selección de datos. 5. Transformación y control de datos: introducción. 5.1 Limpieza de datos. 5.2 Controles. 5.3 Datos de texto. Normalización de datos. Creación de nuevas variables. 5.4 Transformaciones. Recodificaciones. Reducción de datos.
6. Técnicas de data Mining Inferencial: introducción. 6.1Técnicas inferenciales. 6.2 Análisis discriminante. 6.3 Regresión lineal. 6.4 Análisis de la varianza. 6.5 Regresión logística y multinomial. 6.6 Regresión monotónica. 6.7 Análisis de series temporales.
7. Modelización: Técnicas automatizadas de data mining. 7.1 Técnicas no inferenciales. 7.2 Análisis de clusters (segmentación). 7.3 Análisis de asociación o Market Basket Anaysis. 7.4 Análisis de links. 7.5 Razonamiento basado en la memoria (Memory Based Reasoning). 7.6 Arboles de decisión. 7.7 Redes Neuronales.
8. Evaluación e implementación: introducción. 8.1 Selección entre modelos. 8.2 Uso de varios modelos. 8.3 Iteración hasta la solución. 8.4 Revisitando la pregunta de análisis. 8.5 Causas de error en data mining. 8.6 Medidas de éxito. 8.7 Implementación de los modelos. 8.8 Implementación de los resultados. |
|
Duración: 12 horas |
|
|
|
Módulo: 2 |
|
Curso de introducción a Clementine. |
|
El objetivo de este módulo es brindar los conocimientos necesarios para operar correctamente el software Clementine utilizando todas sus funcionalidades. El curso está orientado al uso de la herramienta con orientación a la aplicación de soluciones.
Objetivos específicos: Operar las funcionalidades básicas del programa Clementine. Describir en sus características básicas cada uno de los nodos del programa. Llevar a cabo la lectura de una base de datos de distintos orígenes. Declarar las variables de acuerdo a sus características. Seleccionar casos dentro de una muestra a fin de analizarlos por separado. Aplicar transformaciones a los datos y crear nuevas variables. Generar estadísticos descriptivos y gráficos. Exportar los resultados a distintas fuentes. |
|
|
|
Temario |
|
1. Introducción al data mining: data mining con Clementine . 1.1 Estrategias para la gestión del data mining. 1.2 Cuándo el data mining es apropiado.Introducción a Clementine: uso del sistema. 1.3 Programación visual. Nodos: como agregarlos, moverlos, copiarlos, editarlos, renombrarlos y borrarlos. 1.4 Construcción de ?Streams? con Clementine.Acceso a datos: Lectura de datos desde Clementine. 1.5 Acceso a bases ASCII variables y fijas.
2. Lectura de datos en formato SPSS. Visualización de datos con Clementine. 2.1 Definición de tipos de datos. 2.2 Caracterización de variables.
3. Integridad de los datos: introducción. 3.1 Valores perdidos en Clementine. 3.2 El nodo de calidad de datos. 3.3 Distribución de datos. 3.4 Examinando la distribución de datos categóricos. 3.5 Examinando la distribución de datos numéricos. 3.5.1 El nodo histograma. 3.5.1 El nodo estadístico. 3.6 Manejo de archivos de ?Stream?.
4. Manipulación de datos: Introducción al lenguaje CLEM. 4.1 Manejo de registros y el Nodo Seleccionar. 4.2 Manejo de variables y el Nodo Derive. 4.3 Ejecución simultánea de Nodos Derive. 4.4 Generación automática de Nodos operativos. 4.5 Selección automática de casos con información completa. 4.6 Filtrado automático de variables. 4.7 Generación automática de Nodos Derive.
5. Buscando relaciones en los datos: introducción. 5.1 Análisis de relaciones entre variables simbólicas. 5.2 Pares de variables simbólicas y el Nodo Matrix. 5.3 El Nodo Web. 5.4 Análisis de pares de variables numéricas y correlación. 5.5 El Nodo Plot. 5.6 Utilización del Nodo Histograma para visualizar relaciones entre variables numéricas y simbólicas.
6. Técnicas de modelización en Clementine: introducción. 6.1 Redes Neuronales. 6.2 Reglas de Inducción. Redes de Kohonen. 6.3 Reglas de Asociación. 6.4 ¿Qué técnica utilizar, cuándo y por qué?.
7. Redes Neuronales en Clementine: Introducción. 7.1 El Nodo Red Neuronal. 7.2 La paleta de Modelos generados. 7.3 Como explorar un modelo. 7.4 Comprendiendo la red neuronal. 7.5 Creando una base de datos con los valores pronosticados. 7.6 Comparación de los valores reales y los pronosticados. 7.7 Comprendiendo el ?razonamiento? que subyace en los pronósticos. 7.8 El ?resumen? del modelo.
8. Reglas de Inducción con Clementine: Introducción. 8.1 El desarrollo de las reglas de inducción en Clementine. 8.2 Reglas de Inducción con C5.0. 8.3 Explorando el modelo. 8.4 Generación y exploración de ?sets? de reglas. 8.5 Comprensión de las reglas y determinación de la precisión, creando una base de datos con los valores pronosticados. 8.6 Comparación de los valores reales y los pronosticados. 8.7 Comprendiendo los factores de relevancia en la predicción.
9. Unión de Redes Neuronales y Reglas de Inducción: introducción. Comparando modelos. 9.1 El Nodo Análisis. 9.2 Utilización de reglas de inducción como etapa previa a las redes neuronales. 9.3 Utilización de reglas de inducción como etapa posterior a las redes neuronales.
10. Redes de Kohonen: introducción. 10.1 Entrenamiento de las redes de Kohonen. 10.2 Comprensión de las redes de Kohonen. 10.3 Creación de números de referencia para cada cluster o segmento. 10.4 Análisis de los segmentos más relevantes. 10.5 Utilización del Nodo Web para caracterizar los segmentos (profiling). 10.6 Uso de otras variables para desarrollar perfiles.
11. Reglas de Asociación: introducción. 11.1 El Nodo A PRIORI. 11.2 Utilización de las asociaciones.
12. Estrategias de data mining e Implementación de los modelos: introducción. 12.1 Estrategías de data mining. 12.2 El modelo CRISP DM. 12.3 Sugerencias para incrementar la precisión de los modelos. Implementación de los modelos. |
|
Duración: 24 horas |
|
|
|
Módulo: 3 |
|
Curso de manejo de datos con Clementine. |
|
El objetivo del módulo es brindar los conocimientos necesarios para acceder, manejar, transformar y realizar cualquier tipo de operaciones con bases de datos necesarias para desarrollar aplicaciones de data mining.
Objetivos específicos: Fusionar bases de datos añadiendo registros o variables. Seleccionar una muestra aleatoria sobre una base de datos. Declarar datos que tengan secuencias temporales. Agregar información a distintos niveles. Conectar bases de datos utilizando ODBC. |
|
|
|
Temario |
|
1. Combinación de datos de fuentes múltiples: introducción. 1.1 Uso del Nodo Append para combinar bases de datos. 1.2 Uso del Nodo Merge para combinar bases de datos. 1.3 Uso de los Supernodos. 1.4 Creación de Supernodos. 1.5 Reglas en Supernodos. 1.6 Edición de Supernodos. 1.7 Ventajas del uso de Supernodos.
2. Muestreo de datos: introducción. 2.1 Uso del Nodo Distinct para eliminar duplicados. 2.2 Uso del Nodo Sample para seleccionar registros. 2.3 Uso del Nodo Select para dividir la base de datos. 2.4 Caché de datos en Clementine.
3. Manejo de valores perdidos: introducción. 3.1 Valores perdidos en Clementine. 3.2 Uso del Nodo Type para marcar valores nulos. 3.3 Evaluación de la calidad de los datos. 3.4 Incremento de la calidad de los datos utilizando el Nodo Quality. 3.5 Reemplazo de valores nulos por información válida. 3.6 Evaluación automática de valores nulos y fuera de rango. 3.7 Consejos para manejar valores perdidos.
4. Trabajando con fechas: introducción. 4.1 Declaración de formato de fechas en Clementine. 4.2 Definición de campos para trabajar con fechas. 4.3 Cálculos que involucran campos fecha.
5. Trabajando con datos secuenciales: introducción. 5.1 Funciones de secuencia en CLEM. 5.2 Los comandos COUNT y STATE en el Nodo Derive. 5.3 Reestructuración de secuencias utilizando el Nodo History.
6. Manejo de archivos: introducción. 6.1 Resumen de datos utilizando el Nodo Agregate. 6.2 Reestructuración de campos ?Set? utilizando el Nodo Set to Flag. 6.3 Combinando el resultado de los Nodos Agregate y Set to Flag.
7. Acceso a datos via ODBC: introducción. 7.1 Declaración de la fuente de datos. 7.2 Uso del Nodo ODBC para acceder a bases de datos. |
|
Duración: 12 horas |
|
|
|
Módulo: 4 |
|
Curso avanzado de modelización con Clementine. |
|
El objetivo del curso es desarrollar en un nivel profundo y completo todas las habilidades de modelización e implementación de proyectos de data mining.
Objetivos específicos: Identificar las características de los datos y de los problemas para la aplicación idónea de cada modelo. Describir los opciones de experto de cada uno de los nodos de modelado. Aplicar los criterios de evaluación de cada modelo a casos específicos. Analizar los resultados en términos de toma de decisiones. Sintetizar las implicaciones del resultado de los modelos para la implantación. |
|
|
|
Temario |
|
1. Preparando datos para la modelización. 1.1 Depurando los datos. 1.2 Equilibrar los datos. 1.3 Transformaciones numéricas de los datos. 1.4 Conversión marca a rango. 1.5 Ejercicios con preparación de datos.
2. Redes neuronales para clasificar. 2.1 Métodos de entrenamiento. 2.2 Multi-Layer perceptron (MLP). 2.3 La función de base radial. 2.4 Opciones de experto. 2.5 Algoritmos disponibles. 2.6 ¿Qué método, cuándo? 2.7 Análisis de sensibilidad. 2.8 Prevención del sobre entrenamiento. 2.9 Ejercicios con redes neuronales.
3. Reglas inductivas avanzadas. 3.1 Comparación entre C5.0 y árbol C&R. 3.2 Modelización de resultados categóricos usando C5.0 3.3 Modelización de resultados categóricos con árboles C&R. 3.4 Probabilidades previas o a priori en C&RT. 3.5 Coste del error de clasificación en C&RT. 3.6 Usando C&RT para predecir campos numéricos. 3.7 Ejercicios con la regla inductiva avanzada.
4. Técnicas de agrupación. 4.1 Qué buscar cuando agrupamos. 4.2 Agrupación K-Medias. 4.3 Configuraciones del nodo K-Medias. 4.4 Examinado los perfiles de cluster. 4.5 Agrupación con una red de kohonen. 4.6 El nodo kohonen. 4.7 Agrupación bietápica. 4.8 Ejercicios con agrupación.
5. Reglas de asociación avanzadas. 5.1 Reglas de asociación. 5.2 Descubrimiento de reglas apriori. 5.3 Inducción generalizada de reglas (GRI). 5.4 Opciones de experto de apriori. 5.5 Opciones GRI. 5.6 Escogiendo un método y opciones de experto. 5.7 Datos perdidos con reglas de asociación. 5.8 Ejercicios con reglas de asociación.
6. Regresión lineal. 6.1 Conceptos básicos de la regresión. 6.2 Un ejemplo: detección de errores o fraudes en reclamaciones. 6.3 Ejercicios.
7. Regresión logística. 7.1 Introducción a la regresión logística. 7.2 Un análisis logístico multinomial: prediciendo el riesgo de crédito. 7.3 Interpretando los coeficientes. 7.4 Ejercicios.
8. Reducción de datos: componentes principales. 8.1 Uso de componentes principales para modelos de predicción y análisis cluster. 8.2 ¿Qué buscar cuándo se ejecuta un análisis de componentes principales o factores? 8.3 Principios. 8.4 Análisis factorial vs análisis de componentes principales. 8.5 Número de componentes. 8.6 Rotaciones. 8.7 Puntuación de componentes. 8.8 Tamaño de la muestra. 8.9 Métodos. 8.10 Recomendaciones generales. 8.11 Ejemplo: regresión con componentes principales. 8.12 Ejercicios.
9. Detección de secuencias avanzada: secuencia. 9.1 Detección de secuencias. 9.2 Secuencia y CaprI. 9.3 Opciones de experto del nodo secuencia. 9.4 Resultados de secuencia. 9.5 Ejercicios de secuencias.
10. Obteniendo el máximo de los modelos. 10.1 Modificando los valores de confianza para puntuar. 10.2 Modelización de Meta-Nivel. 10.3 Modelización de errores. 10.4 Ejercicios.
11. Taller de aplicaciones. |
| Dónde | Distrito Federal, Calle Del Puente #222 Col. Ejidos de Huipulco, Tlalpan |