Descripción
La minería de datos es una práctica de análisis que permite obtener un determinado conocimiento a partir de la información extraída de una base de datos. El objetivo del presente libro es instruir al lector en esta disciplina y guiarlo en el desarrollo de modelos descriptivos y predictivos que faciliten la toma de decisiones en una organización, a partir de la herramienta SPSS Clementine, uno de los programas más usados hoy en día para ese fin.
Entre los principales temas abordados en esta obra se hallan la metodología y las técnicas de este campo, las características de SPSS Clementine, las opciones de su interfaz y los pasos para su instalación. Además de ello, se proponen veinte casos prácticos que son resueltos de manera didáctica con técnicas como los árboles de decisión, las redes neuronales, los clústeres, las series temporales, las reglas de asociación y dependencia, la validación de datos erróneos, y la integración y partición de datos.
Este libro está dirigido a todos aquellos que necesiten efectuar decisiones a partir del análisis de grandes bases de datos. Por tal motivo, representa un aporte valioso para los estudiantes y profesionales de las carreras de Ingeniería de Sistemas,Ingeniería Industrial, Estadística, Administración de Empresas, Marketing, Medicina, Educación, entre otras.
Índice
Introducción
CAPÍTULO 1: Conceptos básicos de minería de datos
1.1 Minería de datos
1.2 Procesos de minería de datos (KDD)
1.3 Metodología CRISP
1.4 Modelo
1.5 Modelo híbrido
1.6 Predicción
1.7 Almacén de datos (data warehouse)
Resumen
CAPÍTULO 2: Técnicas y aplicaciones de la minería de datos
2.1 Modelos de minería de datos
2.2 Métodos de minería de datos
2.2.1 Árboles de clasificación
2.2.2 Redes neuronales
2.3 Aplicación de la minería de datos
2.3.1 Minería de datos en la educación
Resumen
CAPÍTULO 3: Presentación general de SPSS Clementine
3.1 SPSS Clementine
3.1.1 Sector público
3.1.2 CRM
3.1.3 Web mining
3.1.4 Desarrollo de fármacos
Resumen
CAPÍTULO 4: Interfaz y categorías de SPSS Clementine
4.1 Elementos de la interfaz de SPSS Clementine
4.1.1 Clementine Stream Canvas
4.1.2 Nodos Palette
4.1.3 Clementine Managers
4.1.4 Clementine Proyects
4.2 Categorías de SPSS Clementine
4.2.1 Categoría Source
4.2.2 Categoría Record Ops
4.2.3 Categoría Field Ops
4.2.4 Categoría Output
4.2.5 Categoría Graphs
4.2.6 Categoría Modeling
4.2.7 Categoría Export
Resumen
CAPÍTULO 5: Instalación de SPSS Clementine
5.1 Instalación del programa SPSS Clementine
5.1.1 Pasos para la instalación del programa SPSS Clementine
Resumen
CAPÍTULO 6: Aplicaciones con diferentes técnicas de minería de datos
6.1 Caso n.º 1: Predicción de juego de tenis (árboles de decisión)
6.2 Caso nº. 2: Predicción de planta iris
6.3 Caso nº. 3: Predicción de fármacos
6.4 Caso nº. 4: Problemas de clúster (caso empleados Memolum Web)
6.5 Caso nº. 5: Agrupamientos en relación a las ventas
6.6 Caso nº. 6: Datos erróneos y faltantes (caso empleados Memolum Web)
6.7 Caso nº. 7 Obtener y transformar datos a través de ODBC (conexión de base de datos abierta)
6.8 Caso nº. 8: Catalog_forecast (series de tiempo)
6.9 Caso nº. 9: Computer hardware data set
6.10 Caso nº. 10: Detección de fraude
6.11 Caso nº. 11: Validación del modelo Drug con datos nuevos
6.12 Caso nº. 12: Integración y partición de datos
6.13 Caso nº. 13: Columna vertebral (partición de datos )
6.14 Caso nº. 14: Validación cruzada
6.15 Caso nº. 15: Trabajar con pocos registros
6.16 Caso nº. 16: Reglas de asociación y dependencia
6.17 Caso nº. 17: Regresión logística (telecomunicaciones churn)
6.18 Caso nº. 18: Predicción secuencial
6.19 Caso nº. 19: Exportación de modelos y resultados
6.20 Caso nº. 20: Serires de tiempo (pronosticar)
Resumen
BIBLIOGRAFÍA