Descripción
Aprender acerca de la inteligencia artificial (IA) y hacer realidad sus primeros modelos ahora es más fácil que nunca. Introducción al aprendizaje automático con Orange le guiará en este camino a través de una de las herramientas de software de código abierto más potentes de la actualidad, Orange Data Mining.
En este libro encontrará una explicación detallada sobre Orange Data Mining, una plataforma que proporciona un entorno visual y de programación para la exploración, representación gráfica y análisis de datos. A través de un enfoque basado en componentes, este software le permitirá construir flujos de trabajo analíticos personalizados mediante la conexión de diferentes widgets para realizar tareas específicas.
Apto para aficionados, curiosos y expertos por igual, este libro no solo cubre los fundamentos de la IA, sino que también le invita a sumergirse en la programación de modelos de IA por su cuenta, aprovechando una comunidad activa que constantemente enriquece Orange con nuevas capacidades y funcionalidades. Gracias a la lectura de este libro:
- Aprenderá a usar el entorno de trabajo de Orange.
- Comprenderá los principios del análisis de datos y su visualización.
- Dominará los conceptos fundamentales del aprendizaje automático.
Será capaz de desarrollar sus propios modelos de inteligencia artificial. Únase a este viaje para explorar, aprender y crear con inteligencia artificial, mientras fomenta la colaboración y la innovación dentro de una comunidad de código abierto en constante crecimiento. Este libro es la puerta de entrada a un mundo donde la tecnología punta está al alcance de su mano. No lo deje escapar, transforme su comprensión de los datos y sus habilidades en IA.
Índice
CAPÍTULO 1
Introducción a Orange y su entorno de trabajo 1
1.1. Introducción 1
1.2. Instalación de Orange 2
1.3. El entorno de trabajo de Orange 6
1.4. Flujo de trabajo en Orange.Canvas y widgets 13
CAPÍTULO 2
Conceptos fundamentales del aprendizaje automático
2.1. Introducción 27
2.2. Clasificación de las metodologías y técnicas fundamentales del aprendizaje automático 28
2.3. Métodos de regresión 31
2.4. Métodos de clasificación 37
2.5. El agrupamiento 42
CAPÍTULO 3
Análisis de bases de datos
3.1. Sobre la calidad de las bases de datos 53
3.2. Detección de espurios y de posibles agrupaciones en el conjunto de datos 54
3.3. Exploración de datos faltantes 59
3.4. Sobre los tipos de datos faltantes 62
3.5. Aplicación de metodologías de imputación 63
3.6. Escalado de las variables 64
CAPÍTULO 4
Visualización de datos
4.1. Introducción al análisis exploratorio 69
4.2. Gráficos de dispersión 73
4.3. Gráficos de cajas 75
4.4. Gráficos de violín 78
4.5. Gráficos de barras 83
4.6. Gráficos de distribución 84
4.7. Diagramas de tamiz 85
4.8. Gráficos de mosaico 87
4.9. Mapas de calor 89
CAPÍTULO 5
Redes neuronales artificiales
5.1. Introducción a las redes neuronales artificiales 93
5.2. Conjuntos de datos 94
5.3. Arquitectura de una red 95
5.4. Funciones de activación 97
5.5. Funciones de coste 102
5.6. Algoritmo de retropropagación 104
5.7. Otras arquitecturas de redes 106
5.8. Ejemplo. MLP para el set de datos MNIST 107
CAPÍTULO 6
Las máquinas de vectores de soporte
6.1. Introducción 115
6.2. Ejemplo de aplicación de las máquinas de vectores de soporte como clasificador en Orange 116
6.3. Medidas de rendimiento 120
6.4. Curvas ROC 122
6.5. Teoría de las máquinas de vectores de soporte 126
6.6. Modelos de árbol 139
CAPÍTULO 7
Métodos combinados (ensemble)
7.1. Introducción 147
7.2. Métodos combinados 148
7.3. Gradient boosting 153
7.4. Sobre los tipos de datos faltantes 165
7.5. Aplicación de metodologías de imputación 168
7.6. Escalado de las variables 169