¡Oferta!

Estadística práctica para ciencia de datos con R y Python

29,99 55,07 

Otras opciones
Accede gratis al libro
31,20 

En Stock

  • ISBN: 9788426734433
  • Tipo de Encuadernación: Tapa blanda o bolsillo
  • Dimensiones de producto: 17x1x24
  • Número de páginas: 362
29,99 

Producto virtual

  • E-Book ISBN: 9788426734549
55,07 

En Stock

  • ISBN: 9788426734433
  • Tipo de Encuadernación: Tapa blanda o bolsillo
  • Dimensiones de producto: 17x1x24
  • Número de páginas: 362
  • E-Book ISBN: 9788426734549

Libro físico

  • Envíos a todo el mundo
  • Suscriptores obtienen descuentos en la compra de libros físicos, envíos gratuitos en España Peninsular y Baleares y acceso a todo el catálogo digital de Marcombo.
    ¿No estás suscrito? ¡Suscríbete!

eBook

  • Accede al eBook a través de nuestra plataforma digital.
  • Lee online y offline en cualquier dispositivo móvil con nuestra app de lectura.
  • Resalta, crea notas, extrae citas, traduce y busca en el diccionario, todo a través de nuestro lector inmersivo.

Libro físico + eBook

  • Envíos a todo el mundo
  • Accede al eBook a través de nuestra plataforma digital.
  • Lee online y offline en cualquier dispositivo móvil con nuestra app de lectura.
  • Resalta, crea notas, extrae citas, traduce y busca en el diccionario, todo a través de nuestro lector inmersivo.

Suscriptores obtienen descuentos en la compra de libros físicos, envíos gratuitos en toda España y acceso a todo el catálogo digital de Marcombo.
¿No estás suscripto? ¡Suscríbete!

Suscripción

  • Prueba gratis por 7 días. Planes desde 7,99 €/ mes
  • Accede a todo el catálogo de Marcombo
  • Lectura online y offline
  • Acceso a contenidos previos a su publicación
  • Envíos gratuitos y descuentos especiales para compras en la tienda

Suscribirse
Suscribirse
¿Quieres un descuento? ¡Hazte en miembro!

Más información

Descripción

Índice

Detalles

Colecciones

Categorías

Características

  • Autor: Peter Bruce; Andrew Bruce; Peter Gedeck
  • Fecha de publicación: 22/02/2022

Descripción

Los métodos estadísticos son una parte fundamental de la ciencia de datos, pero pocos científicos de datos tienen una formación avanzada en estadística. Los cursos y libros sobre estadística básica rara vez tratan el tema desde la perspectiva de la ciencia de datos. La segunda edición de este libro incluye ejemplos detallados de Python, ofrece una orientación práctica sobre la aplicación de los métodos estadísticos a la ciencia de datos, te indica cómo evitar su uso incorrecto y te aconseja sobre lo que es y lo que no es importante.

Muchos recursos de la ciencia de datos incorporan métodos estadísticos, pero carecen de una perspectiva estadística más profunda. Si estás familiarizado con los lenguajes de programación R o Python y tienes algún conocimiento de estadística, este libro suple esas carencias de una forma práctica, accesible y clara.

Con este libro aprenderás:

  • Por qué el análisis exploratorio de datos es un paso preliminar clave en la ciencia de datos
  • Cómo el muestreo aleatorio puede reducir el sesgo y ofrecer un conjunto de datos de mayor calidad, incluso con Big Data
  • Cómo los principios del diseño experimental ofrecen respuestas definitivas a preguntas
  • Cómo utilizar la regresión para estimar resultados y detectar anomalías
  • Técnicas de clasificación esenciales para predecir a qué categorías pertenece un registro
  • Métodos estadísticos de aprendizaje automático que “aprenden” a partir de los datos
  • Métodos de aprendizaje no supervisados para extraer significado de datos sin etiquetar

Peter Bruce es el fundador del Institute for Statistics Education en Statistics.com.

Andrew Bruce es científico investigador jefe en Amazon y tiene más de 30 años de experiencia en estadística y ciencia de datos.

Peter Gedeck es científico de datos senior en Collaborative Drug Discovery, desarrolla algoritmos de aprendizaje automático para pronosticar propiedades de posibles futuros fármacos.

Información adicional

Peso 0,65 kg
Dimensiones 24 × 17 × 1 cm

Índice

Prefacio .................................................................................................... xi

1. Análisis exploratorio de datos.............................................................. 1
Elementos de datos estructurados .................................................................. 2
Datos rectangulares ......................................................................................... 4
Estimación de la localización ........................................................................... 7
Estimación de la variabilidad ......................................................................... 13
Exploración de la distribución de datos......................................................... 19
Exploración de datos binarios y categóricos ................................................. 27
Correlación .................................................................................................... 30
Resumen ........................................................................................................ 45

2. Distribuciones de datos y muestreo ................................................... 47
Muestreo aleatorio y sesgo de la muestra .................................................... 48
Sesgo de selección ......................................................................................... 54
Distribución muestral del estadístico ............................................................ 57
Bootstrap ....................................................................................................... 61
Intervalos de confianza .................................................................................. 65
Distribución normal ....................................................................................... 69
Distribuciones de cola larga ........................................................................... 72
Distribución t de Student............................................................................... 74
Distribución binomial .................................................................................... 77
Distribución chi cuadrado .............................................................................. 79
Distribución F ................................................................................................. 81
La distribución de Poisson y distribuciones relacionadas .............................. 81
Resumen ........................................................................................................ 85

3. Experimentos estadísticos y pruebas significativas ............................ 87
Prueba A/B..................................................................................................... 88
Pruebas de hipótesis ..................................................................................... 93
Remuestreo ................................................................................................... 96
Significación estadística y valores p ............................................................. 103
Pruebas t ...................................................................................................... 10
Pruebas múltiples ........................................................................................ 111
Grados de libertad ....................................................................................... 115
ANOVA ......................................................................................................... 117
Prueba de chi cuadrado ............................................................................... 123
Algoritmo Multi-Arm Bandit ........................................................................ 130
Potencia y tamaño de la muestra ................................................................ 134
Resumen ...................................................................................................... 138

4. Regresión y pronóstico .................................................................... 139
Regresión lineal simple ................................................................................ 139
Regresión lineal múltiple ............................................................................. 147
Pronóstico mediante la regresión ............................................................... 157
Variables de tipo factor en la regresión ...................................................... 160
Interpretación de la ecuación de regresión ................................................ 166
Diagnósticos de regresión ........................................................................... 172
Regresión polinomial y por spline ............................................................... 183
Resumen ...................................................................................................... 189

5. Clasificación ..................................................................................... 191
Bayes ingenuo ............................................................................................. 192
Análisis discriminante .................................................................................. 197
Regresión logística ....................................................................................... 203
Evaluación de modelos de clasificación ...................................................... 215
Estrategias para datos que no están equilibrados ....................................... 224
Resumen ...................................................................................................... 230

6. Aprendizaje automático estadístico ................................................. 231
K-vecinos más cercanos ............................................................................... 232
Modelos de árbol ......................................................................................... 243
Métodos de bagging y bosque aleatorio ..................................................... 253
Boosting ....................................................................................................... 263
Resumen ...................................................................................................... 275

7. Aprendizaje no supervisado ............................................................. 277
Análisis de componentes principales .......................................................... 278
Agrupación K-means ................................................................................... 287
Agrupación jerárquica ................................................................................. 296
Agrupación basada en el modelo ................................................................ 301
Variables categóricas y escalado................................................................. 308
Resumen ..................................................................................................... 316

Bibliografía .......................................................................................... 317