Los datos biológicos nos cuentan una gran cantidad de cosas sobre el mundo que nos rodea, y nos permite entender, por ejemplo, cómo se estructura la diversidad biológica, qué procesos condicionan la formación de comunidades biológicas o cómo diferentes impactos humanos afectan a cualquiera de los niveles de organización biológica. Este libro nos enseña a descifrar las historias que hay detrás de los datos.
¿Para quién es este libro? El libro va dirigido a estudiantes, profesores e investigadores del ámbito de las ciencias naturales que deseen iniciarse en el mundo de la investigación, entender en profundidad algunas de las principales técnicas de análisis de datos utilizadas en el ámbito de la ecología, o conocer la implementación de dichas técnicas en R, uno de los lenguajes de programación más utilizados en investigación científica.
El libro se construye sobre múltiples ejemplos y casos de estudio, para que el lector o lectora pueda ir entendiendo los conceptos a través de la práctica. Parte de conceptos muy básicos, tanto de programación en R como de estadística, para ir avanzando a través de algunas de las técnicas de análisis de datos más frecuentemente utilizadas en el ámbito de la ecología, incluyendo los modelos lineales, los modelos lineales generalizados, los modelos aditivos generalizados, los árboles de regresión y clasificación y los modelos mixtos.
Los autores del libro son profesores de Ecología y Botánica en la Universidad Rey Juan Carlos y han impartido multitud de cursos de estadística aplicada y análisis de datos en ecología en diferentes instituciones nacionales e internacionales. Luis Cayuela investiga los mecanismos ecológicos y biogeográficos que generan los patrones de diversidad en bosques tropicales. Marcelino de la Cruz está especializado en ecología espacial y conservación vegetal. Muchas de las herramientas que han desarrollado durante su investigación están publicadas en forma de paquetes de R en el repositorio oficial.
Índice:
1. Una introducción a R
1.1. ¿Cómo instalar R?
1.1.1. CRAN y paquetes
1.2. La sintaxis de R
1.3. Tipos de objetos en R y la funcion str()
1.3.1. Vectores y matrices
1.3.2. Tablas de datos
1.3.3. Listas
1.3.4. Funciones
1.3.5. Otros tipos de objetos
1.4. El menú de ayuda: aprendiendo a ser autosuficientes
1.5. Recomendaciones para organizar una sesion de trabajo
1.6. R-Commander
1.7. Cómo leer datos en R
1.8. Funciones básicas para la manipulación de datos
1.8.1. Crear subconjuntos de datos
1.8.2. Fusionar tablas de datos
1.8.3. Aplicar funciones sobre subconjuntos de nuestros datos
1.9. Cómo repetir un procedimiento con el comando for()
1.10. Citando R en los trabajos científicos
2. Analisis exploratorio y representación gráfica de datos
2.1. Una introducción a los gráficos con R
2.1.1. El sistema de gráficos en R
2.1.2. Formatos básicos de gráficos
2.1.3. Dispositivos gráficos
2.1.4. Representación de gráficos múltiples
2.1.5. Funciones gráficas de bajo nivel
2.2. Ejemplos de análisis exploratorio
2.2.1. Datos continuos univariados: distribuciones de frecuencias
2.2.2. Datos continuos bivariados: examinando relaciones entre variables
2.2.3. Extensión de técnicas bivariadas a datos multivariados
2.2.4. Datos cuantitativos agrupados y datos cualitativos
2.3. Gráficos condicionados del paquete lattice
2.4. Otras soluciones gráficas: ggplot2
3. Conceptos básicos de estadística
3.1. Estadística descriptiva
3.1.1. La distribución normal
3.2. Estadística inferencial
3.2.1. Introducción al contraste de hipótesis
3.2.2. Errores estadísticos en el contraste de hipótesis
3.2.3. Pruebas estadísticas sencillas para datos cuantitativos
3.2.4. Correlación
4. Introducción a los modelos lineales: regresión
4.1. Organizando el flujo de trabajo para el análisis de datos con modelos lineales
4.2. Regresión simple
4.2.1. Fundamentos teoóicos del modelo de regresión
4.2.2. Cómo ajustar un modelo lineal en R
4.2.3. Contraste de hipótesis y variación explicada por el modelo
4.2.4. Interpretación del modelo
4.2.5. Revisión de los supuestos del modelo
4.3. Regresión múltiple
4.3.1. Ajuste del modelo
4.3.2. Contraste de hipótesis y variación explicada por el modelo
4.3.3. Interpretación y representación gráfica del modelo ajustado
4.3.4. Coeficientes de regresión estandarizados
4.3.5. Multicolinealidad
4.4. Regresión de tipo I y de tipo II
5. Modelos factoriales: análisis de la varianza (ANOVA) y de la covarianza (ANCOVA)
5.1. Anaáisis de la varianza (ANOVA)
5.1.1. Test post hoc y comparaciones múltiples
5.1.2. Evaluación de los supuestos del modelo
5.1.3. Cambio del nivel de referencia en los contrastes de los niveles del factor
5.2. Análisis de la covarianza (ANCOVA)
5.2.1. Homogeneidad de pendientes
5.2.2. ¿Qué ocurre si la interacción es significativa?
5.3. Otros modelos factoriales
5.3.1. Interacción entre factores
5.3.2. ¿La colinealidad tiene sentido cuando las variables explicativas son categóricas?
5.3.3. Sumas de cuadrados en modelos factoriales ¿cuál es más conveniente?
6. Introducción a los modelos lineales generalizados (GLM)
6.1. Estructura de los GLM
6.1.1. El predictor lineal
6.1.2. La función de vínculo
6.1.3. La componente aleatoria
6.1.4. Relación entre el modelo lineal y el GLM
6.2. La función glm()
6.3. Estimación de parámetros por máxima verosimilitud
6.3.1. Devianza residual y devianza explicada
7. GLM para variables respuesta de tipo conteo
7.1. GLM con distribuciones de errores Poisson
7.1.1. Análisis exploratorio y ajuste del modelo
7.1.2. Inferencia en GLM: resolviendo hipótesis sobre causalidad
7.1.3. Interpretación del modelo
7.1.4. Revisión de los supuestos del modelo e idoneidad de la familia de distribución de errores
7.2. GLM con distribución de errores binomial negativa
8. GLM con distribuciones de errores binomiales
8.1. GLM de respuesta binaria
8.1.1. Presentación del caso de estudio: estrategia reproductora de una especie de alga invasora
8.1.2. Analisis exploratorio y ajuste del modelo
8.1.3. Resolución de hipótesis
8.1.4. Interpretación del modelo
8.1.5. Revisión de los supuestos del modelo
8.2. GLM de respuesta de tipo proporción
8.2.1. Presentación del caso de estudio: ¿cuáles son las mejores condiciones de germinación para el ailanto?
8.2.2. Análisis exploratorio y ajuste del modelo
8.2.3. Resolución de hipótesis
8.2.4. Interpretación del modelo
8.2.5. Revisión de los supuestos del modelo
9. Extensiones de la regresión
9.1. Modelos polinómicos
9.2. Modelos aditivos generalizados (GAM)
9.2.1. ¿En qué consiste el suavizado?
9.2.2. El modelo aditivo generalizado (GAM)
9.2.3. Funciones para ajustar un GAM en R
9.2.4. Evaluación del modelo
9.3. Árboles de regresión y de clasificación (CART)
9.3.1. El paquete rpart
9.3.2. Alternativas a los árboles de regresión y clasificación
10. Introducción a los modelos mixtos
10.1. ¿Efecto fijo o aleatorio?
10.2. Modelos mixtos en R: los paquetes nlme y lme4
10.2.1. La función lme()
10.2.2. La función lmer()
10.3. Entendiendo los modelos mixtos
10.3.1. Un ejemplo con bentos marino
10.3.2. Una aproximación al análisis de los datos con modelos lineales
10.3.3. Reanalizando los datos con modelos lineales mixtos
10.4. Inferencia con modelos mixtos
10.4.1. Test de la F
10.4.2. Test de hipótesis para modelos anidados (likelihood ratio test)
10.4.3. Comparación de modelos con AIC
10.5. Análisis de los residuos
10.6. Estimando componentes de la varianza en modelos mixtos
10.7. Modelos lineales generalizados mixtos (GLMM)
10.8. Otras funciones para ajustar modelos mixtos en R
10.9. Evitando problemas de ajuste
Apéndice: paquetes de R
Referencias
Índice alfabético