Objectifs
1. Qu'est-ce qu'un MLM et pourquoi est-ce important?
Défi 1
1. Qu'est-ce qu'un MLM et pourquoi est-ce important?
1. Qu'est-ce qu'un MLM et pourquoi est-ce important?
Introduction au jeu de données
Q: Est-ce que la position trophique des poissons augmente avec leur taille?
Dans cet atelier, il y aura une série de DÉFIS que vous reconnaîtrez par le symbole du cube rubique
1. Qu'est-ce qu'un modèle linéaire à effets mixtes (MLM) et pourquoi est-ce important?
2. Comment appliquer, vérifier les suppositions, comparer et présenter les résultats des MLMs dans R?
Les données écologiques et biologiques peuvent être complexes et désordonnées!
- Structure particulière dans les données
- Plusieurs covariables (facteurs de regroupement)
- Faibles tailles d'échantillons
Introduction au jeu de données
Ouvrez le script de l'atelier dans R studio
Faites les graphiques 1 à 3, regardez les graphiques et essayez d'obtenir une idée de ce qui se passe
Pendant ces défis, collaborez avec votre voisin!
...
1. Qu'est-ce qu'un MLM et pourquoi est-ce important?
Centre de la Science de la Biodiversité du Québec
Série d'ateliers R
1. Qu'est-ce qu'un MLM et pourquoi est-ce important?
1. Qu'est-ce qu'un MLM et pourquoi est-ce important?
1. Qu'est-ce qu'un MLM et pourquoi est-ce important?
Discussion de groupe
- S'attend-on à ce que ces relations soient pareilles entre les lacs?
- Comment pourraient-elles différer?
Discussion de groupe
- Est-ce qu'on s'attend à ce que, pour toutes les espèces, la position trophique augmente avec la longueur corporelle?
- Exactement de la même façon?
Comment pourrions-nous analyser ces données?
Nous pourrions :
1. Séparer: Faites une analyse séparée pour chaque espèce et chaque lac
2. Regrouper: Faites une seule analyse en ignorant les variables espèce et lac
- Estime 6 intercepts et 6 pentes pour chaque espèce (c-à-d. 6 lacs)
- Taille d'échantillon (n) = 10 pour chaque analyse (c-à-d. 10 poissons/espèce/lac)
- Peu de chances de détecter un effet à cause de la faible taille d'échantillon (n)
Atelier 6: Modèles linéaires à effets mixtes
A. Permettre aux intercepts de varier selon un facteur donné
A. Permettre aux pentes de varier selon un facteur donné
1. Qu'est-ce qu'un MLM et pourquoi est-ce important?
1. Qu'est-ce qu'un MLM et pourquoi est-ce important?
1. Qu'est-ce qu'un MLM et pourquoi est-ce important?
1. Qu'est-ce qu'un MLM et pourquoi est-ce important?
Suppose que les intercepts proviennent d'une distribution normale (DN)
Même concept pour les pentes, juste plus difficile à visualiser
- Très grande taille d'échantillon!!
- Mais qu'en est-il de la pseudoréplication? (c-à-d.les poissons d'un même lac et d'une même espèce sont correlés).
- Regardez tout ce bruit dans les données! Une partie doit être due aux effets de l'espèce et du lac.
Comment fonctionne les MLMs?
A. Permettre aux intercepts et/ou les pentes peuvent varier par lac et par espèce
B. Les intercepts, les pentes et leurs intervalles de confiance sont ajustés pour prendre en compte la structure des données
Seulement besoin d'estimer la moyenne et l'écart-type de la DN au lieu de 3 ordonnées à l'origine.
Encore, estime seulement la moyenne et l'écart-type au lieu de 3 pentes
Les MLMs sont un compromis entre séparer et regrouper. Ils:
1. Estiment une pente et un intercept pour chaque espèce et chaque lac (séparer) mais en calculant moins de paramètres qu’une régression classique
2. Utilisent toutes les données disponibles (regrouper) tout en contrôlant les différences entre les lacs et les espèces (pseudo-réplication)
Estime 2 paramètres (moyenne et É-T) au lieu de 6 ordonnées à l'origine - sauve des degrés de liberté
Effet fixe
- Les données proviennent de tous les niveaux possibles d'un facteur (variable qualitative)
- On souhaite émettre des conclusions à propos des niveaux du facteur d'où les données proviennent
Effet fixe VS aléatoire
Dans la littérature des MLMs, vous rencontrerez ces termes souvent
Il existe plusieurs définitions possibles des effets fixes et aléatoires et nous vous présenterons aujourd'hui celles que nous trouvons plus faciles à appliquer
Effet aléatoire
- Seulement des variables qualitatives = facteur aléatoire
- Les données incluent seulement un échantillon aléatoire de tous les niveaux possibles du facteur, qui sont tous d'intérêt
- Souvent des facteurs groupants
Site Internet: http://qcbs.ca/wiki/R/atelier6
Inclue les espèces de tous les lacs
Inclue des individus provenant de toutes les espèces
Pour notre question, on veut seulement savoir s'il y a un effet général de la longueur corporelle sur la position trophique
Ceci pourrait varier faiblement par espèce à cause de différents taux de croissance et/ou par lac à cause de différences dans la disponibilité de nourriture
On ne s'intéresse pas directement à ces facteurs non mesurés, mais on doit contrôler leur effet dans le modèle
*Notez que plus votre facteur comporte de niveaux, le plus précisément vous estimerez la moyenne et l'écart-type de votre DN. Trois niveaux c'est un peu faible, mais plus facile à visualiser!
B. Ajuster les intercepts et pentes pour tenir compte de la structure des données
Défi 2
Solution
B. Ajuster les intercepts et pentes pour tenir compte de la structure des données
Petite taille effective de l'échantillon, ET plus élevé, et grands intervalles de confiance.
Grande taille effective de l'échantillon, ET plus petite, et plus petits intervalles de confiance
Si une certaine espèce ou un lac est peu représenté (faible n) dans les données, le modèle va accorder plus d'importance au modèle groupé pour estimer l'intercept et la pente de cette espèce ou de ce lac
Les intervalles de confiances des intercepts et pentes son ajustés pour tenir compte de la pseudo-réplication basée sur:
Le coefficient de corrélation intra-classe (CCI) -
Combien de variation y a-t-il dans chaque groupe VS entre les groupes?
Comment le CIC et l'intervalle de confiance seront affectés dans ces deux scénarios?
1. Les positions trophiques des poissons ne varient pas entre les lacs?
2. Les positions trophiques des poissons sont similaires dans les lacs mais différentes entre les lacs.
Q1. La position trophique ne varie pas entre les lacs?
R1. CIC faible, petits intervalles de confiances
Q2. La position trophique est similaire dans un lac mais différente entre les lacs?
R2. CIC élevé, grands intervalles de confiance.
Ces points seront plus traités comme une seule observation
Ces points seront plus traités comme étant indépendants
Comment implémenter un MLM dans R?
Exploration des données
Défi 3
Étape 1: Construction du modèle a priori et exploration des données
Regardez la distribution des variables continues
Vérification de la colinéarité entre vos variables explicatives
Regardez la distribution des échantillons pour chaque facteur:
Assurez-vous d'avoir fait le ménage de l'espace de travail (Housekeeping) avant de construire un modèle
Étape 1: Construction du modèle a priori et exploration des données
Quelles mesures supplémentaires aurions-nous pu prendre sur le terrain et qui auraient pu être fortement corrélées avec la longueur corporelle?
>hist(data$Trophic_Pos)
>hist(data$Fish_Length)
>table(data$Species)
>table(data$Lake)
Modèle basé sur connaissance a priori:
- Vous ne pouvez inclure deux variables explicatives collinéaires dans un même modèle, leurs effets sur la variable réponse seront confondus
Étape 2: Coder les modèles potentiels et sélectionner le meilleur modèle
Les données ont-elles la bonne structure?
- Nous voulons déterminer si la position trophique peut être prédite par la longueur corporelle, tout en prenant en compte la variation entre les espèces et les lacs
>str(data)
>plot(data)
>cor()
Étape 3: Valider le modèle
Donc nous voulons un modèle qui ressemble à ceci:
Étape 4: Interpréter les résultats et visualiser le modèle
- Pas de risque de collinéarité avec seulement une variable explicative continue
- Ce jeu de donné est parfaitement équilibré, mais les modèles mixtes peuvent analyser les plans expérimentaux non équilibrés, comme c'est souvent le cas en écologie!
- Des déviations majeures pourraient causer des problèmes d'hétéroscédasticité. SI nécessaire, faites des transformations. Dans ce cas-ci, les données semblent correctes.
Exploration des données
- Représentez graphiquement la valeur des résidus en fonction des niveaux des facteurs.
Considérez l'échelle de vos données
Considérez l'échelle de vos données
- Créer un modèle linéaire sans les facteurs
- Parce que nos données ont des échelles très différentes, on applique la correction Z
> lm.test<-lm(Z_TP~Z_Length, data=data)
Pour savoir si un modèle mixte est nécessaire pour vos données, vous devez déterminer s'il est important de prendre en compte l'effet aléatoire de facteurs qui pourraient influencer la relation qui vous intéresse
- Lac et Espèce dans notre cas
Position trophique:
Courte échelle
Longueur corporelle:
Longue échelle
- Calculer les résidus ce de modèle linéaire
> lm.test.resid<-rstandard(lm.test)
- Créer un modèle linéaire sans les facteurs qui pourraient avoir un effet aléatoire
- Calculer les résidus de ce modèle linéaire
- Faites un graphique de la valeur des résidus en fonction des niveaux des facteurs potentiellement aléatoires
- Si deux variables dans le même modèle ont des valeurs se situant sur des échelles très différentes, il est probable que le modèle mixte indique un problème de convergence en essayant de calculer les paramètres.
- La correction Z standardize les variables et résout ce problème.
- z = (x - moyenne(x))/écart-type(x)
- Représentez graphiquement la valeur des résidus en fonction des niveaux des facteurs
> data$Z_Length<-(data$Fish_Length-mean(data$Fish_Length))/sd(data$Fish_Length)
Position trophique corrigée
> plot(lm.test.resid~ data$Lake, xlab = "Lake", ylab="Standardized residuals")
abline(0,0, lty=2)
> plot(lm.test.resid~ data$Fish_Species,
xlab = "Species", ylab="Standardized residuals")
abline(0,0, lty=2)
*Ces patrons suggèrent qu'il y a de la variance résiduelle qui pourrait être expliquée par ces facteurs, et ils devraient donc être inclus dans le modèle
> data$Z_TP<-(data$Trophic_Pos-mean(data$Trophic_Pos))/sd(data$Trophic_Pos)
Comment implémenter un MLM dans R?
Coder et sélectionner le meilleur modèle
Défi 4
Coder et sélectionner le meilleur modèle
Comment implémenter un MLM dans R?
- Coder un modèle mixte dans R:
- Coder un modèle mixte dans R:
Étape 2: Coder les modèles potentiels et sélectionner le meilleur modèle.
Réécrivez le code suivant de façon à ce que les pentes de la relation position trophique en fonction de longueur corporelle varient par lac et par espèce :
Étape 1: Construction du modèle a priori et exploration des données.
> lmer(Z_TP~Z_Length + (1|Lake) + (1|Species), data = data, REML=TRUE)
- On veut que notre modèle dise quelque chose comme:
> lmer(Z_TP~Z_Length + (1|Lake) + (1|Species), data = data, REML=TRUE)
Étape 2: Coder les modèles potentiels et sélectionner le meilleur modèle.
> lmer(Z_TP~Z_Length + (1|Lake) + (1|Species), data = data, REML=TRUE)
fonction"linear mixed model"
indique que les intercepts peuvent varier
Mais comment faire si on souhaite aussi que la pente puisse varier?
Étape 3: Valider le modèle.
- Dans R, on le code ainsi:
Note à propos de la méthode d'estimation
REML (Restricted Maximum Likelihood) est la méthode par défaut dans la fonction "lmer"
On devrait comparer les modèles d'effets aléatoires nichés avec REML.
Étape 4: Interpréter les résultats et visualiser le modèle
> lmer(Z_TP ~ Z_Length + (1|Lake) + (1|Species), data=data, REML=TRUE)
(1|facteur)
(1+ variable|facteur)
Coder et sélectionner le meilleur modèle
Solution!
Coder et sélectionner le meilleur modèle
Défi 5
Coder et sélectionner le meilleur modèle
Solution!
Pour trouver la valeur AICc d'un modèle, utilisez:
> M0<-lm(Z_TP~Z_Length,data=data)
#modèle complet avec variation des intercepts
> AICc(M1)
Faites une liste de 7 modèles alternatifs qui pourraient être construits et comparés à partir de celui-ci :
#modèle complet avec variation des intercepts et de pentes
- Maintenant que nous avons une liste de modèles potentiels, nous voulons les comparer entre eux pour sélectionner celui (ceux) qui a (ont) le plus de pouvoir de prédiction
> lmer(Z_TP~Z_Length + (1+Z_Length|Lake) + (1+Z_Length|Species), data = data, REML=TRUE)
> M0<-lm(Z_TP~Z_Length,data=data)
- Les modèles peuvent être comparés en utilisant la fonction "AICc" provenant du paquet (package) "AICcmodavg"
- Le critère d'information Akaike (AIC) est une mesure de qualité du modèle pouvant être utilisée pour comparer les modèles
- AICc corrige pour le biais créé par les faibles tailles d'échantillon quand le AIC est calculé
#Pas d'effet lac, les intercepts varient par espèce
Pour regrouper toutes les valeurs d'AICc dans un seul tableau, utilisez:
#Pas d'effet d'espèce, les intercepts varient par lac
- Nous allons aussi construire le modèle linéaire de base lm() parce qu'il est toujours utile de voir la variation dans les valeurs de AICc.
- Par contre, pour comparer ce modèle au MLMs il est important de changer la méthode d'estimation à ML (REML=FALSE) parce que lm() n'utilise pas la même méthode d'estimation que lmer()
- Démontrer que les résultats de la méthode des moindres carrés (Least squares) est équivalente au résultats de la méthode ML pour les modèles linéaires de bases!
- Pour déterminer si vous avez construit le meilleur modèle mixte basé sur vos connaissances a priori, vous devez comparer ce modèle a priori aux autres modèles alternatifs
- Avec le jeu de données sur lequel vous travaillez, il y a plusieurs modèles alternatifs qui pourraient mieux correspondre à vos données
> lmer(Z_TP~Z_Length + (1|Lake) + (1|Species), data = data, REML=TRUE)
M1<-lmer(Z_TP~Z_Length + (1|Fish_Species) + (1|Lake), data=data, REML=FALSE)
M2<-lmer(Z_TP~Z_Length + (1+Z_Length|Fish_Species) + (1+Z_Length|Lake), data=data, REML=FALSE)
M3<-lmer(Z_TP~Z_Length + (1|Fish_Species), data=data, REML=FALSE)
M4<-lmer(Z_TP~Z_Length + (1|Lake), data=data, REML=FALSE)
M5<-lmer(Z_TP~Z_Length + (1+Z_Length|Fish_Species), data=data, REML=FALSE)
M6<-lmer(Z_TP~Z_Length + (1+Z_Length|Lake), data=data, REML=FALSE)
M7<-lmer(Z_TP~Z_Length + (1|Fish_Species) + (1+Z_Length|Lake), data=data, REML=FALSE)
M8<-lmer(Z_TP~Z_Length + (1+Z_Length|Fish_Species) + (1|Lake), data=data, REML=FALSE)
#Pas d'effet de lac, les intercepts et les pentes varient par espèce
#Pas d'effet de l'espèce, les intercepts et les pentes varient lac
> AICc<-c(AICc(M0), AICc(M1), AICc(M2), AICc(M3), AICc(M4), AICc(M5), AICc(M6), AICc(M7), AICc(M8))
> Model<-c("M0", "M1", "M2", "M3", "M4", "M5", "M6", "M7", "M8")
> AICtable<-data.frame(Model=Model, AICc=AICc)
#Modèle complet, variation d'intercept et pente par lac
#Modèle complet, variation d'intercept et pente par espèce
*Note: Si nous avions différents effets fixes entre les modèles, nous aurions dû indiquer «REML = FALSE». Cependant, vous devez rapporter les estimations des paramètres du «meilleur» modèle en utilisant «REML = TRUE»
Défi 6
Coder et sélectionner le meilleur modèle
Solution!
Coder et sélectionner le meilleur modèle
Comment implémenter un MLM dans R?
Coder et sélectionner le meilleur modèle
Qu'est-ce que ces valeurs d'AICc nous disent?
Quelle est la structure du meilleur modèle?
Une fois que les meilleurs modèles sont sélectionnés il faut remettre la méthode d'estimation a REML (REML=TRUE)
Étape 1: Construction de modèle a priori et exploration des données
> AICtable
Prenez 2 minutes avec votre voisin pour étudier la structure du modèle M2.
Comment diffère-t-il de M8 d'un point de vue biologique?
Pourquoi n'est-il pas surprenant que sa valeur de AICc était la deuxième meilleure?
> AICtable
M8<-lmer(Z_TP~Z_Length + (1+Z_Length|Fish_Species) + (1|Lake), data=data, REML=FALSE)
Étape 2: Coder les modèles potentiels et choisir le meilleur modèle
> M8<-lmer(Z_TP~Z_Length + (1+Z_Length|Fish_Species) + (1|Lake), data=data, REML=TRUE)
> M2<-lmer(Z_TP~Z_Length + (1+Z_Length|Lake) + (1+Z_Length|Fish_Species), data = data, REML=TRUE)
M8<-lmer(Z_TP~Z_Length + (1+Z_Length|Fish_Species) + (1|Lake), data=data, REML=FALSE)
> M2<-lmer(Z_TP~Z_Length + (1+Z_Length|Lake) + (1+Z_Length|Fish_Species), data = data, REML=TRUE)
- Le modèle avec un AICc plus bas a le plus grand pouvoir prédictif considérant les données
- Certains disent que si deux modèles sont à plus ou moins 2 unitées d'AICc de différence, leurs pouvoirs prédictifs sont équivalents
- Dans notre cas, on peut regarder de plus près M8 et M2, mais tous les autres ont des AICc tellement plus élevés qu'on peut exclure la possibilité qu'ils soient les meilleurs modèles pour nos données
Étape 3: Validation du modèle
Étape 4: Interpréter les résultats et les visualiser graphiquement
L'intercept et l'effet de la longueur sur la position trophique peut varier selon l’espèce de poissons, mais seulement l'intercept peut varier par lac
Comment implémenter un MLM dans R?
Validation du modèle
A. Vérifier l'homogénéité de la variance
- Graphique des valeurs prédites vs résiduelles
B. Vérifier l'indépendance
i) Graphique des résidus VS chaque covariable du modèle
C. Vérifier la normalité des résidus
B. Vérifier l'indépendance
i) Graphique des résidus VS chaque covariable du modèle
B. Vérifiez l'indépendance
ii) Graphique des résidus VS chaque covariable non incluse dans le modèle
Étape 3: Validation du modèle
- Vous devez vérifier que le modèle respecte toutes les suppositions de bases
>plot(x = data$Z_Length, y = E1, xlab = "Z Length",ylab = "Normalized residuals")
>abline(h = 0, lty = 2)
- Des résidus suivant une distribution normale indiquent que le modèle n'est pas biaisé
>boxplot(E1 ~ Lake,
ylab = "Normalized residuals",
data = data, xlab = "Lake")
>abline(h = 0, lty = 2)
>boxplot(E1 ~ Fish_Species,
ylab = "Normalized residuals",
data = data, xlab = "Species")
>abline(h = 0, lty = 2)
>E1 <- resid(M8)
>F1 <- fitted(M8)
>plot(x = F1, y = E1, xlab = "Fitted Values",
ylab = "Normalized residuals")
>abline(h = 0, lty = 2)
> E1 <- resid(M8)
> hist(E1)
- Si vous observez des patrons dans ces graphiques, vous saurez qu'il y a de la variation dans votre jeu de données qui pourrait être expliquée par ces covariables. Vous devriez considérer de ré-inclure ces variables dans votre modèle.
- Puisque dans notre cas, nous avons inclus toutes les variables mesurées dans notre modèle, nous ne pouvons faire cette étape.
A. Vérifier l'homogénéité des résidus
- Faire un graphique des valeurs prédites en fonction des valeurs résiduelles
B. Vérifier l'indépendance
- Graphique des résidus vs chaque covariable du modèle
- Graphique des résidus vs chaque covariable non incluses du modèle
C. Vérifier la normalité
- Histogramme
*Étendue égale des résidus suggère que le modèle est adéquat pour bien modéliser nos données
- L'étendue égale au dessus et sous zéro indique qu'il n'y a pas de problème d'indépendance avec cette variable.
- Les regroupements de données sont dus à la structure des données, où des poissons de seulement certaines classes de taille étaient capturés (grande, petite, et 3 dans le milieu)
Aucun patron observé, suggère qu'il n'y a pas de problème d'indépendance pour lac et espèce
*Un graphique comme ceci suggère que le modèle ne prend pas en compte une ou plus variable(s) expliquant de la variation dans la variable réponse
Solution!
Comment implémenter un MLM dans R?
Défi 7
Validation du modèle
Interpréter les résultats et visualiser le modèle
Comment implémenter un MLM dans R?
Étape 4: Interprétation des résultats
>summary(M8)
- Les différentes intercepts et pentes générées par le modèle peuvent être placées dans des figures pour mieux visualiser les résultats d'un modèle mixte
Étape 1: Construction de modèle a priori et exploration des données
a) Quelle est la pente et son intervalle de confiance de la variable Z_Length dans le modèle M8?
-Pente = 0.422
-IC = 0.09*2 = 0.18
b) Est-ce que la pente de Z_Length est significativement différente de 0?
-Oui, car l'IC n'inclut pas 0.
a) Quelle est la pente et son intervalle de confiance de la variable Z_Length dans le modèle M8?
b) Est-ce que la pente de Z_Length est significativement différente de 0?
Étape 2: Coder les modèles potentiels et choisir le meilleur modèle
A. Vérifier l'homogénéité
- Graphique des résidus VS valeurs prédites
B. Vérifier l'indépendance
- Graphique des résidus VS chaque covariable du modèle.
- Graphique des résidus VS chaque covariable excluse du modèle.
C. Vérifier la normalité
- Histogramme
- Qu'est-ce que la "variance"?
écart-type(SD)^2
<--Variation des intercepts de lac
>summary(M8)
Étape 3: Validation du modèle
<--Variation des intercepts d'espèce
<--Variation des pentes d'espèce
Étape 4: Interpréter les résultats et les visualiser graphiquement
- Qu'est-ce qu'une "p-value"?
La pente estimée +/- l'intervalle de confiance à 95%
Comment visualiser les résultats
Défi
Solution!
Interpréter les résultats et visualiser le modèle
Toutes les données groupées
1-Obtenir les coefficients d'intérêt
>summary(M8)
OàO = -0.0009059
Pente = 0.4222697
a) Toutes les données groupées
Prenez deux minutes pour réfléchir aux différentes façons que vous pourriez utiliser pour représenter les résultats de M8.
#Graphique qui inclut toutes les données
- Pour faire ces figures vous devez obtenir les coefficients (intercept et pente) de chaque composante du modèle
- Coefficients du modèle complet (aka: "coefs") se trouvent dans le résumé du modèle
- Coefficients pour chaque niveau du modèle (dans notre cas: Lac et Espèce) peuvent être obtenus en utilisant la fonction "coef"
Figure par espèce
1-Obtenir les coefficients d'intérêt
*indice: considérez les différents "niveaux" du modèle
>coef(M8)
Figure par lac
1-Obtenir les coefficients d'intérêt
2-Colorez les données par espèce et ajoutez les lignes de régression pour chaque espèce en utilisant les coefficients extraits.
>coef(M8)
*Voir le code pour les détails de cette figure
*Voir le code pour des détails sur cette figure.
2-Colorez les données par lac et ajoutez les lignes de régression pour chaque espèce en utilisant les coefficients extraits.
Défi 8
Solution!
Défi 9
Défi!
Modèles mixtes et données en écologie
Solution!
> lmer(Mercury~Length*Habitat_Type+ (1|Site)
> lmer(Bio_Div ~ Productivité + (1|Forêt/Site))
Les modèles mixtes sont très utiles pour prendre en compte la structure complexe des données en écologie tout en permettant de ne pas perdre beaucoup de degrés de liberté.
Situation:
- Vous avez récolté des estimés de biodiversité dans 1000 quadrats qui sont dans 10 différents sites qui sont également dans 10 différentes forêts.
- Vous avez de plus mesuré la productivité dans chaque quadrat.
- Vous vous intéressez à savoir si la productivité est un bon prédicteur de biodiversité.
-Quel modèle mixte pourriez-vous utiliser pour ce jeu de données?
Ici les effets aléatoires sont nichés (i.e. Sites dans forêt) et non croisés
Situation:
- Vous avez récolté 200 poissons dans 12 différents sites distribués également dans 4 habitats différents qui se retrouvent dans un même lac.
- Vous avez mesuré la longueur de chaque poisson et la quantité de mercure dans ses tissus.
- Vous vous intéressez surtout à savoir si l'habitat est un bon prédicteur de la concentration en mercure.
-Quel modèle mixte pourriez-vous utiliser pour ce jeu de données?
Discutez du jeu de données sur lequel vous travaillez avec votre voisin et déterminez si un modèle mixte serait approprié.
Si oui, travaillez ensemble pour écrire le code que vous utiliserez pour faire de modèle dans R.
Si non, imaginez un jeu de données fictif pour lequel un modèle mixte serait approprié et codez ce modèle.
Ressources additionelles
- Différences entre nlme et lme4
Centre de la Science de la Biodiversité du Québec
Série d'ateliers R
Atelier 6: Modèles linéaires à effets mixtes
Feedback: https://docs.google.com/spreadsheet/ccc?key=0AhCQzc0AsZ0OdHZoWE1PUi1kNmttZV96VEViY0sxVEE#gid=0