| Livestock Research for Rural Development 18 (2) 2006 | Guidelines to authors | LRRD News | Citation of this paper |
El objetivo de este estudio fue determinar el efecto de diferentes estructuras de covarianzas en la significancia estadística y en los estimadores de los efectos fijos, tomando como ejemplo los datos de cuatro hormonas en un experimento con mediciones repetidas. El estudio se realizó en una granja comercial de tres sitios con 2400 vientres en la Piedad Michoacán, México. Se utilizaron 32 cerdas de tercer parto pertenecientes a tres grupos genéticos (11 cerdas AZ, 11 cerdas B y 10 cerdas del grupo genético N) a las cuales se les tomó 10 ml de sangre para determinación de las concentraciones de las hormonas: progesterona (P4), estradiol (E2), prolactina (PRL) e insulina (INS). Las muestras de sangre se tomaron a los 3, 6, 9, 12, 15 días de lactancia. Las determinaciones de las hormonas se hicieron por medio de radioinmonoanálisis. Los datos fueron analizados utilizando anovas para medidas repetidas y procedimientos de modelos mixtos. Los anovas fueron realizados utilizando las opciones RANDOM o TEST del programa SAS. Los modelos mixtos consideraron nueve estructuras de covarianzas: componentes de varianza (CV), simetría compuesta (CS), autogresiva (AR(1)), antedependencia (ANTE(1)), Toeplitz, no estructurada (UN), CS heterogénea, AR(1) heterogénea y Toeplitz heterogénea.
Las mejores estructuras de covarianzas que describieron los datos fueron: ANTE(1), UN, CS y CS para P4, E2, PRL e INS, respectivamente. Se observaron diferencias en los niveles de significancia de los efectos fijos, principalmente de grupo genético, dependiendo de la estructura de covarianzas utilizada. Por ejemplo, para P4 el intervalo de las significancias para grupo genético fue de P = 0.0063 para la estructura CV a P = 0.1318 para Toeplitz. El efecto del tiempo de lactancia sobre las concentraciones de hormonas fue altamente significativo para todas las estructuras (P<0.001). Las medias de cuadrados mínimos generalizados y errores estándares (EE), fueron asimismo afectados por el tipo de matriz de covarianzas. Para P4 los EE más pequeños correspondieron a la estructura más simple (CV) y los mayores a las estructuras AR(1) y Toeplitz.
En conclusión, los resultados de este estudio indican que la elección de la estructura de covarianzas afecta principalmente el nivel de significancia de la prueba de F y los errores estándares de las medias. El análisis de datos de las hormonas aquí estudiadas pero con frecuencias de medición diferentes o por periodos más cortos o prolongados a los aquí investigados, así como el estudio de otras variables de respuesta, requería la exploración de diferentes estructura de covarianzas para encontrar la más apropiada.
Palabras clave: Estructura de covarianzas, hormonas, medidas repetidas, modelos mixtos
The objective of this study was to determine the effect of different covariance structures on the statistical significance and on the fixed effect estimates, using as an example the data of four hormones in a repeated measures experiment. The study was carried out in a three-sites commercial farm with 2400 sows in La Piedad Michoacan, Mexico. Thirty-two multiparous sows from three genetic groups (11 AZ, 11 B and 10 N sows) were used. Sows were bled and a 10 ml blood sample was taken to determine the concentration of progesterone (P4), estradiol (E2), prolactin (PRL) and insulin (INS). Blood samples were taken at days 3, 6, 9, 12 and 15 of lactation. Hormone assays were carried out by radioimmunoanalysis. Data were analyzed using anova repeated measures and mixed models procedures. The anova repeated analysis was carried out using the options RANDOM and TEST of the SAS programme. The mixed models considered nine covariance structures: variance components (VC), compound symmetry (CS), autoregressive (AR(1)), Toeplitz, unstructured (UN), heterogeneous CS (CSH), heterogeneous AR(1) and heterogeneous Toeplitz.
The anova repeated analysis gave similar results than the CS structure. The best covariance structures that described the data were ANTE(1), UN, CS and CS for P4, E2, PRL and INS, respectively. Differences were observed in the levels of significance of the fixed effects, mainly of genetic group, depending on the structure used. For example, for P4 the interval of significances for genetic group was from P = 0.0063 for the structure CV to P = 0.1318 for Toeplitz. The effect of time of lactation on the hormone concentrations was highly significant for all structures (P<0.001). The generalized least squares means and standard errors (SE), were also affected by the type of the covariance matrix. For P4 the lowest SE corresponded to the simplest structure (VC) and the greatest to the AR(1) and Toeplitz structures.
In conclusion, the results of this study indicate that the covariance structure selected affects the level of significance of the F test and the SE of the means. The analysis of the data for the hormones here studied but with different bleeding times or for shorter or longer periods, as well as the study of other response variables needs the exploration of different covariance structures in order to find the most appropriate.
Key words: Covariance structures, hormones, mixed models, repeated measures
Los experimentos con medidas repetidas son frecuentes en las investigaciones pecuarias (Segura y Osorio 2002, ZooBell et al 2003, Wang y Goonewardene 2004) y se refieren a aquellos casos en que se hacen varias mediciones en una misma unidad experimental. En la mayoría de los casos, las múltiples observaciones por unidad experimental son tomadas a través del tiempo, aunque podrían ser en espacio, como es el caso de los experimentos en parcelas divididas. En el análisis de datos de experimentos con mediciones repetidas en tiempo, las suposiciones usuales acerca de independencia y homogeneidad de varianzas normalmente no son válidas, ya que, a menudo, las medidas hechas en un mismo animal están correlacionadas entre si y las varianzas entre mediciones pueden ser diferentes. La metodología de modelos mixtos permite analizar correcta y eficientemente los datos de experimentos con medidas repetidas, a través del modelaje de la estructura de covarianzas que consideren las correlaciones entre medidas repetidas y la presencia de varianzas heterogéneas. El ignorar la importancia de la correlación dentro de sujetos utilizando modelos de efectos fijos (procedimientos ANOVA o GLM) o modelos mixtos con estructuras de covarianzas muy simple, podrían aumentar la tasa de error tipo I (rechazo de la hipótesis nula cuando debería ser aceptada) para la prueba de los efectos fijos del modelo, mientras que un modelo muy complicado conduciría a un sacrificio en el poder y eficiencia de la prueba para los efectos fijos (Littell et al 2000; Wang y Goonewardene 2004). La elección de la estructura de covarianzas apropiada resulta en estimadores más eficientes de los efectos fijos del modelo y consecuentemente pruebas más robustas de los efectos de las medidas repetidas. Sin embargo, la selección de la estructura de covarianzas más apropiada y parsimoniosa es complicada debido a la existencia de un gran número de estructuras posibles (SAS, 2000). Los criterios más utilizados para la elección de la mejor estructura son el criterio de información de Akaike y el criterio de información Bayesiano de Schwarz (Littell et al 1998; Wang y Goonewardene 2004).
El objetivo de este estudio fue determinar el efecto de la estructura de covarianzas en los niveles de significancia de los efectos fijos y en los estimadores de los efectos fijos, tomando como ejemplo los datos de un experimento con mediciones repetidas de las hormonas progesterona, estrógenos, prolactina e insulina.
El estudio se realizó en una granja comercial de tres sitios con 2400 vientres en la Piedad Michoacán México. Al inicio de la lactación las cerdas recibieron 2kg de alimento (15.5% de proteína cruda) aumentándose la cantidad progresivamente hasta alcanzar 6 kg/día. Se utilizaron 32 cerdas de tercer parto pertenecientes a tres grupos genéticos comerciales (11 cerdas AZ, 11 cerdas B y 10 cerdas del grupo genético N) a las cuales se les tomó 10ml de sangre para determinación de las hormonas: progesterona (P4), estradiol (E2), prolactina (PRL) e insulina (INS). Las muestras de sangre se tomaron durante la lactancia a los 3, 6, 9, 12, 15 días. Las determinaciones de las hormonas se hicieron por medio de radioinmonoanálisis (RIA) utilizando kits comerciales. Las condiciones ambientales y de manejo así como la determinación de las hormonas en sangre han sido descritas con anterioridad (Pérez Sánchez et al., en prensa).
El modelo estadístico que describió los resultados de las hormonas fue:
yijk = m + Gi + a(G)ij + Tk + eijk
donde:
yijk es la concentración de la hormona medida
en el tiempo k de la j-ésima cerda del grupo racial i;
m es el efecto de la
media general;
Gi es el efecto fijo del i-ésimo grupo
racial;
a(G)ij es el efecto aleatorio (fijo para el anova con
medidas repetidas) de cerda dentro de grupo racial,
![]()
Tk es el efecto fijo del k-ésimo
tiempo de medición (3, 6, 9, 12, 15 días),
eijk es el error
aleatorio asociado con la j-ésima cerda perteneciente al i-ésimo el grupo racial
el k-ésimo tiempo(día), eijk ~N(0, Vij) (aproximadamente normal con media 0 y
varianza Vij; donde Vij es una matriz de covarianzas con
bloques en la diagonal para cada cerda j perteneciente al grupo racial i. La
matriz de covarianzas Vij puede tomar diferentes formas dependiendo
de heterogeneidad y relación entre las mediciones
repetidas.
Los datos de las hormonas se analizaron utilizando procedimientos de análisis de varianza para mediciones repetidas, que utilizan el cuadrado medio del error de unidad experimental dentro de tratamiento para probar la hipótesis de igualdad de tratamientos y modelos mixtos, considerando diferentes estructuras de covarianza (correlaciones) de las medidas repetidas. Las estructuras de covarianzas evaluadas fueron: componentes de varianza (CV) la cual es la estructura más simple ya que asume que todas las observaciones son independientes una de otra y que no hay correlación (covarianza) entre pares de observaciones, aun cuando las mediciones se hicieron en el mismo individuo.
Esta estructura tiene varianzas
iguales en la diagonal principal
y ceros en los demás elementos de la matriz. La
estructura de simetría compuesta (CS) considera varianzas iguales en la diagonal
principal e iguales covarianzas en los demás elementos de la matriz, es decir
asume una misma correlación entre observaciones independientemente de la
distancia entre tiempos de medición. La estructura autoregresiva de primer orden
(AR(1)) considera varianzas homogéneas
. Asimismo considera que la correlaciones
entre dos medidas adyacentes son iguales
y que éstas declinan exponencialmente
con la distancia entre mediciones
.
La estructura de TOEPLITZ (TOEP) es similar a la AR(1) en que todas las mediciones próximas a la siguiente tienen la misma correlación, medidas separadas por una medición tienen la misma correlación, pero diferente de la primera, medidas separadas por dos mediciones tienen la misma correlación pero diferente de la primera y segunda y así sucesivamente. La estructura de covarianzas de primer orden y covarianzas dependientes (ANTE(1)) permite varianzas diferentes para cada medición en tiempo y correlaciones y covarianzas diferentes entre diferentes pares de medidas. La estructura de covarianzas no estructurada (UN) permite que cada término de la matriz de covarianzas sea diferente. Asimismo, se corrieron las versiones: CSH, ARH(1), TOEPH que son las versiones de las estructuras CS, AR(1) y TOEP pero considerando varianzas heterogéneas. También se probaron las estructuras CS + AR(1), CS+ARH(1) y CS+TOEP, las cuales se desecharon por tener peores valores de AICC (criterio de información de Akaike) y BIC (criterio de información bayesiano) que algunas de las estructuras anteriormente citadas.
Los anovas con medidas repetidas se corrieron utilizando las opciones RANDOM y TEST del procedimiento GLM y las nueve estructuras de covarianzas evaluadas, se corrieron utilizando la sentencia REPEATED del procedimiento MIXED (SAS 2000) la cual controla la estructura de covarianzas de los errores residuales. Las sentencias SAS utilizadas para correr los diferentes modelos se proporcionan en el Apéndice. Los datos de concentraciones de hormona se transformaron usando la función raíz cuadrada para aproximarlos a la normalidad, pero al no afectar la jerarquía de las estructuras comparadas se prefirió presentar los resultados de los datos sin transformar. Los datos transformados redujeron en 2 a 3% los niveles de significancia. La hipótesis de homogeneidad de varianzas entre mediciones se probó utilizando la prueba de Bartlett (Snedecor y Cochran 1978).
La selección de la mejor estructura de covarianzas se basó en la comparación de los criterios AICC y BIC. Estos estadísticos son funciones del logaritmo de la verosimilitudes y cuando se comparan dos estructuras aquella con los valores de los criterios más bajos indican una mejor estructura.
Las varianzas para las hormonas P4 y E2 fueron heterogéneas (P<0.05) y para PRL e INS homogéneas (P>0.05). Los intervalos de varianzas para las hormonas P4, E2, PRL e INS fueron: 0.0134-0.0375 ng2/ml2, 13.82-71.42 ng2/ml2, 7.26-9.53 ng2/ml2 y 0.4186-0.8756 ng2/ml2, respectivamente. Las razones entre las varianzas mayor y menor para las concentraciones de P4, E2, PRL e INS fueron 2.8, 5.2, 1.3 y 2.1, respectivamente. En el Cuadro 1 se presenta la matriz de covarianzas para las cuatro hormonas.
|
Cuadro 1. Matriz de covarianzas y correlaciones obtenida utilizando la estructura de covarianzas no estructurada (UN) para concentraciones de hormonas durante la lactancia en cerdas*. | |||||
|
Día de medición |
Día de medición | ||||
|
3 |
6 |
9 |
12 |
15 | |
|
Progesterona |
|
|
|
|
|
|
3 |
0.037 |
0.265 |
0.215 |
0.081 |
0.040 |
|
6 |
0.006 |
0.014 |
0.726 |
0.747 |
0.606 |
|
9 |
0.005 |
0.012 |
0.018 |
0.838 |
0.544 |
|
12 |
0.002 |
0.010 |
0.013 |
0.013 |
0.647 |
|
15 |
0.001 |
0.012 |
0.012 |
0.013 |
0.029 |
|
Estradiol |
|
|
|
|
|
|
3 |
71.4 |
0.328 |
0.018 |
0.188 |
0.135 |
|
6 |
18.8 |
46.0 |
0.537 |
0.276 |
0.315 |
|
9 |
1.05 |
25.4 |
48.5 |
0.141 |
0.755 |
|
12 |
5.91 |
6.96 |
3.65 |
13.8 |
0.233 |
|
15 |
5.94 |
11.1 |
27.5 |
4.53 |
27.3 |
|
Prolactina |
|
|
|
|
|
|
3 |
8.02 |
0.822 |
0.778 |
0.778 |
0.886 |
|
6 |
6.34 |
7.42 |
0.694 |
0.760 |
0.770 |
|
9 |
6.80 |
5.83 |
9.53 |
0.764 |
0.788 |
|
12 |
5.94 |
5.58 |
6.36 |
7.26 |
0.782 |
|
15 |
7.47 |
6.24 |
7.24 |
6.27 |
8.85 |
|
Insulina |
|
|
|
|
|
|
3 |
0.761 |
0.361 |
0.001 |
0.019 |
0.293 |
|
6 |
0.229 |
0.530 |
0.606 |
0.096 |
0.487 |
|
9 |
0.001 |
0.348 |
0.622 |
0.223 |
0.402 |
|
12 |
0.011 |
0.046 |
0.114 |
0.419 |
0.231 |
|
15 |
0.239 |
0.332 |
0.297 |
0.140 |
0.876 |
|
* Correlaciones arriba de la diagonal principal; varianzas en la diagonal; covarianzas debajo de la diagonal. | |||||
Los resultados de los ANOVAs con medidas repetidas fueron similares a los obtenidos con la estructura del covarianzas CS del procedimiento MIXED. Lo que indica que para experimentos balanceados o ligeramente desbalanceados (como en este estudio) con varianzas homogéneas y similares correlaciones entre pares de medidas repetidas, los procedimientos de cuadrados mínimos (utilizados por GLM) proporcionan los mismos resultados que los procedimientos de máxima verosimilitud (utilizados por MIXED). Los resultados de los criterios de información (AICC y BIC) y los niveles de significancia obtenidos por los efectos de grupo genético y número de medición, para las estructuras comparadas, se presentan en los Cuadros 2-5. Con base en los criterios AICC y BIC las mejores estructuras de covarianzas que describieron los datos fueron ANTE(1), UN, CS y CS para las hormonas P4, E2, PRL e INS, respectivamente. Asimismo se observa, que las hormonas PRL e INS pudieron ser analizadas utilizando ANOVAs con medidas repetidas.
|
Cuadro 2. Criterios de información y niveles de significancia de la prueba de F para los efectos de grupo genético y número de medición para progesterona en sangre en cerdas | ||||
|
Estructura de covarianzas |
Criterios |
Efectos fijos | ||
|
AICC |
BIC |
Grupo genético |
Medición | |
|
GLM random |
|
|
0.1164 |
0.0001 |
|
GLM test |
|
|
0.1164 |
0.0001 |
|
Componente de varianza (CV) |
-122.9 |
-121.5 |
0.0063 |
0.0001 |
|
Simetría compuesta (CS) |
-151.9 |
-149.1 |
0.1164 |
0.0001 |
|
Ante-dependence ANTE(1) |
-197.7 |
-185.7 |
0.1000 |
0.0001 |
|
Autoregresiva AR(1) |
-165.8 |
-162.9 |
0.1303 |
0.0001 |
|
Toeplitz (TOEP) |
-161.0 |
-154.0 |
0.1318 |
0.0001 |
|
No estructurada (UN) |
-192.4 |
-174.0 |
0.1229 |
0.0001 |
|
CS Heterogénea |
-173.3 |
-165.5 |
0.0595 |
0.0001 |
|
AR(1) heterogénea |
-188.6 |
-180.4 |
0.0720 |
0.0001 |
|
TOEP heterogénea |
-183.4 |
-171.4 |
0.0666 |
0.0001 |
|
AICC = Criterio de Información de Akaike; BIC = Criterio de Información Bayesiano | ||||
|
Cuadro 3. Criterios de información y niveles de significancia de la prueba de F para los efectos de grupo genético y número de medición para estradiol en sangre en cerdas | ||||
|
Estructura de covarianzas |
Criterios |
Efectos fijos | ||
|
AICC |
BIC |
Grupo genético |
Medición | |
|
GLM random |
|
|
0.0441 |
0.0001 |
|
GLM test |
|
|
0.0441 |
0.0001 |
|
Componente de varianza |
1024.2 |
1025.6 |
0.0063 |
0.0001 |
|
Simetría compuesta |
1018.7 |
1021.5 |
0.0441 |
0.0001 |
|
Ante-dependence |
1008.7 |
1020.6 |
0.2072 |
0.0001 |
|
Autoregresiva |
1014.2 |
1017.0 |
0.0467 |
0.0001 |
|
Toeplitz |
1017.2 |
1024.1 |
0.0740 |
0.0001 |
|
No estructurada |
989.1 |
1007.6 |
0.5577 |
0.0017 |
|
CS Heterogénea |
1006.2 |
1014.4 |
0.2745 |
0.0001 |
|
AR(1) heterogénea |
1005.6 |
1013.8 |
0.2089 |
0.0002 |
|
TOEP heterogénea |
1002.1 |
1014.0 |
0.5335 |
0.0004 |
|
AICC = Criterio de Información de Akaike; BIC = Criterio de Información Bayesiano | ||||
|
Cuadro 4. Criterios de información y niveles de significancia de la prueba de F para los efectos de grupo genético y número de medición para prolactina en sangre en cerdas | ||||
|
Estructura de covarianzas |
Criterios |
Efectos fijos | ||
|
AICC |
BIC |
Grupo genético |
Medición | |
|
GLM random |
|
|
0.44590 |
0.4375 |
|
GLM test |
|
|
0.44590 |
0.4375 |
|
< | ||||