PUBLICIDAD-

Cuestionario de Salud General (GHQ-12): comparación de dos modelos factoriales.

Autor/autores: M. González , I. Ibáñez
Fecha Publicación: 02/07/2010
Área temática: .
Tipo de trabajo: 

RESUMEN

El cuestionario de salud general (General Health Questionnaire, Goldberg, 1972, 1978) es una prueba diseñada para medir trastornos psiquiátricos no psicóticos ampliamente usada en contextos comunitarios y ocupacionales. La versión de doce ítems es la más reducida de las disponibles, pero no está clara su estructura factorial. Así Goldberg (1972) defiende su unidimensionalidad en tanto que más recientemente se alude a la existencia de un factor de depresión y otro de ansiedad (Moret et al., 1987, García Rodríguez, 1990). Se recurre al análisis factorial confirmatorio con dos objetivos: Contrastar el grado de apoyo de ambos modelos y ejemplificar y defender el uso de la metodología de modelos de ecuaciones estructurales. Para ello se aplica el GHQ-12, el BDI y el PSWQ a dos muestras de estudiantes de psicología. Se presentan datos del ajuste de los modelos y de la validez convergente-discriminante de la prueba sin perder de vista el objetivo de difundir la metodología confirmatorio propuesta.

Palabras clave: Análisis factorial exploratorio y confirmatorio; Validación estructural; Cuestionario de Salud General.


VOLVER AL INDICE

Url corta de esta página: http://psiqu.com/1-6277

Contenido completo: Texto generado a partir de PDf original o archivos en html procedentes de compilaciones, puede contener errores de maquetación/interlineado, y omitir imágenes/tablas.

Cuestionario de Salud General (GHQ-12): comparación de dos modelos
factoriales.
FUENTE: PSIQUIATRIA.COM. 2001; 5(1)

González, M., e Ibáñez, I.
Dpto. de Personalidad, Evaluación y Tratamientos Psicológicos.
Universidad de La Laguna.
Tenerife (España).
Fax: +34 922 31 74 74 Teléfono: +34 922 31 74 84 /82
Correo electrónico: iibanez@ull.es
PALABRAS CLAVE: Análisis factorial exploratorio y confirmatorio, validación estructural, Cuestionario de Salud General
KEYWORDS: Exploratory and confirmatory factor analysis, structural validation, General Health Questionnaire)

Resumen
El cuestionario de salud general (General Health Questionnaire, Goldberg, 1972, 1978) es una prueba diseñada
para medir trastornos psiquiátricos no psicóticos ampliamente usada en contextos comunitarios y ocupacionales.
La versión de doce ítems es la más reducida de las disponibles, pero no está clara su estructura factorial. Así
Goldberg (1972) defiende su unidimensionalidad en tanto que más recientemente se alude a la existencia de un
factor de depresión y otro de ansiedad (Moret et al., 1987, García Rodríguez, 1990).
Se recurre al análisis factorial confirmatorio con dos objetivos: Contrastar el grado de apoyo de ambos modelos y
ejemplificar y defender el uso de la metodología de modelos de ecuaciones estructurales.
Para ello se aplica el GHQ-12, el BDI y el PSWQ a dos muestras de estudiantes de psicología. Se presentan datos
del ajuste de los modelos y de la validez convergente-discriminante de la prueba sin perder de vista el objetivo de
difundir la metodología confirmatorio propuesta.
Abstract
The General Health Questionnaire (Goldberg, 1972, 1978) is a test designed to measure psychiatric disorders not
psychotic widely used in community and occupational contexts. The 12﷓item in the most reduced of the
available, but not this clear their factor structure. Thus Goldberg (1972) defends their one-factor structure while
most recently is identified two factors: depression and anxiety (Moret et al., 1987, García Rodríguez, 1990).
It is appealed to the confimatory factor analysis with objective two: to contrast the degree of fit of both models
and to exemplify and to defend the use of the methodology of structural equation models.
For this is applied the GHQ-12, the BDI and the PSWQ in two samples of psychology students. We presented data
of the fit of the models and of the convergent-discriminant validity of the test without losing of sight the objective
of spreading the confirmatory methodology proposed.

El Cuestionario General de Salud (General Health Questionnaire, GHQ) fue desarrollado por Golberg en 1972 con
la intención de crear un instrumento de "screening" de los problemas afectivos (Casey, 1990), centrándose para
ello en la detección del malestar psicológico más que en la identificación de categorías psicopatológicas más
concretas. De hecho los ítems se seleccionaron según su capacidad para discriminar entre pacientes psiquiátricos
frente a sujetos sin patología psiquiátrica diagnosticada.
En su construcción se buscó también la detección de cambios en el funcionamiento psicológico normal del sujeto,
lo que supondría posteriormente la critica de ser insensible a casos crónicos (Benjamin, Decalmer y Haran, 1982).
A ello contribuye igualmente el formato de instrucciones, ya que se pide que manifieste cómo se siente
últimamente. Para paliar esta circunstancia, Goodchild y Duncan-Jones (1985) han presentado un sistema
alternativo de puntuación que mejora la sensibilidad de la prueba al detectar casos de larga duración.
Un tercer elemento decisorio en la construcción del cuestionario fue la selección de las áreas a sondear. Se
seleccionaron cuatro: depresión, ansiedad, deterioro e inadecuación social e hipocondría (enfatizando su aspecto
de somatización).

El resultado ha sido un test con unas adecuadas propiedades psicométricas, con una buena sensibilidad y
especificidad, fácil de administrar y que no requiere formación cualificada para su pase. Propiedades todas ellas
deseables para un procedimiento de screening o cribado. Por ello se ha convertido en un instrumento usual en los
estudios epidemiológicos. Como muestra de su popularidad baste decir que hasta el año 1988 había sido
traducida a más de 38 idiomas (Golberg y Williams, 1988).
Quizás como consecuencia de esta fama existen versiones de 60, 30, 28, 20 y 12. El presente trabajo se centra
en la más reducida de las versiones, compuesta por 12 ítems.
Pese a su utilidad y uso existe cierta controversia respecto a la estructura del GHQ-12. Encontramos básicamente
dos estructuras para dicho cuestionario: una solución monofactorial y una solución bifactorial (González-Roma
LLoret y Espejo, 1993). Esta segunda estaría definida por un factor de ansiedad (dimensión cognitiva) y otro de
depresión. Curiosamente la mayoría de la bibliografía que apoya la solución monofactorial ha empleado el análisis
factorial exploratorio (AFE), mientras que cuando se recurre al análisis factorial confirmatorio (AFC) se defiende la
citada solución bifactorial.

Entre los estudios exploratorios que aíslan soluciones monofactoriales encontramos el de Golberg (1972) quien
aisló un primer factor que explicaba en torno al 46% de la varianza. Posteriormente Banks, Clegg, Jackson, Kemp,
Stafford y Wall (1980) aíslan ﷓con tres muestras distintas- un primer factor que explica entre el 38% y el
48% de la varianza.
Contrarios a esta postura encontramos los trabajos de Politi, Piccinelli y Wilkinson, 1994, Graetz (1991), Burvill y
Knuiman (1983) y Worsley y Gribbin (1977), quienes defienden una consideración, al menos, bidimensional de la
prueba. En estos estudios es común la existencia de un factor de depresión, que aglutina a la mayor parte de los
ítems, mientras que el(los) factor(es) restantes tienen un contenido más dispar. Básicamente se refieren a
trastornos del sueño, problemas de adaptación o ansiedad.
Golberg y Williams (1988) consideran que las similitudes en la estructura factorial de distintos estudios son
importantes, lo que no excluye factores más o menos específicos o no replicados.

Por lo que a resultados en nuestro país y con esta versión del cuestionario se refiere, García Rodríguez (1990)
hallaron en muestras distintas una solución monofactorial y otra bifactorial. Esta última identificó un factor de
depresión y otro de ansiedad. Previamente, Moret, Hortangas, Sancern y Zurriaga, en 1987, aislaron una solución
bifactorial acorde con la defendida por García Rodríguez (1990).
Ante esta incongruencia González﷓Roma, Peiró, Luna, Baeza, Espejo y Muñoz (1991) y
González﷓Roma et al.,(1993) analizaron el comportamiento de ambos modelos con la metodología de
análisis factorial confirmatorio. Sus resultados indican claramente que los modelos son poco ajustados, pero el
bifactorial es superior al monofactorial. Los datos de validez criterial de ambos trabajos apoyan igualmente la
consideración bidimensional de la prueba.
El presente trabajo tiene un doble objetivo, por un lado presentar de una forma introductoria la metodología de
análisis de los "modelos de ecuaciones estructurales" (strutural equations model, SEM) centrándose en el análisis
factorial confirmatorio. En segundo lugar, presentar un ejemplo de aplicación de dicho enfoque comparando un
modelo monofactorial frente a otro bifactorial para la versión de 12 ítems del cuestionario GHQ-12. Es decir,
añadir nuevos datos sobre el ajuste y validez de ambos modelos.

Análisis factorial confirmatorio. Una breve aproximación.
Los modelos de ecuaciones estructurales (SEM) no son una metodología novedosa. Llevan ya varias décadas en el
arsenal estadístico de los científicos. Estas técnicas se deben en buena medida a los esfuerzos de los econometras
y los psicometras, quienes de forma independiente desarrollaron los principios y procedimientos básicos de esta
metodología de análisis. Los primeros a través de la regresión múltiple, los segundos mediante los procedimientos
de variables latentes. La fusión de ambos esfuerzos ha dado lugar a la metodología de ecuaciones estructurales.
Sin embargo, pese a no ser una técnica novedosa, no es muy recurrida en el ámbito psicológico. Ello puede
deberse tanto a la no implementación hasta fechas recientes en los programas estadísticos más populares, a la
dificultad propia de esta metodología de análisis o bien como argumenta Seoanne (1986) puede ser una
consecuencia de la dicotomía entre las metodológicas experimentales y correlacionales.

Sea como fuere, estas técnicas se merecen un lugar más destacado que el que actualmente tienen en la
investigación psicológica. No en vano autores como Cliff (1983) o Bentler (1980) las califican como de revolución
a nivel de análisis y la más firme promesa para el futuro. Ello se debe a que el objetivo de estas no es ya
descubrir relaciones causales, sino verificarlas. De ahí su sentido claramente confirmatorio de hipótesis y su
necesaria dependencia de una teoría o modelo a contrastar.
Limitándonos al análisis factorial, en su versión exploratoria o confirmatoria, este permite descubrir un número
relativamente pequeño de factores o variables latentes a partir de la covariación de un número mayor de
variables observadas. En este sentido se asume que se puede explicar cada variable observada con una
combinación lineal de las variables latentes y del error de medida.
Más allá de estas consideraciones las diferencias entre el análisis factorial confirmatorio y exploratorio son
inmediatas y pasamos a plasmarlas en las figuras número 1A y 1B, donde representamos un posible modelo
según ambas perspectivas, Partiendo de dichas figuras, y citando a Long (1983), podríamos decir que las
diferencias más importantes entre ambos enfoques se centran en que el ANÁLISIS FACTORIAL EXPLORATORIO
(AFE) asume a un nivel estructural que: 1) Todos los factores comunes están correlacionados entre sí (rotaciones
oblicuas) o todos están incorrelacionados entre sí (rotaciones ortogonales); 2) todas las variables observadas
están directamente afectadas por todos los factores comunes; 3) los términos de error están incorrelacionados
entre sí; 4) todas las variables observadas están afectadas por un término de error; 5) todos los factores
comunes están incorrelacionados con los términos de error.

Por su parte, el CONFIRMATORIO (AFC) supone, a un nivel estructural, que: 1) Los factores comunes pueden o no
estar correlacionados; 2) no todas las variables observadas están afectadas por todos los factores comunes; 3) no
todas las variables observadas tienen necesariamente un término de error; 4) los términos de error pueden estar
correlacionados (especialmente relevante, por ejemplo, para estudios de medidas repetidas).
Desde otra perspectiva, Marsh (1987) establece otras diferencias entre ambos enfoques analíticos. Así, el AFE es
incapaz de: 1) comprobar la habilidad de la solución para ajustarse a los datos; 2) comparar diferentes soluciones
alternativas, y 3) limita al investigador dado que tiene un escaso poder sobre la estructura. Por contra, el AFC
permite: 1) definir una estructura hipotética; 2) determinar una estimación única de los parámetros del modelo;
3) examinar la habilidad del mismo para ajustarse a los datos y 4) comparar un modelo frente a otros
alternativos. Sin embargo, no hay que olvidar que el AFC es una extensión lógica del AFE (Mulaik, 1987) y de ahí
sus ventajas.
A un nivel práctico estas diferencias se materializan en que el análisis factorial exploratorio permite generar
hipótesis sobre las variables subyacentes a los datos, mientras que el confirmatorio permitiría comprobar o
confirmar esas hipótesis (aunque también puede ser usado con fines exploratorios, por ejemplo, modificando un
modelo previo). Igualmente, estas características se traducen en que el confirmatorio es mucho más restrictivo a
la hora de definir los modelos explicativos de los datos, pero mucho más flexible a la hora de informar sobre que
modelo es más adecuado o qué aspectos de estos modelos son relevantes o no. Además, la metodología
confirmatoria permite una estimación única de los parámetros del modelo.
Sin embargo, entre los problemas que aquejan esta metodología de análisis se encuentra la selección de los
índices de ajuste. Es decir, en qué medida los índices de ajuste son idóneos. Es por ello que recurriremos
finalmente a los índices más usados en la literatura, con independencia de los problemas que estos planteen. El
lector interesado en esta problemática puede remitirse a Bollen y Long (1993) Testing structural equation models.

Asimismo, para evaluar los diferentes modelos, se contempla el valor de los parámetros calculados para cada uno
de ellos, determinándose tanto si se alcanzan valores posibles (por ejemplo, ausencia de varianzas negativas)
como si estos parámetros son estadísticamente significativos.
Los análisis se realizaron con el programa LISREL VI (Jöreskog y Sörbom, 1983), empleando en todos los casos el
método de estimación de máxima verosimilitud. En estos análisis se utilizó como matriz de datos las matrices de
correlaciones, suprimiéndose los sujetos con valores perdidos en, al menos, una variable

Sujetos: Participan en el presente estudio 576 estudiantes divididos en dos muestras independientes. La primera
de ellas está formada por 376 alumnos de primer ciclo (curso de adaptación) de psicología en la Universidad de La

Laguna. Su edad media fue de 21 años, (d.t. = 0.22) existiendo entre ellos un claro predominio de las chicas
(77%) frente a los varones (33%). Más del 90% de la muestra tenía menos de 23 años y eran solteros.
La segunda muestra la forman 200 alumnos de primer curso de psicología. Su edad media es de 20 años (d.t.
0.30). Al igual que en la muestra anterior se da un predominio de las chicas (85,.7%) y de los solteros (94,7%).
La primera muestra se obtuvo en octubre de 1995 y la segunda en marzo de 1996.
Instrumentos: En el transcurso de unas prácticas de evaluación psicológica que tenían por objeto trabajar las
estrategias de depuración de los instrumentos de evaluación, se administró de forma voluntaria una versión
reducida del Cuestionario de Salud General (GHQ de Goldberg, 1972), el Inventario de Depresión de Beck (Beck,
Rush, Shaw, y Emery, 1979) ﷓versión de Vázquez y Sanz (1991)﷓ y el inventario de
Preocupación (PSWQ de Meyer, Miller, Metzger y Borkovec, 1990).
En la tabla número 1 se presentan las fiabilidades puntuación media y desviaciones típicas de los instrumentos, de
forma independiente para cada muestra. Se incluyen igualmente las correlaciones del GHQ-12 y sus supuestos
factores con el BDI y el PSQW
Se empleó una versión de 12 ítems del Cuestionario de Salud General (GHQ-12 en lo sucesivo). Se responde en
una escala de respuesta de cuatro alternativas de respuesta (de 1 a 4), indicando una puntuación alta un mayor
bienestar psicológico.
El PSWQ fue diseñado para hacer un diagnóstico diferencial de la ansiedad generalizada (frente al estrés
postraumático) Evalúa la preocupación permanente e inespecífica, entendiendo ésta como un componente
cognitivo de la ansiedad generalizada. Consta de 16 ítems de 5 alternativas (escala tipo likert). A mayor
puntuación, mayor ansiedad.
Finalmente recurrimos al BDI por sus excelentes propiedades clínicas y psicométricas, así como por el énfasis de
dicho inventario en los aspectos cognitivos.
Procedimiento: Se contrastan los modelos mono y bifactoriales para el GHQ-12 y se estudia la validez criterial de
ambos con las pruebas de ansiedad y depresión descritas anteriormente.

TABLA NUMERO 1: ESTADISTICOS DESCRIPTIVOS, FIABILIDAD (ALFA) Y CORRELACIONES DEL GHQ (FACTOR DE
ANSIEDAD, FACTOR DE DEPRESION Y PUNTUACION TOTAL) CON EL INVENTARIO DE DEPRESION DE BECK (BDI)
Y EL INVENTARIO DE PREOCUPACION (PSWQ) PARA LA MUESTRA 1 (N = 340) Y 2 (N = 178)

Respecto al AFC, se especificó qué ítems definían cada factor, el número de factores de cada solución, la relación
existente entre ellos y se asoció un error de medida a cada ítem (se especificó que los errores son independientes
entre sí). Con objeto de hacer identificable el factor, se fijó la varianza de los factores a uno, estableciéndose

también con ello la escala de medida.
Definición de los modelos: Dos son los modelos que se contrastan (ver figuras 2a y 2b)
- Estructura monofactorial (MONO): Los doce ítems del cuestionario explicarían un factor general de salud.
- Estructura bifactorial (BI): Existe un factor de ansiedad (ítems 1, 2, 5 y 7) y otro de depresión (3, 4, 6 8, 9, 10,
11 y 12). La matriz de correlaciones entre los factores es oblicua, permitiéndose la estimación libre de este
parámetro.
Para evaluar el ajuste de los diferentes modelos recurrimos a distintos índices. En primer lugar tenemos c2 que
informa del ajuste del modelo a los datos (probabilidades superiores a 0.05 indican un buen ajuste entre el
modelo y los datos). Sin embargo, este estadístico ha sido muy criticado, por lo que se recomienda emplear otros
indicadores de ajuste. A continuación figura el índice de bondad de ajuste ajustado (AGFI). Se trata de una
medida de la variabilidad explicada por el modelo. Tiene la ventaja de ser menos sensible que c2 al tamaño de la
muestra, a la vez que se penaliza a los modelos que obtienen mejor ajuste a expensas de un menor número de
grados de libertad (menos parsimonia, más parámetros libres). Se consideran valores aceptables los superiores a
0.80, pero su distribución es desconocida, por lo que se aconseja la comparación de diferentes modelos entre sí.
La raíz cuadrada media residual (RMSR) nos informa de la discrepancia entre los datos y las matrices de
covarianzas hipotetizadas en el modelo. Valores superiores a 0.10 se consideran elevados. El Comparative Fit
Index (CFI) de Bentler (1990) se obtiene de comparar la varianza explicada en relación a un modelo nulo,
entendiendo por éste el que supone que cada ítem define un factor. Con ello se pretende comparar la mejora en
ajuste de cada modelo respecto al modelo nulo o base. Índices en torno a 0,90 o superiores son
psicométricamente aceptables dado que indican que el modelo explica en

torno a un 90% de la covariación de los datos. Finalmente, calculamos el Parsimonious
Goodness﷓of﷓Fit Index (PGFI) (Mulaik, James, Alstine, Bennett, Lind, y Stilwell, 1989), que
combina información sobre el grado de ajuste y de parsimonia. Este índice y el AGFI se consideran índices de
parsimonia y pretenden penalizar a los modelos que obtienen mejor ajuste a expensas de un menor número de
grados de libertad (más parámetros libres). La inclusión de estos índices es problemática (ver McDonald y Marsh,
1990, Mulaik et al., 1989). Aunque la parsimonia es deseable, los modelos correctos y con significado conceptual
no tienen por qué ser parsimoniosos.

Tras la realización de los análisis confirmatorios para la primera muestra (ver tabla número 2), se aprecia que
todos los parámetros de ambos modelos son altamente significativos. La inspección de los residuales
normalizados revela la existencia de siete residuales superiores a dos, significativos, para el modelo monofactorial
y uno menos para el modelo bifactorial. En cualquier caso, el ajuste global de ambos modelos es mejorable. Ello

no impide que desde una perspectiva general el modelo bifactorial alcance un mejor ajuste. En otro orden de
cosas, es importante destacar que la correlación entre los factores del modelo bifactorial es muy alta (0.78).

TABLA NUMERO 2: ÍNDICES DE AJUSTE PARA LOS MODELOS CONTRASTADOS MEDIANTE EL ANÁLISIS
FACTORIAL CONFIRMATORIO DEL CUESTIONARIO GENERAL DE SALUD (GHQ-12).

Pese a todo, las comparaciones que llevamos a cabo son puramente descriptivas, por lo que es arriesgado afirmar
la superioridad de un modelo sobre otro. Se da la circunstancia de que uno de los modelos que comparamos, el
monofactorial, está anidado en el bifactorial. Decimos que un modelo está anidado en otro cuando uno de ellos es
un caso especial del otro. Es decir, el modelo anidado se obtiene por la asignación de un valor determinado en un
elemento del modelo o por la imposición de que dos o más parámetros del modelo tomen el mismo valor. Si
nosotros imponemos un valor de uno a la correlación entre ansiedad y depresión, obtenemos el modelo
monofactorial y podemos verificar la idoneidad de esta restricción. Este tipo de comparaciones, más rigurosas,
implican recurrir a la diferencia entre los estadísticos c2 asociados a cada modelo (ªc2). Esta diferencia se
distribuye como una c2 con un número de grado de libertad igual a la diferencia entre los grados de libertad de
los modelos. Cuando el valor de la diferencia es estadísticamente significativa, podemos afirmar que (i) ambos
modelos son diferentes y (ii) el modelo de mejor ajuste representa significativamente mejor los datos que el
modelo alternativo. En el caso que nos ocupa el resultado final es altamente significativo (ªc2(1)= 24; p >
0.0001). Por tanto, considerar que la prueba mide ansiedad y depresión como elementos distintos pero
relacionados (validez de constructo - discriminante) es más adecuado que afirmar que mide salud general
(solución monofactorial).
No ocurre exactamente lo mismo en la segunda muestra analizada. Nuevamente todos los parámetros alcanzan
niveles de significatividad (p > .001, como mínimo). El número y magnitud de los residuales estandarizados es
similar en un modelo u otro: tan sólo tres alcanzan niveles significativos. De hecho las variables implicadas son
las mismas en ambos modelos. Respecto al ajuste global, este es mejorable en cualquiera de los modelos. Sin
embargo, hay un parámetro que claramente descarta la solución bifactorial: la correlación entre el factor de
depresión y el de ansiedad es de 0.996. Esta conclusión es ratificada por la ªc2 de ambos modelos. Hace falta un
valor mínimo de 3,84 para que los dos modelos sean significativamente diferentes (alfa de 0,05). Y en nuestro
caso la diferencia entre ambos modelos es tan sólo de 3,01.
Respecto a la validez convergente de la prueba calculamos esta bajo dos enfoques alternativos. Por un lado, lo
que podríamos denominar la vía tradicional: calculamos las correlaciones entre la puntuación total del GHQ-12 y
de los supuestos factores con el Beck y el PSWQ. La segunda posibilidad implica comparar mediante el AFC
distintos modelos o hipótesis.
Los resultados de la metodología tradicional indican que si consideramos únicamente la puntuación final en el
GHQ (modelo monofactorial) las mayores relaciones se dan con el inventario de depresión. Esta situación es
previsible dado que el supuesto factor de depresión del GHQ acumula ocho de los doce ítems del instrumento
(contribuye con más varianza a la puntuación total).
Sin embargo, los dos factores supuestamente subyacentes al GHQ no muestran el patrón correlacional que era de
esperar: el factor de depresión alcanza correlaciones más altas con el BDI que con el PSWQ en ambas muestras.
Este, a su vez, se relaciona más estrechamente con el supuesto factor de ansiedad que con el de depresión sólo
para la primera muestra, pero no para la segunda. En la segunda muestra, el cuestionario de ansiedad (PSWQ) se
relaciona más con el supuesto factor depresivo que con el factor de ansiedad (ambos del GHQ).

Desde la perspectiva de los SEM la lógica de análisis podría ser la siguiente (ver figuras 3A, 3B y 3C):
considerando las puntuaciones en ansiedad y depresión de las distintas escalas, )qué modelo se ajusta más a los
datos?. Los modelos que se hipotetizan son tres: Por un lado, dadas las altas correlaciones entre ansiedad y
depresión (del GHQ-12) en al menos una muestra, se puede argumentar que existe un factor general de salud
subyacente a las cuatro puntuaciones (modelo A). Alternativamente esas cuatro puntuaciones se identifican más
adecuadamente con un factor de ansiedad y otro de depresión que, si bien muestran relaciones más o menos
importantes, son diferentes

modelo B). O existe un factor de ansiedad y otro de depresión, pero son totalmente independientes entre sí
(modelo C).
El primer modelo (A) postula la convergencia de las medidas y nos hablaría de la validez convergente de las
pruebas (aunque esta propiedad no sea deseable en este caso). El segundo modelo (B) nos hablaría de la validez
discriminante de las dimensiones de ansiedad y depresión. El tercer modelo apuntaría igualmente hacia la validez
discriminante de los constructos, pero sabemos que es falso, por lo que debe ser rechazado de inmediato.
Tras la realización de estos análisis se aprecia (ver tabla 3), tal y como era de esperar, que el modelo claramente
más desajustado, y que suponíamos falso, es el que propone ansiedad y depresión como elementos
independientes (modelo C). A la misma conclusión llegamos si recurrimos al estadístico ªc2 (ªc2(1)= 169 ó 152
en comparación con el modelo B para la primera o segunda muestra respectivamente, y ªc2(1)= 167 ó 150 en
comparación con el modelo A para la primera o segunda muestra respectivamente).

TABLA NÚMERO 3: ÍNDICES DE AJUSTE PARA LOS MODELOS CONTRASTADOS MEDIANTE EL ANÁLISIS
FACTORIAL CONFIRMATORIO PARA DETERMINAR LA VALIDEZ CONCURRENTE DEL CUESTIONARIO GENERAL DE
SALUD (GHQ-12).

Sin embargo, el ajuste de los modelos A y B es muy similar y la diferencia de ambos modelos no es significativa
(ªc2(1)= 2.19 ó 1.94 para la primera y segunda muestra respectivamente). Si a ello añadimos que la correlación
entre los factores de ansiedad y depresión no es inferior en ningún caso a 0.90 parece claro concluir la
superioridad del modelo monofactorial. Además, por una cuestión de parsimonia sería este el modelo de elección.
Resumiendo, respecto al modelo de medida del GHQ-12 reciben apoyos parciales ambos modelos. Parciales ya
que (i) en una muestra es más adecuado el monofactorial y en otra el bifactorial y (ii) ninguno de los modelos
alcanza un ajuste óptimo. Ello no impide que si partimos de las puntuaciones totales del BDI y del PSWQ y de los

supuestos factores de ansiedad y depresión del GHQ-12, podemos apelar a un factor general de salud (frente al
modelo alternativo de ansiedad y depresión) para explicar la covariación de dichas variables.

El trabajo que finaliza tenía básicamente dos objetivos: introducir algunos conceptos y elementos de la
metodología del análisis factorial confirmatorio vía tal y como lo entiende la metodología de los modelos de
ecuaciones estructurales (SEM) y ejemplificar su uso a través de la contrastación de la estructura factorial del
GHQ de 12 ítems.
Respecto al primer objetivo, se compara el análisis factorial exploratorio y confirmatorio. Como consecuencia de
ambos puntos, se resalta la utilidad de los SEM en el marco de la contrastación de hipótesis. Se ejemplifica cómo
estas pueden ser verificadas a través de los índices de ajuste o del estadístico diferencia en c2 (ªc2). La
versatilidad de este enfoque queda patente en un estudio sencillo como el que presentamos. Es especialmente
ilustrativo como el modelo C que consideraba la ansiedad y la depresión como factores independientes,
claramente incoherente con el estado actual de la psicopatología, es drásticamente rechazado a favor de los dos
modelos-hipótesis realmente competitivos. Lo contrario nos hubiese enfrentado con una de las premisas básicas
de los SEM: los criterios sustantivos deben prevalecer contra los puramente estadísticos o de ajuste.
En relación con el segundo objetivo, la contrastación de la estructura factorial del GHQ-12, los resultados son
claramente inconclusos y reflejan el estado actual de la literatura: ambos modelos reciben apoyos, bien en una u
otra muestra. En este caso la metodología confirmatorio no responde a las cuestiones planteadas, sino que se
limita a justificar resultados precedentes discordantes.
En otro orden de cosas, la validez criterial de la prueba se ha analizado a través de procedimientos tradiconales
(correlaciones entre pruebas) o mediante el AFC. La vía tradicional apoyaría indistintamente la consideración
mono o bifactorial del GHQ-12. La metodología SEM se decanta por considerar, apelando al principio de
parsimonia y a la elevada correlación entre los supuestos factores, que subyace un factor general de malestar
psicológico o salud, tal y como defiende Golberg.
Más allá de estas consideraciones habría que observar que la elección del BDI y el PSWQ no parece la más
adecuada (aunque si son útiles bajo el objetivo docente perseguido inicialmente). Actualmente se insiste en la
pertinencia de considerar la existencia de trastornos mixtos de ansiedad-depresión, caracterizado por síntomas
inespecíficos o bajas puntuaciones en ansiedad y depresión. Si a ello añadimos que el PSWQ es un instrumento
adecuado para evaluar la ansiedad generalizada y que esta mantiene fuertes compromisos con los trastornos del
estado de ánimo (la distimia, principalmente) parece coherente sostener que lo que miden los datos con los que
hemos trabajado es malestar psicológico. Este se operacionalizó en el Goldberg, y se manifiesta aquí, a través de
síntomas afines a la ansiedad y la depresión.
Resumiendo: en torno al GHQ la situación descrita a lo largo de la presentación de resultados es muy similar a la
que encontramos en la bibliografía: reciben apoyos la consideración mono y bifactorial del cuestionario. Más
paradójico, los estudios llevados a cabo mediante AFE tienden a apoyar la consideración unifactorial de la escala,
mientras que los trabajos con AFC apoyarían los subfactores de depresión y ansiedad. Nuestros resultados lejos
de resolver esta polémica la justifican. Consideramos que, mientras no se aporten más pruebas en uno u otro
sentido, es más coherente estimar una única puntuación general de salud. Lo contrario puede inducirnos a errores
y etiquetas cuyo efecto negativo es de sobra conocido.
Coincidimos con González﷓Roma et al., (1991) en la conveniencia de profundizar en la búsqueda de
estructuras más idóneas para explicar la estructura de la prueba. La metodología confirmatorio puede ser un buen
aliado en esta tarea, y por extensión, en la problemática de contrastación de hipótesis en psicología. Desperdiciar
por desconocimiento o falta de uso una metodología tan potente y flexible parece un lujo que no nos podemos
permitir.

Cliff, N. (1983): Some cautions concerning the application of causal modeling methods. Multivariate Behavioral
Research, 18, 115﷓126.
Banks, M.H., Clegg, C.P., Jakson, P.R., Kemp, N.J., Stafford, E.M. y Wall, T.D. (1980): The use of the General
Health as an indicator of mental mealth in ocupational studies. Journal of Occupational Psychology, 53,
178﷓194.
Beck, A. T., Rush, A.J., Shaw, B.F. y Emery, G. (1979): Cognitive therapy of depression. Nueva York: Guilford
Press.

Benjamin, S., Decalmer, P., y Haran, D. (1982): Community screening for mental illness: A validity study ot the
General Health Questionnaire. British Journal of Psychiatry, 140, 174﷓180.
Bentler, P.M. (1980): Multivariate analysis with latent variables: causal modeling. Annual Review of Psychology,
31, 419﷓456.
Bentler, P.M. (1990): Comparative Fit Indixes in Structural Models. Psychological Bulletin, 107, 238-246
Bollen, K.A., (1989): Structural Equations with Latent Variables. Nueva York. Willey.
Bollen, K.A. y Long, J.S. (Eds.) (1993): Testing structural Equations Models. London. Sage.
Burvill,P.W. y Knuiman, M.W.(1983): Which version of the General Health Questionnaire should be used in
community studies?. Australian and Newland Zealand Journal of Psychiary, 17, 237-242
Casey, P. (1990): Screening and detection of psychiatric illness. En D. Peck y C.M. Shapiro (Eds.). Measuring
human problems. A practical guide. Nueva York. John Wiley & Sons.
García Rodríguez, I. (1990): Análisis de las propiedades psicométricas del Cuestionario General de Salud Mental y
su utilidad en el área de psicología del trabajo. Comunicación presentada al II Congreso del Colegio Oficial de
Psicólogos. Alicante.
Goldberg, D. (1972): The Detection of Psychiatric Illnes by Questionnaire. Windsor. National Foundation for
Educational Research.
Goldberg, D. (1978): Manual for the General Health Questionnaire. Windsor. National Foundation for Educational
Research.
Goldberg, D. y Williams, P. (1988): A user´s guide tp the General Health Questionnaire. Windsor. The NFERNELSON publishing Company.
Gonzalez﷓Roma, Lloret, S. y Espejo, B. (1993): Comparación de dos modelos de medida del Custionario
de Salud General (GHQ﷓12). Psicológica, 14, 259﷓268.
González﷓Roma, V., Peiró, J.M. Luna, R., Baeza, J., Espejo, B. y Muñoz, P. (1991): Un estudio de la
estructura factorial del Cuestionario General de Salud (GHQ-12): Comparación de dos modelos factoriales.
Psicológica, 12, 119﷓129.
Goodchild, M.E. y Dunca-Jones, P. (1985): Chronicity and the General Health Questionnaire. Briths Journal of
Psychiatry, 146, 55-61.
Graetz, B. (1991): Multidimensional properties of the General Health Questionnaire. Social Psychiatry
Epidemilogical, 26(3), 132-138.
Jöreskog, K.G. y Sörbom, D. (1983): LISREL VI. Analysis of Linear Structural Relations by the Methods of
Maximum Likelihood. Uppsula, Suecia: University of Uppsula.
Long, J.S. (1983): Covariance structure models. A introduction to LISREL. Beverly Hills. Sage Publications.
Marsh, W. (1987): The Hierarchical Structure of Self﷓Concept and the Application of Hierarchical
Confirmatory Factor Analysis, Journal of Educational Measurement, 24(1), 17-39
McDonald, R. y Marsh, W. (1990): Choosing a Multivariate Model: Noncentrality and Goodness of Fit.
Psychological Bulletin, 107(2), 247-255.
Meyer, T.J., Miller, M.L., Metzeger, R.L. y Borkovec, T.D. (1990): Developmet and validation of the Penn State
Worry Questionary. Behavior Research and Therapy, 28, 487﷓495.
Moret, D., Hortangas, P., Sancern, M.D., y Zurriaga, R. (1987): Una adaptación española del GHQ-12 para una
muestra de estudiantes de formación profesional. II Congreso de Evaluación Psicológica. Madrid.

Mulaik, S. (1987): A brief history of the philosophical foundations of exploratory factor analysis. Multivariate

Behavioral Research, 22, 267﷓305.
Mulaik, S., James, L., Alstine, J., Bennett, V., Lind, S. Y Stilwell, D. (1989): Evaluation of
Goodness﷓of﷓Fit Indices for Structural Equation Models. Psychological Bulletin, 105 (3): 430445.
Politi,P.L., Piccinelli, M. y Wilkinson, G. (1994): Reliability, validity and factor structure of the 12-item General
Questionnaire among young males in Italy. Acta Psychiatrica Scandinava,90(6), 432﷓7.
Seoanne, J. (1986): Prólogo. En B. Visauta. Modelos causales. Barcelona. Editorial Hispano Europea
Vázquez, C. y Sanz, J. (1991): Fiabilidad y validez factorial de la versión española del Inventario de Depresión de
Beck. Comunicación presentada en el III Congreso de Evaluación Psicológica, Barcelona, 25﷓28 de
septiembre de 1991.
Worsley, A. y Gribbin, C.C. (1977): A factor analytic study of the twelve item General Health Questionnaire.
Australian and Newland Zealand Journal of Psychiary, 11, 269-272

Comentarios/ Valoraciones de los usuarios



¡Se el primero en comentar!

La información proporcionada en el sitio web no remplaza si no que complementa la relación entre el profesional de salud y su paciente o visitante y en caso de duda debe consultar con su profesional de salud de referencia.