Errores aleatorios y sistemáticos. Confusión

0.0(0)

Studied by 0 people

Call Kai

Learn

Practice Test

Spaced Repetition

Match

Flashcards

Knowt Play

Card Sorting

1/28

There's no tags or description

Looks like no tags are added yet.

Last updated 5:16 PM on 3/18/26

Name	Mastery	Learn	Test	Matching	Spaced	Call with Kai

No analytics yet

Send a link to your students to track their progress

29 Terms

New cards

Introducción

Cuando hacemos un estudio queremos saber:

Es válido?
1. El estimador puntual se acerca al parámetro real?
2. Está libre de sesgo?
Es preciso?
1. Si repito el estudio, obtendría valores parecidos?
2. Qué tan estrecho es el intervalo de confianza?

Esto nos lleva a los dos grandes enemigos:

Error aleatorio (azar) → afecta a la precisión
Error sistemático (sesgo) → afecta a la validez

New cards

Error aleatorio

Los errores aleatorios son inconsistentes

Eso significa:

Que a veces te empujan el estimador hacia arriba
A veces hacia abajo
No tienen dirección fija
Son frutos del azar

No sesgan pero aumentan la variabilidad

Afectan a la precisión

De dónde vienen estos errores?

Del error muestral (selección por muestreo)
1. Porque trabajamos con una muestra, no con toda la población
  1. Si repites el estudio con otra muestra, obtendrás valores ligeramente distintos.
  2. Esto es normal y esperado
Errores de medida
1. Por ejemplo:
  - Dos investigadores miden peso: uno redondea hacia arriba, otro hacia abajo
  - Un tensiómetro mal calibrado
  - Variabilidad entre observadores (interobservador)
  - Variabilidad dentro del mismo observador (intraobservador)
Variabilidad intrasujeto
1. El mismo individuo puede:
  - pesar distinto por la mañana y por la tarde
  - tener glucosa distinta según la hora
  - tener presión arterial variable
  👉 Todo esto introduce ruido, no sesgo

Impacto

El impacto clave es:

Aumenta el ancho del IC
- IC amplio → poca precisión
- IC estrecho → mucha precisión
- El estimador puede ser válido (no sesgado), pero si el IC es enorme, no es útil

Cómo reducir el error

Aumentar el tamaño muestral
- Reduce el error estándar
- Reduce la variabilidad
- Estrecha el IC
- Mejora la precisión
- Es la estrategia más potente.
Mejorar la eficiencia
- Para un mismo tamaño muestral, obtener la máxima información.
- Ejemplo clásico:
  - En ensayos clínicos, la asignación 1:1 es la más eficiente.
  - Diseños como casos y controles emparejados también mejoran eficiencia.
Entrenamiento del personal
1. Para que midan igual
2. Para reducir variabilidad interobservador e intraobservador
Mejorar instrumentos de medida
- Equipos calibrados
- Métodos estandarizados
- Protocolos claros

Ejemplo intuitivo para fijarlo

Imagina que quieres medir la altura media de los estudiantes de tu facultad.

Si mides solo a 10 personas → valores muy variables → IC enorme
Si mides a 500 personas → valores muy estables → IC estrecho

Eso es error aleatorio:
no te está empujando hacia arriba o hacia abajo de forma sistemática, simplemente mete ruido

New cards

Errores sistemáticos (sesgos)

QUé son los sesgos?

Errores que tienen dirección fija
No se compensan con el tamaño muestral
Afectan a la VALIDEZ (no a la precisión)
Desvían el estimador del parámetro real de forma sistemática

A diferencia del errores aleatorio, no son ruido, son desviaciones estructurales

Si un estudio tiene sesgo:

Puede ser muy preciso (IC estrecho), pero incorrecto
Ej:
- Haces estudio de si fumar causa cáncer de pulmón:
  - Muestra gigante, tamaño muestral grande → error aleatorio pequeño → IC estrechos
- PERO, reclutas sólo a trabajadores de oficina (que suelen fumar menos, tienen mejor acceso a salud, etc) → SESGO DE SELECCIÓN
- Esto hace que la población del estudio no represente a la población general

New cards

Clasificación de los sesgos

Sesgo de selección
Sesgo de información
Confusión

New cards

Sesgo de selección

Cuando ocurre?

Ocurre cuando los individuos incluidos en el estudio no representan a la población objetivo

Cuándo puede aparecer?

En el baseline:
- Sesgo del voluntario
  - Quienes aceptan participar suelen ser más sanos, más motivados, más educados…
- Sesgo del trabajador sano
  - Trabajadores más sanos que la población general
- Sesgo de no respuesta
  - Quienes no responden suelen diferir sistemáticamente
Durante el seguimiento:
- Pérdidas de seguimiento (atrtrition bias)
  - Si los que abandonan difieren en exposición o riesgo, distorsionan el resultado
    - Resultado: el grupo final no es comparable al que querías estudiar

New cards

Sesgo de información

Errores de medición de exposición, resultado o covariables

Incluye:

Sesgo de clasificación (misclassification)
- Clasificar mal a expuestos/no expuestos
- Clasificar mal a enfermos/no enfermos
- Puede ser diferencial o no diferencial
Sesgo de observación
- El observador sabe la exposición y mide distinto
- Ejemplo: médico que examina más a fondo a expuestos
Sesgo de recuerdo
- Muy típico en caso-control
- Los casos recuerdan más (o exageran) exposiciones pasadas
- Los controles olvidan más
Sesgo de reporte
- El participante oculta o modifica información (drogas, alcohol, conductas sexuales, etc)
- Resultado → medición no refleja la realidad

New cards

Confusión

Tipo especial de error sistemático (no es ni de selección ni de información)

→ lo veremos más adelante

New cards

Cuales son los diseños con menos sesgos? Cómo reducimos los sesgos?

Con la aleatorización

El diseño con menos sesgos son los ensayos clínicos aleatorizados

Por qué?

La aleatorización elimina el sesgo de selección
El cegamiento reduce sesgo de información
El seguimiento estricto reduce pérdidas
La asignación oculta evita manipulación

No elimina el error aleatorio, pero minimiza el sistemático

New cards

Sesgos típicos según diseño

Transversales

Sesgo del voluntario sano
Sesgo de autorreporte
Falacia de Neyman (sobrevivientes)
No respuesta

Cohortes

Clasificación basal incorrecta
Autorreporte
Sesgo de verificación de outcomes
Pérdidas de seguimiento
Efecto Hawthorne (cambian conducta por ser observados)

Caso control

Sesgo de recuerdo
Sesgo de selección de casos
Sesgo de selección de controles
Sesgo de verificación de exposición

Ensayo clínico

Sesgo de asignación
Sesgo de verificación de outcomes
Pérdidas de seguimiento
Sesgo de adherencia

New cards

Precisión vs validez

🟦 1. Baja precisión + baja validez

Puntos dispersos y lejos del centro
→ error aleatorio + error sistemático

🟩 2. Alta precisión + baja validez

Puntos agrupados pero lejos del centro
→ sesgo (error sistemático)
→ el estudio es consistente pero incorrecto

🟧 3. Baja precisión + alta validez

Puntos dispersos pero centrados
→ error aleatorio
→ si aumentas tamaño muestral, se arregla

🟥 4. Alta precisión + alta validez

Puntos agrupados en el centro
→ estudio ideal
→ sin sesgo y con poca variabilidad

👉 Esta imagen resume todo el tema:

Error aleatorio = precisión
Error sistemático = validez

New cards

Validez

Interna:

Los resultados del estudio son correctos para esa población concreta?
- Depende de:
  - Ausencia de sesgos
  - Ausencia de confusión
  - Mediciones correctas
  - Diseño adecuado
Si no hay validez interna, no hay nada que generalizar

Externa:

Puedo aplicar estos resultados a otras poblaciones?
- Depende de:
  - Si la población del estudio se parece a la población diana
  - Si el contexto clínico es comparable
  - Si la intervención es aplicable fuera del estudio
- Es más abstracta, menos cuantificable
- No siempre interesa (ensayos explicativos vs pragmáticos)

La validez interna es necesaria para la validez externa

New cards

Confusión

Es el gran sesgo conceptual

Es un error sistemático, pero no es selección ni información

Es un problema de:

Diseño y análisis

La definición:

Asociación observada entre exposición y resultado está distorsionada porque una tercera variable está relacionada con ambos

Imagen:

Alcohol → infarto
Tabaco → asociado a alcohol y a infarto
- Tabaco es un confusor
  - los que beben más también fuman más
  - Y el tabaco sí causa infarto
    → La asociación alcohol–infarto está inflada por el tabaco

Requisitos de un factor de confusión

Está asociado al resultado
- Debe aumentar o disminuir el riesgo de outcome
Está asociado a la exposición
- Debe estar distribuido de forma desigual entre expuestos y no expuestos
No es un mediador
- No está en la cadena causal entre exposición → outcome
- Si está en la cadena causal, es un mediador, no un confusor

Ejemplo del tabaco:
- Tabaco → aumenta mortalidad (criterio 1)
- Tabaco → más frecuente entre quienes toman café (criterio 2)
- No está en la cadena café → tabaco → mortalidad (criterio 3)
→ Tabaco es confusor
- En este caso, un mediador podría ser hipertensión arterial, ya que el alcohol puede aumentar la presión arterial, que aumenta el riesgo de infarto (por lo tanto, está en la cadena causal)

Un confusor es una variable que “explica” parte de la asociación que tú crees que existe

¡CUIDADO! ¡ESTO ES DISEÑO!

Porque la confusión se controla:

antes del análisis
durante el diseño del estudio

Con:

aleatorización
restricción
emparejamiento
estratificación
medición adecuada de covariables

👉 Si no mides el confusor, no puedes ajustarlo después

<p>Es el gran sesgo conceptual</p><p>Es un error sistemático, pero no es selección ni información</p><p>Es un problema de:</p><ul><li><p>Diseño y análisis</p></li></ul><p>La definición:</p><ul><li><p>Asociación observada entre exposición y resultado está distorsionada porque una tercera variable está relacionada con ambos</p></li></ul><p>Imagen:</p><ul><li><p>Alcohol → infarto</p></li><li><p>Tabaco → asociado a alcohol y a infarto</p><ul><li><p>Tabaco es un confusor</p><ul><li><p>los que beben más también fuman más</p></li><li><p>Y el tabaco sí causa infarto<br>→ La asociación alcohol–infarto está inflada por el tabaco</p></li></ul></li></ul></li></ul><div data-type="horizontalRule"><hr></div><p>Requisitos de un factor de confusión</p><ol><li><p><strong>Está asociado al resultado</strong></p><ul><li><p>Debe aumentar o disminuir el riesgo de outcome</p></li></ul></li><li><p><strong>Está asociado a la exposición</strong></p><ul><li><p>Debe estar distribuido de forma desigual entre expuestos y no expuestos</p></li></ul></li><li><p><strong>No es un mediador</strong></p><ul><li><p>No está en la cadena causal entre exposición → outcome</p></li><li><p>Si está en la cadena causal, es un <strong>mediador, </strong>no un confusor</p></li></ul></li></ol><ul><li><p><strong>Ejemplo del tabaco:</strong></p><ul><li><p>Tabaco → aumenta mortalidad (criterio 1)</p></li><li><p>Tabaco → más frecuente entre quienes toman café (criterio 2)</p></li><li><p>No está en la cadena café → tabaco → mortalidad (criterio 3)</p></li></ul><p>→ <strong>Tabaco es confusor</strong></p><ul><li><p>En este caso, un mediador podría ser hipertensión arterial, ya que el alcohol puede aumentar la presión arterial, que aumenta el riesgo de infarto (por lo tanto, está en la cadena causal)</p></li></ul></li></ul><div data-type="horizontalRule"><hr></div><p>Un confusor es una variable que “explica” parte de la asociación que tú crees que existe</p><p>¡CUIDADO! ¡ESTO ES DISEÑO!</p><p>Porque la confusión se controla:</p><ul><li><p><strong>antes</strong> del análisis</p></li><li><p><strong>durante</strong> el diseño del estudio</p></li></ul><p>Con:</p><ul><li><p>aleatorización</p></li><li><p>restricción</p></li><li><p>emparejamiento</p></li><li><p>estratificación</p></li><li><p>medición adecuada de covariables</p></li></ul><p><span data-name="point_right" data-type="emoji">👉</span> Si no mides el confusor, <strong>no puedes ajustarlo después</strong></p>

New cards

DAGS

Sirven para:

Visualizar relaciones causales
Identificar confusores (es decir, que variables pueden confuncir)
Distinguir confusores de mediadores
Evitar ajustar por variables que no debes (colliders)
- Si una variable apunta a exposición y outcome → sospecha de confusión
- Si está en la cadena causal → mediador
- Si es un collider → NO se ajusta
Los DAGs básicamente te dicen qué ajustar y qué no

El tabaco es un confusor porque:

afecta al alcohol (exposición)
afecta al infarto (outcome)
no está en la cadena causal alcohol → infarto

New cards

¿Cómo se identifican los posibles factores de confusión?

en fase de diseño:

Creación de gráficos acíclicos dirigidos (DAG) teniendo en cuenta la experiencia y la evidencia clínica

New cards

Control de la confusión en fases de diseño?

Tenemos 3 herramientas clásicas:

Aleatorización
- Solo es posible en estudios de intervención (por eso en los estudios observacionales tenemos que prestar más atención en la fase de análisis con los factores de confusión)
  - Distribuye confusores conocidos y desconocidos
  - Hace comparables los grupos
  - Es la forma más potente de eliminar confusión
Restricción
- Incluir como criterio de selección para nuestro estudio una categoría de la variable de confusión (si es cualitativa) o rangos no muy amplios (si es cuantitativa) de manera que no haya desequilibrio entre los grupos comparados
- Ejemplo:
  - Solo incluir no fumadores en un estudio alcohol → infarto.
- Ventajas:
  - Elimina la confusión por tabaco
  Limitaciones:
  - Reduce población elegible
  - No puedes estudiar el efecto del tabaco
  - Puede quedar confusión residual si el rango es amplio
    - Confusión residual → Incluso después de controlar los factores de confusión, aún puede haber confusión porque no se tuvieron en cuenta algunos factores de confusión, porque el control no fue bueno, etc.
Emparejamiento - Matching
- Muy usado en caso-control y cohortes retrospectivas
- Consiste en emparejar a un individuo expuesto con uno o más individuos no expuestos respecto a posibles variables de confusión
- Ejemplo:
  - Por cada caso de 60 años, eliges un control de 60 años (igualas sexo, edad, etc)
- Limitaciones:
  - Reduce tamaño elegible
  - No puedes estudiar la variable por la que emparejas
  - Puede haber confusión residual

New cards

Control de la confusión en fases de análisis.

Si el tamaño del efecto bruto es “diferente” de la medida ajustada

Diferente quiere decir >10-20% → mirar imagen!

Cuando haces un estudio, primero calculas la asociación cruda (OR crudo, RR crudo, coeficiente crudo)

→ ese valor incluye todo

La asociación real + la distorsión por los confusores

Luego ajustas por posibles confusores (edad, sexo, tabaco, etc.) y obtienes:

OR ajustado
RR ajustado

👉 Si el crudo y el ajustado son muy diferentes, significa que había confusión

Tenemos dos herramientas para controlar la confusión en la fase de análisis (secuenciales y complementarias)

Estratificación
- Divides la muestra en estratos según el confusor.
- Ejemplo:
  - Fumadores
  - No fumadores
  Y calculas el efecto en cada estrato.
  Si los OR/RR cambian respecto al crudo → hay confusión.
  Limitaciones:
  - Si hay muchos confusores → demasiadas tablas
  - Se pierde potencia
  - Celdas pequeñas → estimaciones inestables
Ajuste multivariable (regresión)
- Es lo que se usa en la práctica real.
  - Ajustas por edad, sexo, tabaco, etc.
  - Obtienes un estimador ajustado
  Regla para detectar confusión (imagen)

<p>Si el tamaño del efecto bruto es “diferente” de la medida ajustada</p><ul><li><p>Diferente quiere decir >10-20% → mirar imagen!</p></li></ul><p>Cuando haces un estudio, primero calculas la asociación cruda (OR crudo, RR crudo, coeficiente crudo)</p><p>→ ese valor incluye todo</p><ul><li><p>La asociación real + la distorsión por los confusores</p></li></ul><p>Luego ajustas por posibles confusores (edad, sexo, tabaco, etc.) y obtienes:</p><ul><li><p>OR ajustado</p></li><li><p>RR ajustado</p></li></ul><p><span data-name="point_right" data-type="emoji">👉</span> <strong>Si el crudo y el ajustado son muy diferentes, significa que había confusión</strong></p><div data-type="horizontalRule"><hr></div><p>Tenemos dos herramientas para controlar la confusión en la fase de análisis (secuenciales y complementarias)</p><ol><li><p><strong>Estratificación </strong></p><ul><li><p>Divides la muestra en estratos según el confusor.</p></li><li><p>Ejemplo:</p><ul><li><p>Fumadores</p></li><li><p>No fumadores</p></li></ul><p>Y calculas el efecto en cada estrato.</p><p>Si los OR/RR cambian respecto al crudo → <strong>hay confusión</strong>.</p><p>Limitaciones:</p><ul><li><p>Si hay muchos confusores → demasiadas tablas</p></li><li><p>Se pierde potencia</p></li><li><p>Celdas pequeñas → estimaciones inestables</p></li></ul></li></ul></li><li><p><strong>Ajuste multivariable (regresión)</strong></p><ul><li><p>Es lo que se usa en la práctica real.</p><ul><li><p>Ajustas por edad, sexo, tabaco, etc.</p></li><li><p>Obtienes un estimador ajustado</p></li></ul><p>Regla para detectar confusión (imagen)</p></li></ul></li></ol><p></p>

New cards

Ejemplo estratificación

Pregunta de investigación: ¿El consumo de café está asociado con la mortalidad?

→ Nos sale que OR = 1.80 (IC 95%: 1,2-2,7)

→ parece que sí que está asociado con la mortalidad, pero puede haber factores de confusión, por ejemplo el consumo de tabaco → hacemos otra tabla de contingencia igual, tanto en fumadores como en no fumadores (imagen)

Estratificas:

No fumadores
- OR = 0.56 (no significativo)
Fumadores
- OR = 1.20 (no significativo)

Luego haces el OR ajustado (Mantel-Haenszel):

OR ajustado = 1.1
OR crudo = 1.8

Diferencia enorme → hay confusión.

👉 El tabaco inflaba la asociación café → mortalidad.

👉 Conclusión: el café NO está asociado a mortalidad.
La asociación cruda era falsa por confusión

<p>Pregunta de investigación: ¿El consumo de café está asociado con la mortalidad?</p><p>→ Nos sale que OR = 1.80 (IC 95%: 1,2-2,7)</p><p>→ parece que sí que está asociado con la mortalidad, pero puede haber factores de confusión, por ejemplo el consumo de tabaco → hacemos otra tabla de contingencia igual, tanto en fumadores como en no fumadores (imagen)</p><p>Estratificas:</p><ul><li><p> No fumadores</p><ul><li><p>OR = 0.56 (no significativo)</p></li></ul></li><li><p>Fumadores</p><ul><li><p>OR = 1.20 (no significativo)</p></li></ul></li></ul><p>Luego haces el <strong>OR ajustado (Mantel-Haenszel)</strong>:</p><ul><li><p>OR ajustado = <strong>1.1</strong></p></li><li><p>OR crudo = <strong>1.8</strong></p></li></ul><p>Diferencia enorme → <strong>hay confusión</strong>.</p><p><span data-name="point_right" data-type="emoji">👉</span> El tabaco inflaba la asociación café → mortalidad.</p><p><span data-name="point_right" data-type="emoji">👉</span> Conclusión: <strong>el café NO está asociado a mortalidad</strong>.<br>La asociación cruda era falsa por confusión</p>

New cards

Confusión residual

Incluso después de ajustar:

Puede quedar confusión por variables no medidas
O mal medidas
O por rangos amplios en la restricción
O por mala calidad del ajuste

👉 Siempre existe un poco de confusión residual

New cards

Resumen

Confusor = variable asociada a exposición y outcome, no mediador
Se identifica con DAGs y lógica causal
Se controla en diseño: aleatorización, restricción, matching
Se controla en análisis: estratificación, ajuste multivariable
Si el estimador crudo y ajustado difieren >10–20% → hay confusión
El ejemplo del café muestra confusión por tabaco

New cards

Cochran–Mantel–Haenszel (CMH)

Permiten el cálculo de una estimación ponderada de las medidas de asociación obtenidas en los estratos de las posibles variables confusoras

Es una estimación ponderada porque
- Porque no todos los estratos tienen el mismo tamaño.
- No es lo mismo un estrato con 300 personas que uno con 30.
- CMH da más peso a los estratos grandes y menos a los pequeños

Qué hace?

Toma los OR/RR de cada estrato (por ejemplo fumadores y no fumadores), los combina de forma ponderada y te da un único valor ajustado
Ese valor es el OR ajustado o RR ajustado.
Y lo que tú interpretas es:
- ¿El ajustado se parece al crudo?
  → No había confusión
- ¿El ajustado es muy distinto del crudo?
  → Había confusión
Eso es todo

Interpretación:

Lo que interpretamos es si el riesgo relativo se aproxima mucho o poco al ajustado
Es decir:
- OR crudo → lo que parece a primera vista
- OR ajustado (CMH) → lo que queda después de quitar la confusión
Si el crudo y el ajustado son muy diferentes → confusión

<p>Permiten el cálculo de una <strong>estimación ponderada </strong>de las medidas de asociación obtenidas en los estratos de las posibles variables confusoras</p><ul><li><p>Es una estimación ponderada porque </p><ul><li><p>Porque no todos los estratos tienen el mismo tamaño.</p></li><li><p>No es lo mismo un estrato con 300 personas que uno con 30.</p></li><li><p>CMH da más peso a los estratos grandes y menos a los pequeños</p></li></ul></li></ul><div data-type="horizontalRule"><hr></div><p><strong>Qué hace?</strong></p><ul><li><p>Toma los OR/RR de cada estrato (por ejemplo fumadores y no fumadores), los combina de forma ponderada y te da un único valor ajustado</p></li><li><p>Ese valor es el <strong>OR ajustado</strong> o <strong>RR ajustado</strong>.</p><p>Y lo que tú interpretas es:</p><ul><li><p>¿El <strong>ajustado</strong> se parece al <strong>crudo</strong>?<br>→ No había confusión</p></li><li><p>¿El <strong>ajustado</strong> es muy distinto del <strong>crudo</strong>?<br>→ Había confusión</p></li></ul><p>Eso es todo</p></li></ul><div data-type="horizontalRule"><hr></div><p><strong>Interpretación:</strong></p><ul><li><p>Lo que interpretamos es si el riesgo relativo se aproxima mucho o poco al ajustado </p></li><li><p>Es decir:</p><ul><li><p><strong>OR crudo</strong> → lo que parece a primera vista</p></li><li><p><strong>OR ajustado (CMH)</strong> → lo que queda después de quitar la confusión</p></li></ul><p>Si el crudo y el ajustado son muy diferentes → <strong>confusión</strong></p></li></ul><p></p>

New cards

Por qué usamos CMH y no solo mirar estratos?

Porque:

Mirar estratos te dice si hay confusión
Pero CMH te da un único número ajustado
Ese número es el que comparas con el crudo
Y es el que reportas en el estudio

Es la forma clásica de ajustar por un confusor categórico

New cards

Confusión positiva vs negativa

Confusión positiva (sobreestimación)

La medida cruda está más alejada de 1 que la ajustada
Es decir:
- El efecto crudo parece más fuerte (es decir, más lejos del uno)
- El efecto ajustado es más débil o incluso desaparece
👉 La confusión exagera la asociación.
Ejemplo:
- OR crudo = 2.5
- OR ajustado = 1.3
El crudo está más lejos de 1 → sobreestimación (parecía un efecto enorme, pero como que el ajustado está más cerca del 1, el efecto real es más débil)

Esto fue EXACTAMENTE lo que pasó en el ejemplo del café:

OR crudo = 1.8

OR ajustado = 1.1
→ Confusión positiva por tabaco

Confusión negativa (subestimación)

La medida cruda está más cerca de 1 que la ajustada

Es decir:

El efecto crudo parece más débil
El efecto ajustado es más fuerte

👉 La confusión oculta parte de la asociación real.

Ejemplo:

RR crudo = 1.2
RR ajustado = 2.0

El crudo está más cerca de 1 → subestimación (parecía que no había efecto, pero tenemos un efecto real fuerte)

Cuanto más lejos está el RR/OR de 1, mayor es la diferencia entre los grupos comparados

Y esa diferencia puede ser:

un aumento del riesgo (si es >1)
una disminución del riesgo (si es <1)

Pero cuanto más lejos de 1, más grande es el efecto

Que el efecto sea fuerte significa que hay mayor diferencia entre expuestos y no expuestos, y que hay mayor impacto de la exposición en el outcome, además de mayor efecto real

Entonces:
- Más fuerte = más impacto

Efectos agregados a todos los confusores

En la vida real, no hay un solo confusor.
Hay muchos:
- edad
- sexo
- tabaco
- dieta
- ejercicio
- nivel socioeconómico
- comorbilidades
Cada uno puede:

empujar el efecto hacia arriba
empujarlo hacia abajo

El resultado final (positivo o negativo) depende de la suma de todos ello

<p><strong>Confusión positiva (sobreestimación)</strong></p><ul><li><p>La medida cruda está más alejada de 1 que la ajustada</p></li><li><p>Es decir:</p><ul><li><p>El efecto crudo parece <strong>más fuerte</strong> (es decir, más lejos del uno)</p></li><li><p>El efecto ajustado es <strong>más débil</strong> o incluso desaparece</p></li></ul><p><span data-name="point_right" data-type="emoji">👉</span> La confusión <strong>exagera</strong> la asociación.</p><p><strong>Ejemplo:</strong></p><ul><li><p>OR crudo = 2.5</p></li><li><p>OR ajustado = 1.3</p></li></ul><p>El crudo está más lejos de 1 → <strong>sobreestimación </strong>(parecía un efecto enorme, pero como que el ajustado está más cerca del 1, el efecto real es más débil)</p></li></ul><p>Esto fue EXACTAMENTE lo que pasó en el ejemplo del café:</p><ul><li><p>OR crudo = 1.8</p></li></ul><p>OR ajustado = 1.1<br>→ Confusión positiva por tabaco</p><div data-type="horizontalRule"><hr></div><p><strong>Confusión negativa (subestimación)</strong></p><ul><li><p>La medida cruda está más cerca de 1 que la ajustada</p></li></ul><p>Es decir:</p><ul><li><p>El efecto crudo parece <strong>más débil</strong></p></li><li><p>El efecto ajustado es <strong>más fuerte</strong></p></li></ul><p><span data-name="point_right" data-type="emoji">👉</span> La confusión <strong>oculta</strong> parte de la asociación real.</p><p><strong>Ejemplo:</strong></p><ul><li><p>RR crudo = 1.2</p></li><li><p>RR ajustado = 2.0</p></li></ul><p>El crudo está más cerca de 1 → <strong>subestimación </strong>(parecía que no había efecto, pero tenemos un efecto real fuerte)</p><div data-type="horizontalRule"><hr></div><p>Cuanto más lejos está el RR/OR de 1, mayor es la diferencia entre los grupos comparados</p><p>Y esa diferencia puede ser:</p><ul><li><p><strong>un aumento del riesgo</strong> (si es >1)</p></li><li><p><strong>una disminución del riesgo</strong> (si es <1)</p></li></ul><p>Pero cuanto más lejos de 1, <strong>más grande es el efecto</strong></p><p>Que el efecto sea fuerte significa que hay mayor diferencia entre expuestos y no expuestos, y que hay mayor impacto de la exposición en el outcome, además de mayor efecto real</p><ul><li><p>Entonces:</p><ul><li><p>Más fuerte = más impacto</p></li></ul></li></ul><div data-type="horizontalRule"><hr></div><p>Efectos agregados a todos los confusores</p><ul><li><p>En la vida real, no hay un solo confusor.<br>Hay <strong>muchos</strong>:</p><ul><li><p>edad</p></li><li><p>sexo</p></li><li><p>tabaco</p></li><li><p>dieta</p></li><li><p>ejercicio</p></li><li><p>nivel socioeconómico</p></li><li><p>comorbilidades</p></li></ul><p>Cada uno puede:</p></li></ul><ul><li><p>empujar el efecto hacia arriba</p></li><li><p>empujarlo hacia abajo</p></li></ul><p>El <strong>resultado final</strong> (positivo o negativo) depende de la suma de todos ello</p><p></p><p></p>

New cards

La estratificación es suficiente para ajustar confusores?

porque si ajustas por dos confusores, necesitas 4 tablas de contingencia. Si ajustas por tres, necesitas ocho tablas, y así sucesivamente (2^x)

→ esto tiene un nombre:

Explosión de estratos
- Problemas:
  - Demasiadas tablas
  - Celdas con números pequeños
  - Pérdida de potencia
  - Imposible de manejar con muchos confusores

Por eso la estratificación es útil para detectar confusión, pero no para controlarla cuando hay muchas variables

Qué hacemos entonces?

→ hacemos modelos de regresión

En estudios observacionales, SIEMPRE necesitas modelos de regresión para controlar confusores.

Porque:

puedes ajustar por muchas variables a la vez
no pierdes potencia
no necesitas estratos
obtienes un único estimador ajustado
puedes incluir variables continuas (edad, IMC, etc)

Ecuación para estimar la relación entre:

Dependiente o resultado (y)
independientes o predictoras (x)

New cards

Tipos de modelos según la variable dependiente

Tipo de regresión	Variable Dependiente	Ejemplo
Lineal	Cuantitativa (estima diferencia media)	IMC, presión arterial
Logística	Categórica (sí/no) (estima ORa)	Infarto sí/no

Poisson	Conteos (núm- de veces que ocurre algo), estimas RRa	Número de crisis asmáticas
Cox	Tiempo hasta evento	Supervivencia (tiempo hasta infarto, hasta muerte…)

New cards

Tipos de modelos según la variable independiente

Univariable → sólo exposición

Multivariable → exposición + confusores

En epidemiología, casi siempre usamos multivariable

Para evitar confusión

New cards

Collider

Un collider es una variable que:

recibe flechas de dos variables
no causa la exposición ni el outcome
no es un confusor
NO debe ajustarse

Qué pasa si ajustas por un collider?

Creas una asociación falsa entre alcohol y hepatitis C, aunque no exista en la realidad.

Esto se llama collider bias o sesgo de selección.

Ejemplo intuitivo:

Si seleccionas solo personas con cáncer de hígado:

muchos tienen hepatitis C
muchos beben alcohol
pero dentro de ese grupo, parece que “si no tienes hepatitis C, entonces seguro bebes alcohol”
y viceversa👉 Ajustar por un collider crea una relación que no existe

New cards

Mediador

Un mediador:

es causado por la exposición
causa el outcome
explica parte del efecto real
NO debe ajustarse si quieres estimar el efecto total

Qué pasa si ajustas por un mediador?

Rompes la cadena causal.

Ejemplo:

Si ajustas por colesterol, estás diciendo:
- “Quiero saber el efecto de la comida rápida en el infarto, pero quitando el efecto que pasa por el colesterol.”

Eso elimina parte del efecto real.

👉 Ajustar por un mediador subestima el efecto total

New cards

Entonces qué es y que no es confusor?

Entonces, ¿qué NO es un confusor?

Un collider
- Recibe flechas
- Ajustarlo crea sesgo
- Ejemplo: cáncer de hígado en el DAG de arriba
Un mediador

Está en la cadena causal
Ajustarlo elimina parte del efecto real
Ejemplo: colesterol en el DAG de abajo

🎯 ¿Qué SÍ es un confusor?

Una variable que:

Afecta a la exposición
Afecta al outcome
No está en la cadena causal
No es un collider

Ejemplo clásico: tabaco en la relación alcohol → infarto.

No es confusor aquello que está en medio de la cadena causal (mediador) ni aquello que recibe flechas de exposición y outcome (collider). Ajustarlos introduce sesgo

New cards

Qué no es confusor?

La imagen te muestra dos casos clásicos: