Introducción a la estadística 4

0

Logo revista

Nº 3. Junio 2013.

Formación Médica Acreditada

INTRODUCCIÓN A LA ESTADÍSTICA: ESTADÍSTICA DESCRIPTIVA Y DISTRIBUCIONES DE PROBABILIDAD

Información para realizar el curso y obtener la acreditación

Con la cuarta entrega del curso “Introducción a la Estadística: Estadística descriptiva y distribuciones de probabilidad”, recordamos a los alumnos matriculados en el mismo que deberán completar todos los módulos prácticos y el cuestionario final, accesibles en la plataforma de formación de AMYTS, para poder obtener la correspondiente acreditación. El período de inscripción ya se ha cerrado.

Módulo 4: Otras distribuciones de probabilidad.

Hemos visto, en el apartado anterior, que muchos fenómenos aleatorios tienen unas distribuciones de probabilidad que se ajustan a determinados modelos, cuyas características están descritas en formato matemático. Después de conocer la más famosa de todas ellas, la distribución normal, vamos a conocer algunas otras, válidas para entender otro tipo de sucesos y que son útiles también para el análisis de fenómenos que nos encontramos en la práctica clínica.

Para variables continuas

Distribución constante

Aquélla cuya probabilidad es constante a lo largo de todo el rango de valores.

Distribución logarítmico-normal

Se utiliza en el caso de muestras en las que los valores están muy desviados hacia la izquerda, generalmente próximos a 0, y en los que el logaritmo de los valores sí presenta una distribución normal centrada en la media.

Distribución exponencial

Equivalente continuo a la distribución geométrica que luego mencionaremos para las variables discontinuas, se encarga de mostrar la densidad de probabilidad del intervalo de tiempo necesario para que ocurra un suceso.

Distribución chi cuadrado (χ2)

Es la distribución que sigue la suma de varias variables independientes de distribución normal estandarizada (es decir, de media 0 y desviación estadística 1). Se utiliza mucho en inferencia estadística, a la hora de analizar relaciones entre variables cualitativas o de determinar el intervalo de confianza de una varianza.

Distribución t de Student

Distribución que sigue el cociente entre una variable normal y la raíz cuadrada de otra χ2, y que es muy útil para analizar la variabilidad que deriva de muestras demasiado  pequeñas. Para ello, es una distribución que cambia según el número de grados de libertad, es decir, de casos menos uno, al entender que, una vez conocida la media, “sobra” uno de los casos.

Para variables discretas

Distribución binomial

Para los casos en que la variable es dicotómica, es decir, con sólo dos posibilidades (sí o no, o similares). No es difícil transformar cualquier variable en dicotómica; por ejemplo, en el caso de la dislipemia que hemos utilizado en el tutorial anterior, la concentración de colesterol en sangre, que es una variable continua, puede convertirse en una variable discontinua o discreta resumiéndola en dos posibles situaciones en torno a un punto de corte; por ejemplo, diferenciando los individuos con colesterol inferior a 200, o igual o superior a ese valor, y ya podemos aproximarnos a ella mediante la distribución binomial.

Pero para una primera aproximación, vamos a plantearnos un caso muy sencillo, con importantes implicaciones académicas: el caso de los exámenes tipo test. Si nos proponen un examen tipo test con 15 preguntas de respuesta única a elegir entre cuatro alternativas, sin penalización por pregunta errada, y se pide acertar al menos 10 de esas preguntas (como es el caso del que se propondrá para la evaluación de este curso), ¿cuál es la probabilidad de aprobarlo tan sólo por azar?

En este caso, cada pregunta sólo puede tener dos resultados: o se acierta, y suma un punto, o se falla o deja sin contestar, y no suma puntos. Dado que hay cuatro respuestas probables en cada pregunta, la probabilidad de acertar por puro azar es de 0,25. Es claro que se trata de una probabilidad a priori, que no implica que siempre vayamos a responder acertadamente, por azar, el 25% de las preguntas.

Precisamente, la distribución binomial permite calcular la probabilidad de que un determinado resultado de los dos posibles se repita un número determinado de veces en un conjunto de n intentos. La función de probabilidad binomial B vendrá definida por ese número de intentos y por la probabilidad a priori de que ocurra el suceso elegido. Gráficamente, adopta una morfología de campana discontinua (recordemos que la variable es discreta), que nos ofrece la probabilidad de que obtengamos un número concreto de éxitos, y que estará centrada en el valor n x p, que es su esperanza, su valor más probable.

En nuestro caso, en el que tenemos 15 preguntas, se trata de calcular las posibilidades de acertar 10 o más de ellas. La función vendrá definida por los parámetros n=15 (las preguntas que vamos a responder) y p=0,25 (que es lo mismo que el porcentaje 25%). Gráficamente (utilizando la función DISTR.BIN de nuestra hoja de cálculo, con la que trabajaremos en el tutorial de esta semana, y representando gráficamente los resultados), la función tendría el siguiente aspecto:

 Est1 binomial

Como vemos, la distribución aparece centrada en un punto entre los valores 3 y 4 (0,25 x 15 = 3,75), y la posibilidad de obtener 10 o más respuestas acertadas por puro azar es casi despreciable. ¡Es necesario repasar el tema y tener claros los conceptos antes de afrontar la evaluación del curso!

Un ejemplo posible de su utilización clínica sería calcular la probabilidad de encontrar 3 o más éxitos terapéuticos en un grupo de diez pacientes tratados con una pauta cuya eficacia teórica conocemos. En el caso de que el número de experimentos sea muy elevado, y la probabilidad muy baja, se utilizará la distribución de Poisson o de los sucesos raros (ver abajo). Hay un caso especial, la distribución de Bernoulli, para la determinación de la probabilidad de un suceso concreto en un sólo experimento de una variable dicotómica.

Distribución binomial negativa

Se plantea una cuestión que podríamos calificar como “inversa” a la que nos acabamos de plantear, en el mismo caso de variables dicotómicas. Muestra la distribución de probabilidad del número de intentos necesarios para alcanzar un número determinado de éxitos (un suceso predeterminado) r en un determinado experimento. Se trata de una distribución definida por el número de éxitos buscados, r, y la probabilidad individual que tiene en cada intento, p, y está centrada en el valor esperado rq/p, siendo q la probabilidad del suceso complementario, y p la del suceso buscado (éxito). Un caso particular, en el que se busca la distribución de probabilidad del número de intentos necesarios para alcanzar el primer éxito, se denomina distribución geométrica.

Distribución de Poisson

Sirve para estimar la probabilidad de que, en un tiempo determinado, ocurran n éxitos en un experimento, y viene definida por el tiempo y por la frecuencia esperada de éxitos en ese tiempo; la distribución estará centrada en ese valor esperado. También sirve para aproximar una distribución binomial cuando el número de experimentos sea muy elevado (n>30 ó 100 según las fuentes) y la probabilidad del suceso individual muy baja (p<0,1 ó 0,01); en este caso, el valor esperado y la varianza coinciden, n x p.

Volviendo al caso de la dislipemia que hemos analizado en el tutorial nº 3, la distribución de probabilidad que reflejaría la posible aparición de eventos cardiovasculares en un grupo de 100 pacientes de nuestra población con niveles de colesterol inferiores a 160 (2% de probabilidad en 10 años según las tablas REGICOR) tendría la siguiente representación gráfica:

 Est1 Poisson

Si en un caso concreto, en nuestra población aparecen 6 o más muertos en los 10 años, tendremos que pensar que es muy poco probable que esto se deba al azar (ya que tiene una posibilidad de ocurrir inferior al 2%), y habrá que buscar otras posibles explicaciones. Pero es un tema de inferencia estadística, que no es objeto de estudio en este curso.

   Anterior (Variables cuantitativas)   Siguiente (Otras distribuciones de probabilidad)
Compartir:

Deja una respuesta

¡Usamos cookies propias y de terceros para mejorar tu experiencia en esta web! Si sigues navegando, consientes y aceptas estas cookies en tu ordenador, móvil o tablet. Más información sobre las cookies y cómo cambiar su configuración en tu navegador aquí.

x