Introducción a la estadística 1

0

Logo revista

Nº 3. Junio 2013.

Formación Médica Acreditada

INTRODUCCIÓN A LA ESTADÍSTICA: ESTADÍSTICA DESCRIPTIVA Y DISTRIBUCIONES DE PROBABILIDAD

Información para realizar el curso y obtener la acreditación

Presentamos a continuación la primera entrega del curso “Introducción a la Estadística: Estadística descriptiva y distribuciones de probabilidad”. Se trata de un módulo de contenido teórico de los cuatro de que consta el curso. Para la realización de dicho curso y su consiguiente acreditación, será necesario inscribirse (mediante el documento adjunto) y realizar, además, los módulos prácticos y el cuestionario final, accesibles en la plataforma de formación de AMYTS para todos los alumnos inscritos en el curso. Cada módulo teórico, que irá apareciendo en las sucesivas entregas semanales de la e-revista del mes de junio, lleva su correspondiente ejercicio práctico.

Módulo 1: Introducción y conceptos básicos. Variables cualitativas.

Introducción

La Medicina es una actividad (“práctica”) que fundamenta su ejercicio en una serie de hechos biológicos y de comportamiento que se caracterizan por su variabilidad y complejidad, lo que genera un elevado nivel de incertidumbre. Precisa, al igual que otras áreas de conocimiento y de práctica profesional, de herramientas que la ayuden a enfrentar esas características, para poder ofrecer respuestas adecuadas a las necesidades sanitarias de los individuos.

Ése es, exactamente, el papel que cumple la Estadística, ser una herramienta adecuada para entender esa variabilidad y complejidad inherentes a muchas prácticas. Desde este punto de vista, la Estadística sería la ciencia que trata de extraer leyes de comportamiento ante sucesos en los que la variabilidad es una característica intrínseca. Dispone para ello de una serie de herramientas para clasificar, representar y resumir datos, en lo que llamaremos estadística descriptiva (objeto del presente curso), y para extraer conclusiones a partir de ellos (estadística inferencial, que será objeto de otro curso).

Un ejemplo (entre todos los que podríamos elegir) de la variabilidad de los datos con los que nos enfrentamos en la actividad médica es el de la evolución del peso de los niños. Cada niño tiene un proceso de crecimiento diferente, en el que influyen muchas circunstancias que conocemos o podemos llegar a conocer (estatura de los padres, peso al nacer, hábitos de la madre, alimentación…), pero que de alguna manera tenemos que estandarizar para poder detectar alteraciones en dicho proceso. Para algo tan básico como esto utilizamos herramientas estadísticas, que son las que nos facilitan la posibilidad de disponer de las famosas tablas de percentiles.

Conceptos básicos

Son varios los conceptos que debemos tomar en consideración:

  1. Individuo: es la fuente de los datos y, en general, el centro de nuestro interés; cada uno de los sujetos que sometemos a estudio o tenemos ante nosotros en consulta

  2. Población: es el conjunto de todos los individuos con alguna característica en común (lugar de residencia, padecer una enfermedad, etc) del que queremos conocer algún dato u obtener alguna conclusión. Llamamos parámetro al valor de una determinada característica en la población. Generalmente la población en su totalidad es inaccesible, y no podremos realizar una recogida de datos sobre toda ella.

  3. Muestra: es un subconjunto de la anterior, el grupo de individuos accesible y limitado del que obtenemos los datos que precisamos, con la intención de sacar conclusiones para la población y, con ello, válidos como referencia para cada individuo; las técnicas de muestreo y el cálculo de su tamaño, elemenots importantes para obtener una muestra adecuada, se estudiarán en otro capítulo. Los datos y operaciones que realizamos en la muestra se denominan estadísticos, y nos sirven para aproximarnos al valor real de los parámetros de la población.

  4. Variable: es una propiedad observable que presentan los individuos que queremos estudiar, y cuyo conocimiento nos interesa. Se encuentra en el mismo campo semántico que los términos carácter o característica, y podríamos entender que variable sería la forma matemática de conceptuar, recoger y utilizar los datos obtenidos del estudio de una característica en la población.

  5. Observación: cada uno de los datos recogidos en nuestro estudio de una característica.

En nuestro ejemplo, nos interesa seguir la evolución del peso (variable) de un niño (individuo), comparándolo con la evolución habitual de los niños de su entorno (población de referencia), obtenida a partir del análisis de los datos de edad y peso de una muestra que se considera representativa de esa población.

Vamos a ir precisando un poco más los conceptos utilizados, especialmente el de variable, que es nuclear para la Estadística.

Variables cualitativas

Las características (o caracteres, palabra intercambiable con la anterior) que queremos conocer, o variables, de los diferentes individuos pueden ser de distintos tipos. Son variables cualitativas aquéllas cuyos posibles valores se clasifican en categorías (las distintas cualidades o modalidades que presenta esa variable en la población), y que no pueden ser expresadas de forma cuantitativa. Por ejemplo, el color del pelo o la piel, el lugar de residencia, etc. Dichas categorías pueden estar, a su vez, agrupadas en clases, que han de ser excluyentes entre sí.

Estas variables también reciben el nombre de categóricas, y se pueden dividir en dos grandes grupos:

  • aquéllas en que las categorías no tienen una ordenación lógica, existen y nada más. El citado ejemplo del color del pelo es de este tipo, ya que entre los diferentes colores (categorías de la variable) no hay una gradación u ordenación de ningún tipo. A este tipo de variables se les conoce como variables nominales, y se las califica como dicotómicas o binarias si sólo tienen dos categorías alternativas (como el sexo -hombre, mujer- o la presencia de determinadas características patológicas -sí, no-).

  • cuando sí existe una ordenación lógica entre las categorías, se denominan variables ordinales (también reciben el nombre de cuasi-cuantitativas). Puede ser ejemplo de ello la categorización del dolor en leve, moderado, intenso, o la del hábito de fumar como fumador y no fumador, cuando ya conocemos su relación con alguna patología y está clara la direccionalidad de esa relación. Incluso las escalas numéricas utilizadas para determinadas características, como las escalas de dolor, son de este tipo, pues los valores numéricos otorgados sólo pretenden clasificar, sin significar que el nivel 2 de la escala sea exactamente el doble del 1 o la mitad del 4 (que es lo característico de los números).

Presentación de los datos

El primer paso a realizar ante los datos obtenidos a partir de una muestra es el de clasificar, representar y resumirlos de una manera clara y comprensiva. Esta es la función de la llamada estadística descriptiva, que pasamos a desarrollar a continuación.

En el caso de las variables cualitativas, la presentación de los datos se basará en la frecuencia de aparición de cada una de sus categorías:

  • Frecuencia absoluta: número de casos de la categoría.

  • Frecuencia relativa: proporción, en tanto por uno, o porcentaje, en tanto por cien, que supone la categoría con respecto al total de casos.

 Con las distintas frecuencias, podremos elaborar la correspondiente tabla de frecuencias, en la que se recogerá la distribución de las frecuencias obtenidas para cada una de las categorías de la variable.

Tenemos otros dos conceptos relacionados con el de frecuencia, que también nos ayudan a presentar los datos de una variable cualitativa:

  • Tasa: proporción entre el número de casos incluidos en una categoría y el total de individuos de la población de referencia, generalmente en un período de tiempo determinado. Suele expresarse en refencia a una cifra “redonda” de población (unidad seguida de ceros), generalmente 1.000, 100.000 ó 1.000.000 de habitantes. Un ejemplo de ello es la incidencia de una determinada enfermedad.

  • Razón: cociente entre el número de casos de una determinada categoría y el de otra. Es importante darse cuenta de que aquí el numerador no está incluido en el denominador, a diferencia de lo que ocurre en el caso de las tasas. Ejemplo de ello son la razón varones / mujeres, o las famosas odds (razón entre casos favorables y casos desfavorables).

Representación gráfica

Además de la tabla de frecuencias, existen distintas formas de representar gráficamente la distribución de frecuencias de la variable. Así, podemos hacerlo de la siguiente manera:

  • Diagrama de barras: diagrama cartesiano con las categorías en uno de los ejes de coordenadas, generalmente el de abscisas, en el que se representa la frecuencia de cada una de ellas mediante una barra cuya longitud es proporcional al número de casos; los valores de dicha frecuencia aparecen reflejados en el otro eje. Puede utilizarse un sólo diagrama para la presentación de frecuencias de las categorías de dos o más poblaciones, mediante la utilización de barras de diferentes colores.

IntrEst1 barras2

  • IntrEst1 sectores bDiagrama de sectores (“pastel”): se trata de un círculo que representa al conjunto de los casos, representándose la frecuencia de cada categoría mediante sectores proporcionales a la misma; en algunos casos, se puede destacar alguno de los sectores separándolo gráficamente del resto, como el caso de la imagen. Una variante muy conocida de los diagramas de sectores es la forma en que suelen ofrecerse los resultados electorales, en este caso con un semicírculo.

  • Pictogramas: las categorías se representan mediante dibujos referidos al tema de que se trate, con un tamaño proporcional a la frecuencia de cada categoría.

 

      Siguiente (Variables cuantitativas)
Compartir:

Deja una respuesta

¡Usamos cookies propias y de terceros para mejorar tu experiencia en esta web! Si sigues navegando, consientes y aceptas estas cookies en tu ordenador, móvil o tablet. Más información sobre las cookies y cómo cambiar su configuración en tu navegador aquí.

x