-si los datos son simétricos, la media, la mediana y la moda deberían ser aproximadamente las mismas (denominadas distribuciones normales)
-cuando no son simetricas, la MEDIANA es mejor medida de tendencia central porque la media es sensible a observaciones extremas (denominadas distribuciones sesgadas)
Media
Nota:
-es el promedio
-se obtiene sumando todas las observaciones divididas en entre el total de elementos
-es sensible a valores extremos
-la media poblacional se denomina "mu" griega.
Mediana
Nota:
valor que se encuentra justo a la mitad de la distribucion poblacional o muestral
valor unico para una distribucion dada
si es impar, soncidera el valor que esta a la mitad
si es par, se considera el promedio de los valores que se encuentran a la mitad
no es sensible al valor de cada medicion, es robusta
Moda
Nota:
-observación que surge más a menudo
-si todos los valores son diferentes, no hay moda
-un conjunto de datos puede tener más de 1 moda
uni,bi, tri, multimodal
Medidas de dispersión
Nota:
resulta util saber donde se ubica el centro de los datos, esta infromacion normalñmente no es suficiente para caracterizar una distribucion entera de mediciones
caracterizan la variabilidad de los datos
varianza
Nota:
-cuantifica la variabilidad o dispersión alrededor de la media de las mediciones
cuando los valores se encuentran cerca de la media, la dispersión es menor
-las unidades se obtienen al cuadrado
desviación estandar
Nota:
es la raiz cuadrada de la varianza
rango o amplitud
Nota:
nos da una idea de la variabilidad
coeficiente de variación
Nota:
la desviacion estandar puede ser grande o pequela dependiendo del promedio de los datos
se simboliza como CV
el cociente de variacion nos da una medida de la dispersion relativa al promedio
posicion
Cuantiles
Nota:
son los valores que, al ordenar los datos por su magnitud dividen a la muestra en C partes iguales
si los datos se dividen en 100 partes iguales son percentiles, si ladivide en 3 terciles, 5 pentiles, 10 deciles, etc...
marca posiciones en las cuales puedes decir el porcentaje de la poblacion que se encuentra
el percentil K se define como el valor por debajo del cual estan el k porciento de los datos
si nk/100 es entero el percentil K de los datos es el promedio de la observacion numero y la nk/100+1
si nk/100 no es entero, el percentil K es la (j+1 ésima medicion, mas grande donde j es el entero menor más cercano a nk/100
sesgo
rango
agrupacion de datos
arbitrariamente
formula de Sturges
Nota:
donde k es el numero de intervalos de clase
n es el numero de valores en el conjunto de datos de observacion
raiz cuadrada de N
presentacion grafica
Histograma
grafico de caja
Inferencial
Unidad de análisis
Nota:
Elementos que conforman la población de estudio
Su definición varía de acuerdo al contexto del estudio
Epidemiología y estudios ecológicos
En necesario saber la unidad de análisis para el análisis estadistico
Variables
Nota:
Características que pueden variar en los sujetos incluidos en el estudio
Símbolo que puede tomar un conjunto de valores, llamado a su vez dominio
A cada elemento de la poblados in se le pueden estudiar diferentes características llamadas variables
Cuantitativa/numérica
Nota:
Ua magnitud natural que puede medirse ej pesó en kg, talla en cm.
De intervalo
Nota:
Inter va lo entré dos valores conocidos e igual para dos intervalos de la misma magnitud, aunque la escala carece de un punto cero verdadero
Ejemplo año cero
Temperatura
Calificaciones
De razón
Nota:
Es igual a la anterior y además tiene un punto cero verdadero
Ejemplo
Presión arterial
Alcohol emita
cualitativa/categorica
Nota:
Categorías, atributos que no puede ser sometidos a medición ej sexo, estado civil,
son proporciones
Nominal
Ordinal
Escalas de medición
Nominal
Nota:
Categorías mutuamente excluye tes y conjuntamente exhaustivas, sin orden
Si ya perteneces ja una categoría, no puedes pertenecer a otra
Ordinal
Nota:
Categorías que tienen algún un orden o jerarquía
Ej ni el socioeconómico
Severidad
En etapa de la vida
E útero
Neonato
Niñez
Adolescencia
Adultez
Senectud