Los datos pueden presentar
distintos tipos de características
mismas que definirán el tipo de
método de estudio.
Definiciones básicas.
Datos: Mediciones u observaciones que
recolectamos de un experimento o
fenómeno. Variables de respuesta:
Cada una de las características que son
susceptibles de ser cuantificadas y
registradas, de forma numérica o
categórica. Población: El conjunto total
de elementos que pueden ser
cuantificados de alguna manera. Esta
población puede ser finita o infinita.
Tipos de datos.
Datos cualitativos
o categóricos.
Cuando los resultados de la observación
denotan cualidades o atributos. Éstos se
podrán clasificar en un número de categorías o
clases que deberán ser excluyentes (una
observación no puede entrar en más de una
categoría) y exhaustivas (toda observación
deberá pertenecer a alguna clase).
Los datos cualitativos o
categóricos usan escalas
nominales y ordinales,
mientras que los datos
cuantitativos usan escalas de
intervalo o razón.
Datos
cuantitativos o
numéricos
Son aquellos derivados de un proceso de
conteo, llamados datos discretos, o de
medición, denominados datos continuos. Por
ejemplo, si nos preguntamos cuántos
documentos dentro de una base con 1000
documentos tendrán algún error de captura,
entonces nuestra variable de respuesta será
discreta, pudiendo tomar valores de 0, 1, 2,
…, 1000. En cambio, si nos preguntamos por
el salario que recibe un funcionario público,
la variable de respuesta será continua y
podría ser, por ejemplo, (2400,300000). En el
caso de los datos continuos, entre
cualesquiera dos valores observables,
podemos encontrar otro más.
Dependiendo el grado de precisión
de las variables en estudio, éstas
también pueden clasificarse de
acuerdo con su escala de medición.
Escala nominal.
Es aquella donde el valor de la variable no permite
establecer una relación de orden. Solamente
podemos decir si una observación pertenece o no a
una categoría; sin embargo, no es posible concluir si
una es mayor o menor, mejor o peor que otra. Por
ejemplo, Delegación en la que vive una persona
(Coyoacán, Tlalpan, Miguel Hidalgo, etc.).
Escala ordinal.
Además de agrupar a los valores en una
de las categorías, se puede establecer una
relación de orden entre las categorías del
tipo “mayor” o “menor”. Por ejemplo,
Nivel socioeconómico (bajo, medio o alto),
Satisfacción de servicio o producto
(insatisfecho, poco satisfecho, satisfecho,
muy satisfecho).
Escala de intervalo.
En este nivel además de saber si una
categoría es mayor o menor que
otra, podemos decir en qué
magnitud se da esta diferencia. Esta
categoría permite operaciones de
suma y resta. En este tipo de escala,
el valor “0” no implica ausencia de la
característica. Por ejemplo, en el
caso de medición de temperatura, el
cero no implica ausencia de
temperatura.
Escala de razón.
En esta escala, se permiten hacer
operaciones de producto o cociente para
la comparación de proporciones o
razones. En este caso, el valor “0” sí
implica ausencia de la característica. Por
ejemplo, salario mensual de una persona,
número de errores en un documento,
etcétera.
La Estadística Descriptiva trabaja bajo el
supuesto de que ya se cuenta con una
muestra extraída de la población de estudio.
Para obtener esta muestra, existen distintas
metodologías estadísticas que ayudan a
determinar el número de elementos que
deben seleccionarse de la población, así como
la forma de elegirlos.