Definición de estadística descriptiva

La estadística descriptiva es la rama de las ciencias de los datos que se encarga de recopilar, organizar, resumir y presentar información de manera significativa. A diferencia de la estadística inferencial, que busca generalizar resultados a una población mayor, esta disciplina se centra exclusivamente en caracterizar las propiedades de un conjunto de datos específico mediante medidas numéricas y representaciones gráficas.

Su función principal es transformar datos crudos en información comprensible, permitiendo identificar patrones, tendencias y valores atípicos sin necesidad de realizar complejos cálculos de probabilidad. Es la base fundamental para cualquier análisis de datos posterior, ya que ofrece una primera visión clara de la realidad estudiada, facilitando la toma de decisiones en campos tan diversos como la economía, la biología o las ciencias sociales.

Definición y concepto

La estadística descriptiva constituye la rama de las matemáticas aplicada que se encarga de organizar, resumir y presentar datos de manera significativa. Su función primordial no es adivinar el futuro, sino describir con precisión lo que ocurre en un conjunto de información específico. A diferencia de otros enfoques estadísticos, esta disciplina no busca generalizar resultados más allá de los datos observados; simplemente los caracteriza. Esto implica que cualquier conclusión extraída es válida estrictamente para el grupo analizado.

Diferencia con la estadística inferencial

Es fundamental distinguir este enfoque de la estadística inferencial, ya que ambos suelen confundirse en los inicios del estudio. Mientras la descriptiva se limita a lo visible, la inferencial utiliza una parte de los datos para sacar conclusiones sobre un todo mayor. La estadística descriptiva responde a preguntas como "¿cuál fue la media de las notas?" o "¿cuántos estudiantes aprobaron?". La inferencial, en cambio, pregunta "¿qué pasará con las notas del próximo año?" o "¿cuál es la probabilidad de que apruebe todo el alumnado?". La primera describe; la segunda predice o estima. Esta distinción es la base de todo análisis cuantitativo riguroso.

La consecuencia es directa: si solo tienes los datos completos de un grupo, usas estadística descriptiva. Si necesitas deducir algo sobre un grupo más grande basándote en una fracción, necesitas inferencia. No mezclar estos objetivos evita errores comunes en la interpretación de resultados académicos o empresariales.

Población y muestra

Para aplicar correctamente estas herramientas, se deben definir dos conceptos estructurales: la población y la muestra. La población estadística abarca a todos los individuos, objetos o mediciones que comparten una característica común y que interesan al investigador. Imagina que quieres estudiar las alturas de todos los estudiantes de secundaria de un país entero; ese conjunto total es la población. Es, a menudo, un número vasto y, en algunos casos, casi infinito.

La muestra es un subconjunto representativo extraído de esa población. En la práctica, medir a cada estudiante del país es costoso y lento, por lo que se seleccionan, por ejemplo, 500 alumnos de diversas escuelas. Aquí radica la diferencia clave: la estadística descriptiva puede aplicarse tanto a la muestra como a la población completa. Si describimos las alturas de esos 500 alumnos, estamos haciendo estadística descriptiva de la muestra. Si describimos las alturas de todos los alumnos del país (después de medirlos a todos), es estadística descriptiva de la población. La inferencia entra en juego cuando usamos los datos de los 500 para estimar la altura media de todo el país.

Dato curioso: El término "estadística" proviene de la palabra latina statisticum collegium (consejo de estado). Originalmente, los gobernantes usaban estos datos simplemente para saber cuántos hombres tenían para el ejército y cuántas tierras para cobrar impuestos. Era una descripción pura de los recursos del reino, sin muchas predicciones complejas al principio.

Entender esta distinción es vital porque los errores de interpretación suelen surgir cuando se tratan los datos de una muestra como si fueran la verdad absoluta de la población, sin aplicar las herramientas inferenciales adecuadas. La estadística descriptiva, por su parte, ofrece la claridad necesaria para ver los datos tal como son, sin sesgos de proyección prematura. Es el primer paso indispensable antes de cualquier análisis complejo.

¿Qué medidas de tendencia central existen?

Las medidas de tendencia central buscan resumir un conjunto de datos en un solo valor representativo. No todas funcionan igual ante diferentes distribuciones de datos. Elegir la adecuada depende de la naturaleza de los datos y de las posibles distorsiones que puedan existir en el conjunto.

La media aritmética

Es el promedio matemático más conocido. Se calcula sumando todos los valores del conjunto y dividiendo el resultado por la cantidad total de observaciones. Esta medida utiliza toda la información disponible, lo que la hace muy eficiente cuando los datos están relativamente bien distribuidos.

xˉ=n1i=1∑nxi

Donde xˉ representa la media, n es el tamaño de la muestra y xi son los valores individuales. La media es sensible a valores extremos. Un solo dato muy alto o muy bajo puede arrastrar el promedio, distorsionando la percepción de lo "típico" en el conjunto.

La mediana

La mediana es el valor que ocupa la posición central cuando los datos se ordenan de menor a mayor. No se ve afectada por valores extremos, lo que la convierte en una medida robusta. Si hay un número par de observaciones, la mediana es el promedio de los dos valores centrales.

Dato curioso: En salarios corporativos, la mediana suele ser más reveladora que la media. Si un director gana diez veces más que sus empleados, la media se dispara, pero la mediana refleja mejor lo que gana el trabajador "medio".

Esta propiedad hace que la mediana sea preferible en distribuciones asimétricas o cuando existen valores atípicos significativos. No requiere cálculos complejos, solo ordenamiento y localización posicional. Es especialmente útil cuando los datos tienen colas largas en una dirección.

La moda

La moda es el valor que aparece con mayor frecuencia en el conjunto de datos. Un conjunto puede tener una sola moda (unimodal), varias modas (bimodal o multimodal) o ninguna, si todos los valores aparecen el mismo número de veces.

A diferencia de la media y la mediana, la moda puede aplicarse a datos categóricos. Por ejemplo, en una encuesta sobre colores preferidos, la moda indica el color más elegido. No requiere orden ni cálculo numérico complejo. Sin embargo, puede ser poco informativa si la distribución es plana, con frecuencias muy similares entre los valores.

Cuándo usar cada medida

La elección depende del tipo de datos y de la presencia de valores atípicos. La media es ideal para datos simétricos sin extremos marcados. La mediana gana cuando hay asimetría o valores extremos que podrían distorsionar el promedio. La moda es la única opción para datos categóricos o cuando interesa saber qué valor es más frecuente, no cuál está en el centro.

En la práctica, muchas veces se usan dos o las tres medidas juntas para obtener una visión más completa. Ninguna cuenta toda la historia por sí sola. La combinación revela matices que una sola cifra podría ocultar.

¿Cómo se mide la dispersión de los datos?

Conocer el valor promedio de un conjunto de datos es útil, pero puede resultar engañoso si no se entiende cómo se distribuyen los valores individuales alrededor de ese promedio. La dispersión mide exactamente eso: qué tan alejados están los datos entre sí. Una medida de tendencia central sin una medida de dispersión es como saber que la temperatura media anual es de 20 grados, sin saber si hace 20 grados todos los días o si oscila entre -10 y 30 grados. La variabilidad es fundamental para interpretar la consistencia y la predictibilidad de los datos.

Rango: la medida más sencilla

El rango es la diferencia entre el valor máximo y el valor mínimo de un conjunto de datos. Es la medida de dispersión más intuitiva y fácil de calcular, aunque también es la más sensible a valores extremos o atípicos. Un solo dato muy alto o muy bajo puede inflar el rango, dando la sensación de que hay más variabilidad de la que realmente existe en la mayoría de los datos.

Se calcula restando el mínimo al máximo:

Rango=Xmaˊx−Xmıˊn

Esta simplicidad tiene un precio: el rango ignora todos los valores intermedios. Si dos conjuntos de datos tienen el mismo mínimo y máximo, tendrán el mismo rango, aunque la distribución interna sea completamente diferente.

Varianza: la distancia media al centro

La varianza cuantifica cuánto se alejan, en promedio, cada uno de los valores de la media aritmética. Para calcularla, se resta la media a cada dato, se eleva al cuadrado (para eliminar los signos negativos y dar más peso a las desviaciones grandes) y se promedian esos cuadrados. El resultado expresa la dispersión en unidades al cuadrado de la variable original, lo que a veces dificulta su interpretación directa.

Para una muestra completa, la fórmula de la varianza es:

s2=n−1∑i=1n(xi−xˉ)2

Donde n es el número de datos, xi es cada valor individual y x con barra es la media. Se divide por n menos uno para corregir la estimación cuando los datos son una muestra de una población mayor, aunque en contextos puramente descriptivos a veces se divide simplemente por n.

Desviación estándar: la medida más utilizada

La desviación estándar es la raíz cuadrada de la varianza. Al extraer la raíz cuadrada, se devuelve la medida a las unidades originales de los datos, lo que facilita su comparación con la media. Si los datos son estaturas en centímetros, la desviación estándar también estará en centímetros. Es la medida de dispersión más empleada en las ciencias porque resume la variabilidad de manera robusta y es compatible con muchas otras pruebas estadísticas.

La fórmula es:

s=n−1∑i=1n(xi−xˉ)2

Dato curioso: En muchas distribuciones comunes, como la curva en forma de campana, aproximadamente el 68% de los datos caen dentro de una desviación estándar de la media, y el 95% dentro de dos. Esto convierte a la desviación estándar en una herramienta poderosa para estimar dónde se encuentra la mayoría de los valores sin revisar cada uno.

La elección entre rango, varianza y desviación estándar depende de qué nivel de detalle se necesite. El rango ofrece una visión rápida pero superficial. La varianza es fundamental para cálculos estadísticos posteriores. La desviación estándar es la mejor opción para comunicar la dispersión de forma clara y comprensible. Ninguna de ellas es perfecta por sí sola; juntas ofrecen una imagen completa de cómo se comportan los datos.

Medidas de forma: asimetría y curtosis

Analizar la distribución de los datos no termina con conocer su promedio o su dispersión. La forma de la distribución revela patrones ocultos que las medidas anteriores a veces ocultan. La estadística descriptiva utiliza dos indicadores fundamentales para esto: la asimetría y la curtosis. Estas métricas permiten comparar la distribución observada con la distribución normal, aquella curva en forma de campana simétrica que sirve como referencia en muchos modelos estadísticos.

Asimetría o sesgo

La asimetría mide la falta de simetría de una distribución de frecuencias. Una distribución perfectamente simétrica tiene una asimetría igual a cero. Cuando los datos no son simétricos, la cola de la distribución se extiende más en un lado que en el otro. Esto indica dónde se encuentran los valores atípicos o extremos.

Si la cola se extiende hacia la derecha, hablamos de asimetría positiva o sesgo a la derecha. En este caso, la media es mayor que la mediana porque los valores altos tiran del promedio hacia arriba. Un ejemplo clásico es la distribución de ingresos en un país: la mayoría gana una cantidad moderada, pero unos pocos millonarios estiran la cola hacia la derecha. La consecuencia es directa: la media puede resultar engañosa si no se considera este sesgo.

Por el contrario, la asimetría negativa o sesgo a la izquierda ocurre cuando la cola se extiende hacia la izquierda. Aquí, la media es menor que la mediana. Esto sucede, por ejemplo, en la calificación de exámenes fáciles donde la mayoría obtiene notas altas y solo unos pocos obtienen notas bajas que arrastran la cola hacia el inicio de la escala.

Dato curioso: En finanzas, la asimetría es crucial para el inversor. Una distribución de rendimientos con asimetría positiva sugiere que, aunque haya caídas, las subidas pueden ser más grandes y menos frecuentes. Invertir sin mirar la asimetría es como mirar solo la media sin ver los extremos.

Curtosis

La curtosis mide la "pesadez" de las colas de la distribución en comparación con la distribución normal. No mide la altura del pico directamente, como se cree a menudo, sino la concentración de datos en las colas y el centro. Una distribución normal tiene una curtosis de tres (a veces se resta tres para obtener la "excesos de curtosis", quedando en cero).

Una distribución leptocúrtica tiene una curtosis mayor que la normal. Esto significa que tiene colas más pesadas y un pico más agudo. Los datos están más concentrados en la media, pero también hay más valores extremos en las colas. Es decir, hay más probabilidades de encontrar valores muy lejanos a la media de lo que se esperaría. El riesgo de "sorpresas" estadísticas es mayor.

Una distribución platycúrtica tiene una curtosis menor que la normal. Las colas son más ligeras y la distribución es más plana. Los datos están más uniformemente distribuidos alrededor de la media, y los valores extremos son menos frecuentes. La concentración de datos en el centro es menor que en la distribución normal estándar.

Entender estas dos medidas permite a los analistas elegir mejor las herramientas estadísticas. No todos los datos se comportan como una campana perfecta. Ignorar la asimetría o la curtosis puede llevar a errores significativos al interpretar la tendencia central o la dispersión de un conjunto de datos. La precisión en la descripción requiere mirar más allá del promedio.

Representación gráfica de datos

Los gráficos transforman los números en imágenes. Esta traducción visual permite detectar patrones y valores atípicos con mayor rapidez que al observar una tabla de datos crudos. En estadística descriptiva, cada gráfico cumple una función específica para resumir la información.

Tipos de gráficos y su aplicación

Los histogramas son ideales para variables continuas. Dividen los datos en intervalos de clase y muestran la frecuencia con barras contiguas. Esto revela la forma de la distribución, como si sea simétrica o sesgada. Los gráficos de barras funcionan de manera similar pero para variables categóricas. Las barras están separadas para destacar que las categorías son distintas entre sí, como colores o tipos de vehículos.

Los diagramas de caja, o box plots, condensan la información en cinco valores clave. Muestran la mediana, los cuartiles y los valores extremos. Son muy útiles para comparar la dispersión entre varios grupos al mismo tiempo. Los diagramas de dispersión colocan pares de datos en un plano cartesiano. Ayudan a visualizar la relación entre dos variables continuas, como la altura y el peso.

Gráfico	Variable principal	Uso típico
Histograma	Continua	Ver forma de distribución
Gráfico de barras	Categórica	Comparar frecuencias
Diagrama de caja	Continua	Analizar dispersión y atípicos
Diagrama de dispersión	Dos continuas	Observar relación entre variables

Dato curioso: Los diagramas de caja fueron popularizados por John Tukey en la década de 1970 para hacer el análisis exploratorio de datos más intuitivo.

Elegir el gráfico equivocado puede llevar a conclusiones erróneas. Usar un gráfico de barras para datos continuos oculta la naturaleza continua de la variable. La selección depende de qué característica del conjunto de datos se quiera destacar.

Historia y evolución del concepto

El desarrollo de la estadística descriptiva no surgió de la noche a la mañana, sino que fue una respuesta práctica a la necesidad de ordenar el caos de los datos. Antes de que existieran las fórmulas complejas, los gobernantes y científicos necesitaban saber cuántos habitantes tenían, cuántos nacían y cuántos morían para tomar decisiones informadas. Esta necesidad de cuantificación marcó el inicio de lo que hoy conocemos como el análisis de datos.

Un hito fundamental ocurrió en el siglo XVII con John Graunt, un mercader de Londres que se convirtió en un pionero demográfico. Graunt analizó las "Tablas de Mortalidad" de Londres, que registraban las causas de muerte semana a semana. Su trabajo fue revolucionario porque no se limitó a listar números; los agrupó y los comparó para encontrar patrones. Descubrió, por ejemplo, que la proporción de hombres y mujeres nacidos era relativamente constante y que las enfermedades afectaban a las poblaciones de manera predecible. Este enfoque de resumir grandes volúmenes de información en características clave es la esencia misma de la estadística descriptiva. La consecuencia de su trabajo fue que los datos dejaron de ser simples números aislados para convertirse en herramientas de predicción básica.

A medida que los datos aumentaban, la necesidad de clasificarlos también creció. Fue en este contexto donde Adolfo Cassel, un economista y estadístico alemán, introdujo el término específico de "estadística descriptiva" a finales del siglo XIX y principios del siglo XX. Cassel buscaba diferenciar el mero recuento de datos (la estadística descriptiva) del proceso más complejo de sacar conclusiones sobre una población completa a partir de una muestra (la estadística inferencial). Esta distinción fue crucial porque permitió a los académicos entender que describir un conjunto de datos era solo el primer paso, no el objetivo final. Sin embargo, la descripción sigue siendo la base sin la cual la inferencia sería una construcción sobre la arena.

De los cálculos manuales al software moderno

Durante gran parte del siglo XX, la estadística descriptiva dependía en gran medida de los cálculos manuales y de la calculadora mecánica. Calcular la desviación estándar de cien datos requería paciencia y precisión. Las medidas de tendencia central, como la media aritmética, se calculaban sumando todos los valores y dividiendo por el número total de observaciones. Este proceso, aunque sencillo en teoría, era propenso a errores humanos cuando los conjuntos de datos crecían.

Dato curioso: Antes de la era digital, las estadísticas nacionales de muchos países dependían de cientos de "estadísticos" que pasaban horas clasificando tarjetas perforadas. Un solo error de clasificación podía alterar la media de toda una región.

La llegada de las computadoras transformó radicalmente la disciplina. Lo que antes tomaba días, ahora se realiza en segundos. El software estadístico permite no solo calcular medidas de dispersión como la varianza o el rango con mayor precisión, sino también visualizar los datos de manera inmediata. Los gráficos de barras, los histogramas y los diagramas de dispersión se convirtieron en herramientas accesibles para cualquier estudiante o profesional. Esta evolución tecnológica no cambió las fórmulas fundamentales, pero sí amplió el alcance de lo que se podía describir. Hoy en día, la estadística descriptiva maneja millones de puntos de datos, permitiendo identificar tendencias que antes permanecían ocultas en la inmensidad de la información.

Ejercicios resueltos

La aplicación práctica es la mejor forma de consolidar los conceptos teóricos. A continuación, se presentan tres ejercicios resueltos que cubren las medidas de tendencia central, dispersión y la interpretación gráfica básica.

Cálculo de medidas de tendencia central

Supongamos que se registraron las calificaciones de cinco estudiantes en un examen breve: 7, 8, 8, 9 y 11. El objetivo es calcular la media, la mediana y la moda de este conjunto de datos.

La media aritmética se obtiene sumando todos los valores y dividiendo por el número total de observaciones.

xˉ=57+8+8+9+11=543=8.6

Para hallar la mediana, los datos deben estar ordenados de menor a mayor. En este caso, ya están ordenados. Como hay un número impar de datos (cinco), la mediana es el valor central.

El tercer valor en la secuencia es 8. Por lo tanto, la mediana es 8.

La moda es el valor que aparece con mayor frecuencia. En este conjunto, el número 8 aparece dos veces, mientras que los demás aparecen una sola vez. La moda es 8.

Cálculo de varianza y desviación estándar

Consideremos un conjunto de datos pequeño: 2, 4, 4, 4, 6. Primero, calculamos la media.

xˉ=52+4+4+4+6=520=4

La varianza mide cuánto se alejan los datos de la media. Se calcula como el promedio de las diferencias al cuadrado respecto a la media.

s2=5(2−4)2+(4−4)2+(4−4)2+(4−4)2+(6−4)2=54+0+0+0+4=58=1.6

La desviación estándar es la raíz cuadrada de la varianza. Nos da una medida de dispersión en las mismas unidades que los datos originales.

s=1.6≈1.26

Un valor bajo indica que los datos están agrupados cerca de la media.

Interpretación de un diagrama de caja

Un diagrama de caja resume cinco valores clave: mínimo, primer cuartil (Q1), mediana, tercer cuartil (Q3) y máximo. Estos elementos permiten visualizar la distribución y la dispersión de los datos rápidamente.

Dato curioso: Los diagramas de caja fueron popularizados por el estadístico John Tukey en la década de 1970, aunque sus raíces son anteriores. Son herramientas esenciales para detectar valores atípicos.

Imagina un diagrama donde el mínimo es 10, Q1 es 20, la mediana es 30, Q3 es 40 y el máximo es 50. La caja abarca del 20 al 40, lo que contiene el 50% central de los datos. El rango intercuartílico (Q3 - Q1) es de 20 unidades.

Si la mediana estuviera muy cerca de Q1, los datos estarían sesgados hacia la derecha. Si está centrada en la caja, la distribución es bastante simétrica. En este ejemplo, la simetría sugiere que los datos están distribuidos de manera equilibrada alrededor del valor central.

La interpretación correcta requiere observar no solo los valores, sino también la longitud de los bigotes y la posición de la mediana dentro de la caja. Esto revela patrones que un simple número puede ocultar.

Aplicaciones prácticas en diversas disciplinas

La estadística descriptiva trasciende el aula para convertirse en la herramienta fundamental para interpretar la realidad en múltiples campos. Su valor reside en transformar números crudos en información comprensible, permitiendo a los profesionales tomar decisiones informadas. Esta capacidad de síntesis es crucial cuando los datos son abundantes pero caóticos.

Uso en economía y gestión empresarial

En el ámbito económico, los indicadores descriptivos son esenciales para evaluar el estado de los mercados y la fuerza laboral. Por ejemplo, al analizar los salarios de una región, calcular la media aritmética ofrece una visión general del ingreso promedio. Sin embargo, la media puede ser engañosa si hay pocos ingresos extremadamente altos. En esos casos, la mediana resulta más representativa de lo que gana la mayoría de los trabajadores. Las empresas utilizan estas métricas para ajustar sus estrategias de precios y salarios, asegurando que sus ofertas sean competitivas. La consecuencia es directa: decisiones de contratación más precisas.

Aplicaciones en medicina y salud pública

La medicina depende de la estadística descriptiva para caracterizar a los pacientes y evaluar tratamientos. Los médicos analizan la edad, el peso y la presión arterial de los pacientes para establecer patrones de salud. Al calcular la media de la edad de los pacientes con una enfermedad específica, los especialistas pueden identificar si la condición afecta más a ciertos grupos etarios. Esto permite diseñar campañas de prevención dirigidas a la población más vulnerable. La precisión en estos cálculos salva vidas al optimizar los recursos sanitarios.

Sabías que: La estadística descriptiva fue una de las primeras ramas en desarrollarse, utilizada originalmente por los gobiernos para contar la población y los recursos disponibles para la guerra y los impuestos.

Importancia en la educación

En el sector educativo, los profesores emplean medidas de tendencia central y dispersión para evaluar el rendimiento de los estudiantes. Calcular la media de las notas de un examen indica el nivel general de comprensión del grupo. Sin embargo, observar la desviación estándar revela si las notas están agrupadas cerca de la media o si hay una gran variabilidad entre los alumnos. Esta información ayuda a los docentes a ajustar su método de enseñanza, identificando si la clase necesita más repaso o si algunos estudiantes requieren un desafío adicional. La evaluación basada en datos mejora la calidad de la instrucción.

Base para la toma de decisiones

La utilidad principal de la estadística descriptiva es su capacidad para resumir grandes volúmenes de información en indicadores clave. Estos indicadores permiten a los tomadores de decisiones identificar tendencias, detectar anomalías y comparar diferentes grupos. Sin esta herramienta, los datos seguirían siendo números aislados sin contexto. La claridad que aporta es indispensable en un mundo cada vez más saturado de información cuantitativa. Pero hay un matiz: describir los datos no explica por qué ocurren, solo muestra qué está pasando.

Preguntas frecuentes

¿Cuál es la diferencia entre estadística descriptiva e inferencial?

La estadística descriptiva resume y describe las características de un conjunto de datos específico (la muestra), utilizando medidas como la media o la desviación estándar. La estadística inferencial utiliza esos datos para hacer predicciones o sacar conclusiones sobre una población más amplia, introduciendo el factor de la probabilidad y el error muestral.

¿Qué es la media aritmética y cuándo se usa?

La media aritmética es la suma de todos los valores de un conjunto dividida por el número total de datos. Es la medida de tendencia central más común y se utiliza cuando los datos están distribuidos de forma relativamente simétrica y no hay valores extremos que distorsionen el resultado.

¿Por qué la desviación estándar es importante?

La desviación estándar mide cuánto se alejan los datos individuales de la media. Una desviación estándar baja indica que los datos están agrupados cerca del valor medio, mientras que una alta sugiere que los datos están más dispersos. Es fundamental para entender la variabilidad dentro de un conjunto de datos.

¿Qué indican la asimetría y la curtosis?

La asimetría describe la falta de simetría de una distribución de datos respecto a su media. La curtosis mide la "punta" o la concentración de datos en la cola de la distribución. Juntas, estas medidas de forma ayudan a entender si los datos siguen una distribución normal o si presentan sesgos y extremos significativos.

¿Qué gráficos son más adecuados para datos categóricos?

Para datos categóricos (como colores, marcas o géneros), los gráficos de barras y los diagramas circulares (o de pastel) son los más efectivos. Permiten comparar visualmente la frecuencia o proporción de cada categoría de manera clara e inmediata.

Resumen

La estadística descriptiva proporciona las herramientas esenciales para comprender conjuntos de datos mediante medidas de tendencia central (media, mediana, moda), dispersión (rango, varianza, desviación estándar) y forma (asimetría, curtosis). Estas métricas, complementadas con representaciones gráficas adecuadas, permiten resumir información compleja y extraer conclusiones preliminares sobre el comportamiento de los datos analizados.

El dominio de estos conceptos es fundamental en múltiples disciplinas, ya que sienta las bases para el análisis estadístico avanzado y la toma de decisiones basada en evidencia. Desde la investigación científica hasta la gestión empresarial, la capacidad de describir y visualizar datos correctamente es una habilidad crítica en el mundo actual.