Qué es estadística inferencial

La estadística inferencial es la rama de las matemáticas aplicadas que permite sacar conclusiones sobre una población completa a partir del análisis de una muestra representativa. A diferencia de la estadística descriptiva, que se limita a resumir los datos disponibles (como calcular la media o la mediana), la inferencia busca generalizar los resultados, cuantificando el grado de incertidumbre inherente a todo proceso de medición.

Esta disciplina es fundamental en la ciencia moderna porque raras veces se puede medir cada elemento de un conjunto grande. Por ejemplo, para saber la eficacia de un nuevo medicamento, no se prueba en todos los pacientes del mundo, sino en un grupo seleccionado; la estadística inferencial determina si los resultados de ese grupo son suficientes para confiar en el tratamiento para el resto. Sin ella, la toma de decisiones basada en datos dependería más de la intuición que de la evidencia cuantitativa.

Definición y concepto

La estadística inferencial es la rama de las matemáticas aplicada que permite extraer conclusiones generales sobre un grupo completo de datos, conocido como población, basándose únicamente en la observación de una parte representativa de ese grupo, llamada muestra. A diferencia de la estadística descriptiva, que se limita a organizar, resumir y presentar los datos recolectados mediante tablas, gráficos o medidas de tendencia central, la inferencia busca ir más allá de los números inmediatos. Su propósito es predecir comportamientos futuros o establecer relaciones causales en un contexto más amplio que el estudiado directamente.

El núcleo de esta disciplina radica en la generalización. No es práctico medir cada elemento de una población grande; contar cada grano de arena en una playa o encuestar a cada elector antes de una elección resulta costoso y, a veces, casi imposible. La solución es seleccionar una subcolección, la muestra, y asumir que esta refleja las características esenciales del todo. Sin embargo, como toda generalización conlleva riesgo, la estadística inferencial introduce herramientas para cuantificar ese riesgo, estableciendo un margen de error controlado que indica con qué confianza podemos extender los resultados de la muestra a la población completa.

Diferencias con la estadística descriptiva

Es fundamental distinguir entre describir e inferir. La estadística descriptiva responde a la pregunta: "¿Qué muestran estos datos específicos?". Calcula la media aritmética, la desviación estándar o construye un histograma para resumir la información disponible. Sus resultados son ciertos para los datos analizados, pero no dicen nada sobre lo que ocurre fuera de ese conjunto. Por otro lado, la estadística inferencial responde a: "¿Qué significan estos datos para el resto del grupo?". Utiliza la información descriptiva de la muestra para hacer juicios sobre la población, introduciendo el concepto de probabilidad para medir la incertidumbre.

Dato curioso: El concepto moderno de muestra aleatoria simple debe mucho a la estadística agrícola. En el siglo XX, el genetista Ronald Fisher demostró que, para saber si un nuevo fertilizante mejoraba el rendimiento del trigo, no era necesario sembrar todo el campo con él, sino dividir el terreno en parcelas pequeñas y analizarlas. Este enfoque ahorró tiempo y dinero, sentando las bases de los ensayos clínicos actuales.

Población y muestra: los pilares de la inferencia

Para aplicar estos métodos, se deben definir con precisión dos conceptos estructurales. La población es el conjunto total de individuos, objetos o medidas que comparten una característica común y que nos interesan estudiar. Puede ser finita, como el número de estudiantes en una universidad en 2026, o infinita, como el conjunto de todas las monedas lanzadas al aire. La muestra es un subconjunto de la población, seleccionado mediante un procedimiento específico (a menudo aleatorio) para garantizar que cada elemento tenga una oportunidad conocida de ser elegido.

La calidad de la inferencia depende directamente de cómo se elige la muestra. Si la muestra está sesgada, es decir, no representa fielmente a la población, las conclusiones serán erróneas sin importar lo sofisticados que sean los cálculos. El objetivo final es estimar parámetros poblacionales, como la media poblacional (μ) o la proporción poblacional (p), utilizando estadísticos muestrales, como la media muestral (xˉ) o la proporción muestral (p^). La relación entre ambos se expresa a menudo mediante intervalos de confianza, que proporcionan un rango de valores plausibles para el parámetro desconocido.

La consecuencia es directa: sin una muestra bien definida, la inferencia se convierte en una conjetura informada. La precisión de las conclusiones no depende solo del tamaño de la muestra, sino de su representatividad y del método de selección utilizado. Esto permite a investigadores, economistas y científicos tomar decisiones basadas en evidencia cuantitativa, aceptando un nivel de incertidumbre medible en lugar de buscar una certeza absoluta a menudo inalcanzable.

Historia y evolución del método

La estadística inferencial no surgió de la nada, sino que evolucionó desde necesidades prácticas de medición. Sus raíces se remontan a la astronomía del siglo XVII, donde los astrónomos necesitaban distinguir entre el "ruido" de las mediciones y la posición real de los astros. Isaac Newton y James Bradley ya aplicaban métodos para reducir el error, pero fue en la demografía donde la inferencia ganó su primera gran victoria conceptual.

En 1710, el matemático John Arbuthnot analizó los registros de nacimientos en Londres durante 82 años consecutivos. Observó que, año tras año, nacían más hombres que mujeres. Para la época, esto parecía una mera coincidencia. Arbuthnot aplicó una prueba de hipótesis temprana, comparando los datos con una distribución binomial simple. Concluyó que la probabilidad de que ocurriera tan frecuentemente por pura suerte era menor que 1 en 256. Fue una de las primeras veces que se usó el azar para afirmar la existencia de una "causa ordenadora" (que luego se interpretó como la mano de Dios, pero el método era puramente estadístico).

Dato curioso: La prueba de Arbuthnot es tan antigua que muchos la consideran el abuelo de la prueba de hipótesis moderna, aunque él mismo no usaba el lenguaje matemático que usarían sus sucesores dos siglos después.

Durante el siglo XIX, la estadística se consolidó gracias a Adolphe Quetelet, quien introdujo la idea del "hombre promedio" y aplicó la distribución normal a casi todo, desde el tamaño del pecho de los soldados hasta la tasa de crímenes. Sin embargo, el método seguía siendo intuitivo y a menudo inconsistente. La verdadera revolución llegó con Ronald Fisher en la década de 1920. Fisher transformó la estadística de una colección de trucos en una ciencia rigurosa. Introdujo el método de la máxima verosimilitud y, lo más influyente, el valor p. Este valor cuantifica la fuerza de la evidencia contra una hipótesis nula. También desarrolló el análisis de la varianza (ANOVA), una herramienta esencial para comparar medias de varios grupos simultáneamente.

Fisher no trabajaba solo. En las décadas de 1930 y 1940, Jerzy Neyman y Egon Pearson colaboraron para estructurar la prueba de hipótesis clásica. Mientras Fisher se centraba en la significancia (el valor p), Neyman y Pearson introdujeron la distinción entre hipótesis nula y alternativa, y los conceptos de potencia estadística y errores de primer y segundo tipo. Su enfoque era más decisional: dado un conjunto de datos, ¿qué decisión es la más óptima para minimizar el error a largo plazo?

Esta evolución marcó el paso de la estadística como una herramienta auxiliar de la astronomía y la demografía a la columna vertebral de la ciencia moderna. Hoy, desde los ensayos clínicos en farmacología hasta los A/B tests en la tecnología, los métodos desarrollados por estos tres pilares permiten extraer conclusiones generales a partir de muestras limitadas. La inferencia ya no es solo contar; es medir la incertidumbre.

¿Cuáles son los fundamentos matemáticos de la inferencia?

La inferencia estadística no flota en el vacío; se sustenta en pilares matemáticos que permiten pasar de lo particular a lo general con un grado de confianza cuantificable. El más importante de estos pilares es el Teorema del Límite Central. Este resultado demuestra que, al tomar muestras aleatorias de cualquier población, la distribución de las medias de esas muestras se aproxima a una distribución normal a medida que aumenta el tamaño de la muestra. Esto ocurre independientemente de la forma de la distribución original de la población. Si la población es sesgada, bimodal o incluso uniforme, la media de las muestras tenderá a formar una curva de campana. Esta propiedad es la que otorga poder predictivo a la estadística.

Dato curioso: Aunque el teorema lleva el nombre de varios matemáticos, fue el francés Siméon Denis Poisson quien, en 1810, lo enunció con una claridad notable, aunque su demostración rigurosa tardaría décadas en consolidarse.

Para entender la precisión de esta aproximación, debemos introducir el concepto de error estándar. Este no es simplemente el error de una sola medición, sino la desviación típica de la distribución de las medias muestrales. Indica cuánto varía la media de una muestra respecto a la media real de la población. La fórmula del error estándar de la media es:

SE=nσ

Donde σ es la desviación estándar de la población y n es el tamaño de la muestra. Observa que el error estándar disminuye a medida que n crece. Esto explica por qué las encuestas con miles de participantes suelen ser más precisas que las de cientos. La raíz cuadrada en el denominador actúa como un estabilizador natural de la variabilidad.

Distribuciones clave: Normal y t de Student

La distribución normal estándar es fundamental porque permite estandarizar cualquier dato. Al transformar las variables, podemos comparar resultados de diferentes escalas. Sin embargo, en la práctica, rara vez conocemos la desviación estándar de toda la población. Aquí entra en juego la distribución t de Student. Desarrollada por William Sealy Gosset bajo el seudónimo de "Student", esta distribución es más plana y tiene colas más pesadas que la normal. Esto compensa la incertidumbre adicional cuando se trabaja con muestras pequeñas (generalmente menores a 30 elementos). A medida que el tamaño de la muestra aumenta, la distribución t converge hacia la distribución normal estándar. Esta distinción es crucial para elegir la prueba estadística correcta y evitar errores de tipo I y II en el análisis de datos.

Métodos de estimación: por intervalos y puntuales

La estadística inferencial busca deducir propiedades de una población completa a partir de una muestra reducida. Para lograrlo, los estadísticos utilizan dos estrategias principales: la estimación puntual y la estimación por intervalo. Cada enfoque ofrece ventajas distintas dependiendo del nivel de precisión requerida y de la variabilidad de los datos.

Estimación puntual: un solo valor

La estimación puntual consiste en calcular un único número que sirve como mejor aproximación del parámetro poblacional desconocido. Si queremos saber la altura media de todos los estudiantes de una universidad y medimos a 100 alumnos, la media de esas 100 mediciones es la estimación puntual. Es directa y fácil de comunicar, pero tiene una debilidad inherente: raramente coincide exactamente con el valor real de la población. Siempre existe un margen de error, por pequeño que sea.

Estimación por intervalo: el rango de confianza

Para mitigar la incertidumbre de un solo número, la estimación por intervalo propone un rango de valores plausibles para el parámetro. En lugar de afirmar que la media es exactamente 1.75 metros, se establece que probablemente esté entre 1.70 y 1.80 metros. Este rango se denomina intervalo de confianza y se construye sumando y restando un margen de error a la estimación puntual. La fórmula general para la media poblacional, cuando la desviación estándar es conocida o la muestra es grande, es:

xˉ±znσ

Donde xˉ es la media muestral, z es el valor crítico correspondiente al nivel de confianza, σ es la desviación estándar y n es el tamaño de la muestra. Este enfoque reconoce explícitamente la variabilidad inherente al muestreo.

El significado real del nivel de confianza

Un concepto fundamental y a menudo malinterpretado es el nivel de confianza, habitualmente fijado en el 95% o el 99%. Este porcentaje no indica la probabilidad de que el parámetro específico esté dentro del intervalo calculado en una sola ocasión. Una vez calculado el intervalo, el parámetro está o no está en él; no hay probabilidad intermedia. El nivel de confianza se refiere a la frecuencia con la que el método acierta a largo plazo. Si tomáramos 100 muestras diferentes y construyéramos un intervalo de confianza al 95% para cada una, aproximadamente 95 de esos intervalos contendrían el verdadero parámetro poblacional. La consecuencia es directa: la confianza reside en el procedimiento, no en el resultado individual.

Dato curioso: La elección del 95% como estándar en muchas ciencias sociales y biológicas es en parte histórica, derivada de las tablas estadísticas de Fisher en el siglo XX, más que de una verdad matemática absoluta.

Un nivel de confianza mayor, como el 99%, produce un intervalo más ancho, ofreciendo mayor seguridad pero menor precisión. Por el contrario, un nivel del 90% genera un intervalo más estrecho pero con mayor riesgo de error. Los investigadores deben equilibrar estos factores según la importancia de la decisión que tome la muestra. La precisión no es gratis; siempre se paga con anchura del intervalo o con el tamaño de la muestra necesaria.

Prueba de hipótesis: el motor de la decisión estadística

La prueba de hipótesis es el procedimiento formal mediante el cual se toma una decisión sobre una población basándose en datos muestrales. El objetivo no es probar que algo es verdad con certeza absoluta, sino evaluar qué tan fuerte es la evidencia en contra de una suposición inicial. Este proceso estructura la incertidumbre y permite a los científicos y analistas cuantificar el riesgo de equivocarse al generalizar resultados.

Las hipótesis nula y alternativa

Todo el proceso comienza estableciendo dos afirmaciones mutuamente excluyentes sobre un parámetro poblacional, como la media o la proporción. La hipótesis nula, denotada como H0, representa el estado de "cosa no cambia" o la ausencia de efecto. Es la posición conservadora que se asume verdadera hasta que la evidencia demuestre lo contrario. Por ejemplo, en un nuevo fármaco, H0 podría ser que la media de la presión arterial de los pacientes no varía tras el tratamiento.

La hipótesis alternativa, H1 (o HaH0 es cierta, se rechaza la nula en favor de la alternativa. La estructura lógica es binaria: o se rechaza H0 o no hay suficiente evidencia para hacerlo.

El valor p y la toma de decisiones

Para cuantificar la evidencia, se calcula el valor p (p-value). Este número representa la probabilidad de obtener un resultado igual o más extremo que el observado en la muestra, asumiendo que la hipótesis nula es cierta. Un valor p bajo indica que los datos actuales serían poco probables si H0 fuera verdadera, lo que sugiere que la nula podría estar perdiendo su fuerza explicativa.

En la práctica científica, se compara el valor p con un nivel de significancia predefinido, comúnmente denotado como α (alfa), que suele fijarse en 0.05. La regla de decisión es directa:

Si p ≤ α: se rechaza la hipótesis nula. La evidencia estadística es considerada significativa.
Si p > α: no se rechaza la hipótesis nula. No hay evidencia suficiente para afirmar que existe un efecto.

Dato curioso: El umbral de 0.05 no es una ley de la naturaleza, sino una convención histórica propuesta por el estadístico Ronald Fisher a principios del siglo XX. En muchas disciplinas modernas, como la genómica, se están adoptando umbrales más estrictos para combatir la sobrecarga de datos.

Es crucial entender que "no rechazar" H0 no significa que sea cierta, solo que no hay pruebas suficientes para descartarla. La consecuencia es directa: la ausencia de evidencia no es evidencia de ausencia.

Errores tipo I y tipo II

Como toda decisión basada en muestras finitas, existe la posibilidad de equivocarse. Existen dos tipos fundamentales de errores en la prueba de hipótesis:

El error tipo I (falso positivo) ocurre cuando se rechaza la hipótesis nula siendo esta verdadera. Es como declarar culpable a un inocente. La probabilidad de cometer este error es igual al nivel de significancia α. En un ensayo clínico, esto significaría aprobar un fármaco efectivo cuando en realidad era un placebo.

El error tipo II (falso negativo) sucede cuando no se rechaza la hipótesis nula siendo esta falsa. Es como declarar inocente a un culpable. Su probabilidad se denota como β (beta). En el mismo contexto médico, significaría descartar un buen fármaco porque la muestra no fue lo suficientemente grande para detectar su efecto sutil. La potencia de la prueba, definida como 1 - β, mide la capacidad de detectar un efecto real.

Pruebas unilaterales y bilaterales

La dirección de la hipótesis alternativa determina si la prueba es unilateral o bilateral. En una prueba bilateral, la alternativa afirma simplemente que el parámetro es "diferente" del valor nulo (μ ≠ μ0). La región de rechazo se distribuye en ambas colas de la distribución de probabilidad. Se usa cuando nos interesa cualquier desviación, sin importar si es mayor o menor.

En una prueba unilateral, la alternativa especifica una dirección: "mayor que" (μ > μ0) o "menor que" (μ < μ0). La región de rechazo se concentra en una sola cola. Esto aumenta la potencia para detectar efectos en esa dirección específica, pero pierde sensibilidad en la dirección opuesta. Elegir entre ambas depende de la pregunta de investigación previa, no solo de los datos resultantes.

Ejemplo aplicado: Control de calidad

Consideremos una fábrica de envases que debe contener exactamente 500 ml de líquido. La hipótesis nula es que la media poblacional es 500 ml (H0: μ = 500). La alternativa es que la media es diferente (H1: μ ≠ 500), lo que sugiere un problema en la maquinaria.

Se toma una muestra de 30 envases y se calcula el estadístico de prueba. Si el valor p resultante es 0.03, y el nivel de significancia es 0.05, se rechaza H0

Prueba de hipótesis: el motor de la decisión estadística. Imagen: Heds 1 at English Wikipedia / Wikimedia Commons / Public domain

¿Qué diferencia la inferencia frecuentista de la bayesiana?

La estadística inferencial no es un bloque monolítico. Existen dos filosofías fundamentales para extraer conclusiones de los datos: el enfoque frecuentista y el bayesiano. Aunque ambos buscan reducir la incertidumbre, interpretan la palabra "probabilidad" de maneras radicalmente distintas. Esta diferencia conceptual determina cómo se diseñan los experimentos y cómo se leen los resultados en campos tan diversos como la biología o la inteligencia artificial.

El enfoque frecuentista: la frecuencia a largo plazo

La escuela clásica, o frecuentista, define la probabilidad como la frecuencia relativa con la que ocurre un evento si se repite el experimento un número infinito de veces. Si lanzas una moneda justa mil veces, esperas que salga cara unas 500 veces. Aquí, la probabilidad es objetiva y externa al observador. En este marco, los parámetros de la población (como la media μ) son valores fijos pero desconocidos. Los datos son lo que varía. La inferencia se basa en lo que pasaría con muchas muestras diferentes.

El enfoque bayesiano: la creencia actualizada

El enfoque bayesiano, en cambio, trata la probabilidad como un grado de creencia subjetiva sobre un evento. Esta creencia no es estática; se actualiza a medida que llega nueva evidencia. Esto se logra mediante el Teorema de Bayes, que combina lo que ya sabíamos (la distribución previa) con los datos observados para obtener una nueva estimación (la distribución posterior). En este modelo, los parámetros no son fijos, sino variables aleatorias que tienen su propia distribución de probabilidad.

Debate actual: ¿Es la probabilidad una propiedad del mundo físico o una medida de nuestro conocimiento? Los frecuentistas dirían lo primero; los bayesianos, lo segundo. Esta distinción filosófica tiene consecuencias prácticas enormes en cómo se toman decisiones bajo incertidumbre.

La elección entre ambos métodos no siempre es una cuestión de gusto, sino de recursos y objetivos. El enfoque frecuentista es a menudo más simple computacionalmente y ofrece propiedades de "muestra pequeña" muy claras, lo que lo hace ideal para ensayos clínicos tradicionales donde se necesita un consenso objetivo. Sin embargo, requiere recopilar grandes cantidades de datos para obtener precisión.

Por otro lado, el enfoque bayesiano permite incorporar conocimiento previo, lo que es invaluable cuando los datos son escasos o costosos. Además, su salida es más intuitiva para los tomadores de decisiones: en lugar de un intervalo de confianza que a menudo se malinterpreta, ofrece una distribución completa de la probabilidad del parámetro. Es por esto que gana terreno en la ciencia de datos moderna y el aprendizaje automático, donde los modelos se actualizan continuamente con nuevos flujos de datos.

Característica Enfoque Frecuentista Enfoque Bayesiano Definición de probabilidad Frecuencia a largo plazo de eventos repetibles. Grado de creencia o incertidumbre sobre un evento. Tratamiento de parámetros Valores fijos pero desconocidos. Variables aleatorias con distribución de probabilidad. Actualización de datos Se basa principalmente en los datos actuales de la muestra. Combina conocimiento previo (prior) con datos actuales. Complejidad computacional Generalmente menor; a menudo permite soluciones analíticas cerradas. Mayor; frecuentemente requiere métodos como la Verificación de Monte Carlo (MCMC).

Entender estas diferencias permite al estudiante elegir la herramienta adecuada. No se trata de que uno sea "verdadero" y el otro "falso", sino de que cada uno responde mejor a ciertos tipos de preguntas científicas. La tendencia actual en investigación aplicada es, de hecho, una hibridación: usar la flexibilidad bayesiana con la robustez de los datos frecuentes.

Aplicaciones prácticas en ciencia y economía

La estadística inferencial permite extrapolar conclusiones de una muestra limitada a una población completa. Este proceso es fundamental para tomar decisiones cuando la certeza absoluta es imposible de alcanzar. En 2026, su aplicación es transversal en sectores donde el costo del error define el éxito o el fracaso de una intervención.

Medicina y ensayos clínicos

La aprobación de nuevos fármacos depende de la capacidad de generalizar los resultados de un grupo de pacientes a toda la población objetivo. Los ensayos clínicos comparan grupos de tratamiento y control para determinar si una diferencia observada es estadísticamente significativa o producto del azar. Los reguladores sanitarios exigen que la probabilidad de error sea baja antes de lanzar un medicamento al mercado.

Economía y predicción macroeconómica

Los bancos centrales utilizan muestras representativas de hogares para estimar indicadores clave como la inflación y el desempleo. Estos datos guían las políticas monetarias que afectan a millones de personas. La precisión de estas estimaciones determina la eficacia de las medidas para estabilizar la economía ante shocks externos.

Dato curioso: El índice de precios al consumidor, una métrica económica vital, rara vez mide todos los productos de un país, sino que se basa en una muestra cuidadosamente seleccionada de miles de artículos.

Ingeniería y control de calidad

En las líneas de producción, es costoso medir cada unidad fabricada. El control de calidad utiliza muestreo para verificar si un lote cumple con las especificaciones técnicas. Si la muestra presenta una variabilidad superior al umbral aceptado, se puede ajustar el proceso antes de que el defecto se generalice, ahorrando recursos y tiempo.

Ciencias sociales y encuestas electorales

Las encuestas electorales predicen el comportamiento de votantes basándose en la opinión de cientos o miles de individuos. El margen de error indica el rango dentro del cual se espera que caiga el verdadero valor poblacional. La precisión de estas predicciones ha sido crucial para entender tendencias políticas y asignar recursos de campaña con mayor eficiencia.

La inferencia estadística transforma datos limitados en información accionable. Su valor reside en cuantificar la incertidumbre, permitiendo a los decisores actuar con base en evidencia más que en intuición pura.

Ejercicios resueltos

Ejercicio 1: Intervalo de confianza con distribución t de Student

Supongamos que un investigador mide el peso de 10 manzanas seleccionadas al azar de un huerto. Los datos son: 150, 155, 160, 145, 158, 162, 148, 152, 157 y 153 gramos. Queremos estimar el peso medio real de todas las manzanas del huerto con un 95% de confianza.

Primero, calculamos la media muestral (x̄) y la desviación estándar muestral (s). La suma de los pesos es 1540 g, por lo que la media es 154 g. Tras calcular las diferencias al cuadrado respecto a la media, obtenemos una desviación estándar aproximada de 5.54 g.

Al tener una muestra pequeña (n = 10), usamos la distribución t de Student. Los grados de libertad son n - 1 = 9. Para un nivel de confianza del 95%, el valor crítico t (con cola doble) es aproximadamente 2.262.

La fórmula del intervalo es:

xˉ±t⋅ns

Sustituimos los valores:

154±2.262⋅105.54

El error estándar es 5.54 dividido por la raíz cuadrada de 10, que es 1.75. Multiplicamos por el valor t: 2.262 * 1.75 ≈ 3.96. El intervalo queda entre 154 - 3.96 y 154 + 3.96. Es decir, de 150.04 a 157.96 gramos.

Interpretación: Estamos seguros al 95% de que el peso medio real de las manzanas está en ese rango. La precisión mejora si aumentamos la muestra.

Ejercicio 2: Prueba de hipótesis y valor p

Una fábrica afirma que sus baterías duran en promedio 100 horas. Un cliente duda de esto y toma una muestra de 25 baterías. Encuentra una media de 98 horas y una desviación estándar de 5 horas. ¿Hay evidencia estadística de que la duración media ha cambiado?

Planteamos las hipótesis. La hipótesis nula (H₀) es que la media poblacional (μ) es 100 horas. La hipótesis alternativa (H₁) es que la media es distinta de 100 horas.

Calculamos el estadístico t:

t=s/nxˉ−μ0

Sustituimos: (98 - 100) dividido por (5 / √25). El denominador es 5/5 = 1. El numerador es -2. Por lo tanto, t = -2.0.

Con 24 grados de libertad (25 - 1), consultamos la tabla t. Un valor de -2.0 corresponde a un valor p de aproximadamente 0.056. Como este valor es mayor que el nivel de significancia habitual de 0.05, no rechazamos la hipótesis nula.

Dato curioso: Si el valor p fuera exactamente 0.049, sí rechazaríamos la hipótesis. La línea entre "cambia" y "sigue igual" puede ser muy delgada en estadística.

Conclusión: Aunque la media de la muestra es menor, la diferencia no es estadísticamente significativa con el 95% de confianza. Podría deberse al azar. Se necesitaría una muestra más grande o una diferencia mayor para afirmar con seguridad que la batería ha cambiado.

Preguntas frecuentes

¿Cuál es la diferencia entre estadística descriptiva e inferencial?

La estadística descriptiva organiza y resume los datos de un conjunto específico (por ejemplo, "el promedio de notas de esta clase es 7.5"). La estadística inferencial usa esos datos para hacer predicciones o generalizaciones sobre un grupo más amplio (por ejemplo, "es probable que el promedio de notas de toda la universidad esté entre 7.2 y 7.8").

¿Qué es el margen de error en las encuestas?

Es un rango numérico que indica cuánto pueden diferir los resultados de una muestra de los resultados reales de toda la población. Si una encuesta dice que un candidato tiene el 50% de los votos con un margen de error del ±3%, significa que el apoyo real probablemente esté entre el 47% y el 53%.

¿Por qué se usa la distribución normal en la inferencia?

La distribución normal, o curva de campana, es fundamental debido al Teorema del Límite Central. Este teorema establece que, si tomamos muestras suficientemente grandes de casi cualquier población, las medias de esas muestras se distribuirán aproximadamente de forma normal, lo que facilita los cálculos de probabilidad.

¿Qué significa que un resultado sea "estadísticamente significativo"?

Significa que es poco probable que el resultado observado se deba únicamente al azar. En muchos estudios, si la probabilidad de que el efecto sea aleatorio es menor al 5% (valor-p < 0.05), se considera que hay evidencia suficiente para afirmar que el efecto existe en la población general.

¿Puede la estadística inferencial asegurar el 100% de certeza?

Rara vez. La inferencia trata con probabilidades. Incluso con una muestra perfecta, siempre existe una pequeña posibilidad de error (como el error tipo I o tipo II). La meta es reducir esa incertidumbre a un nivel aceptable para tomar decisiones informadas, no eliminarla por completo.

Resumen

La estadística inferencial transforma datos limitados en conocimiento generalizable mediante herramientas como la estimación por intervalos, la estimación puntual y las pruebas de hipótesis. Se sustenta en fundamentos matemáticos como la ley de los grandes números y el teorema del límite central, permitiendo cuantificar la incertidumbre.

Existen dos enfoques principales: el frecuentista, basado en la frecuencia de eventos a largo plazo, y el bayesiano, que actualiza la probabilidad según nueva evidencia. Sus aplicaciones abarcan desde la validación de fármacos en medicina hasta la predicción de tendencias en economía, siendo esencial para la toma de decisiones basada en evidencia en 2026.

Véase también

Lema de Schwarz Resta de vectores Qué son los logaritmos en matemáticas Qué es una ecuación y cómo se resuelve Ángulos suplementarios Geometría diferencial Definición de geometría plana Cálculo y análisis matemático