Definición y concepto
La distribución binomial, también conocida como distribución binómica, es un concepto fundamental en la teoría de la probabilidad y la estadística. Se define como una distribución de probabilidad discreta que modela el número de éxitos obtenidos en una secuencia fija de ensayos independientes. Esta distribución es esencial para analizar fenómenos donde cada prueba tiene solo dos resultados posibles y la probabilidad de éxito permanece constante a lo largo del experimento.
Ensayos de Bernoulli
El fundamento de la distribución binomial reside en los ensayos de Bernoulli. Un experimento de Bernoulli se caracteriza por ser dicotómico, lo que significa que existen únicamente dos resultados mutuamente excluyentes. A uno de estos resultados se le denomina "éxito" y se le asigna una probabilidad de ocurrencia p. Al otro resultado se le llama "fracaso", con una probabilidad de 1-p. Es crucial que estos ensayos sean independientes entre sí, de modo que el resultado de un ensayo no influya en la probabilidad de éxito de los siguientes.
Parámetros y función de masa
La distribución binomial está completamente determinada por dos parámetros: n, que representa el número total de experimentos o ensayos, y p, que es la probabilidad fija de éxito en cada ensayo individual. La función de masa de probabilidad calcula la probabilidad de obtener exactamente k éxitos en n ensayos mediante la fórmula P(X=k) = C(n,k) * p^k * (1-p)^(n-k). En esta expresión, C(n,k) es el coeficiente binomial, que cuenta el número de formas distintas en que pueden ocurrir k éxitos dentro de la secuencia de n ensayos.
Muestreo con y sin reemplazo
La aplicación correcta de la distribución binomial depende de la independencia de los ensayos, lo cual se relaciona directamente con el método de muestreo. El muestreo con reemplazo garantiza que la probabilidad de éxito p se mantenga constante en cada ensayo, cumpliendo así con el requisito de independencia de los ensayos de Bernoulli. Por el contrario, en el muestreo sin reemplazo, la probabilidad de éxito cambia ligeramente con cada ensayo a medida que la población disminuye. Sin embargo, si el tamaño de la población es muy grande en comparación con el tamaño de la muestra, la distribución binomial puede servir como una aproximación válida incluso en el muestreo sin reemplazo, ya que el cambio en la probabilidad p resulta despreciable.
¿Cómo se calcula la probabilidad binomial?
Función de masa de probabilidad
La distribución binomial se define a través de su función de masa de probabilidad, que cuantifica la probabilidad de obtener exactamente k éxitos en una secuencia de n ensayos de Bernoulli independientes. Cada ensayo presenta dos resultados posibles: "éxito", con una probabilidad fija p, y "fracaso", con una probabilidad 1-p. La independencia entre los ensayos asegura que el resultado de uno no influya en los demás, manteniendo constante la probabilidad p a lo largo de la secuencia.
| Componente | Símbolo | Descripción |
|---|---|---|
| Fórmula general | P(X=k) |
Probabilidad de exactamente k éxitos |
| Coeficiente binomial | C(n,k) o (n k) |
Número de combinaciones posibles |
| Parámetro n | n |
Número total de ensayos de Bernoulli |
| Parámetro p | p |
Probabilidad de éxito en cada ensayo |
| Variable k | k |
Número de éxitos observados (0 ≤ k ≤ n) |
La expresión matemática es P(X=k) = C(n,k) * p^k * (1-p)^(n-k). El coeficiente binomial C(n,k) representa el número de formas distintas de seleccionar k éxitos entre n ensayos, calculado como n! / (k! * (n-k)!). Este término es fundamental porque considera todas las permutaciones posibles de los resultados que conducen a k éxitos y n-k fracasos.
Fórmula recursiva y función de distribución acumulada
Para el cálculo eficiente de las probabilidades, especialmente cuando n es grande, se utiliza una fórmula recursiva que relaciona la probabilidad de k éxitos con la de k-1 éxitos. Esta relación permite calcular la siguiente probabilidad basándose en la anterior, reduciendo la necesidad de recomputar factoriales completos en cada paso. La recursión facilita la construcción de tablas de probabilidad y la evaluación numérica en algoritmos estadísticos.
La función de distribución acumulada (FDA) proporciona la probabilidad de que la variable aleatoria tome un valor menor o igual a k. Se obtiene sumando las probabilidades individuales desde 0 hasta k. Esta función es esencial para determinar percentiles y calcular la probabilidad de rangos específicos de éxitos. La FDA conecta la distribución binomial con otras distribuciones discretas y continuas, sentando las bases para los teoremas límite que la relacionan con la distribución de Poisson y la distribución normal bajo ciertas condiciones asintóticas.
Ejercicios resueltos
Aquí tienes el contenido HTML para la sección solicitada, siguiendo estrictamente las reglas de estilo, formato y verificación de datos proporcionados.Ejercicio 1: Cálculo de probabilidad en lanzamientos de dado
Consideremos un experimento consistente en lanzar un dado equilibrado 51 veces. Definimos como "éxito" obtener un número par (2, 4 o 6) en cada lanzamiento. Dado que el dado tiene 6 caras, la probabilidad de éxito en un solo ensayo de Bernoulli es p = 3/6 = 0.5. Queremos calcular la probabilidad de obtener exactamente 20 éxitos en la secuencia de 51 ensayos independientes.
Aplicamos la función de masa de probabilidad de la distribución binomial:
P ( X = k ) = ( n k ) p k ( 1 − p ) n − kSustituimos los parámetros del problema: n = 51, k = 20 y p = 0.5.
El coeficiente binomial C(51, 20) se calcula como 51! / (20! * 31!). El resultado numérico aproximado es 1.277 x 10^14. La potencia de la probabilidad es 0.5^51 ≈ 4.44 x 10^-16. Multiplicando ambos términos:
La probabilidad de obtener exactamente 20 números pares en 51 lanzamientos es aproximadamente del 5.67%.
Ejercicio 2: Esperanza y varianza en control de calidad
En una línea de producción, la probabilidad de que un componente sea defectuoso es del 10% (p = 0.1). Si se seleccionan 50 componentes al azar (n = 50), determinemos la esperanza y la varianza del número de defectos, utilizando las propiedades estadísticas de la distribución binomial.
La esperanza matemática E[X] indica el número medio de éxitos esperados:
Se esperan en promedio 5 componentes defectuosos.
La varianza Var(X) mide la dispersión de los resultados:
La varianza es de 4.5, lo que implica una desviación estándar de √4.5 ≈ 2.12.
Propiedades estadísticas fundamentales
Las propiedades estadísticas fundamentales de la distribución binomial se derivan directamente de su definición como suma de variables aleatorias independientes e idénticamente distribuidas. Comprender estas propiedades es esencial para aplicar la distribución en inferencia estadística y modelado de datos discretos.
Cálculo de la esperanza matemática
La esperanza o media de una variable aleatoria binomial X con parámetros n y p se calcula mediante la definición general de esperanza para una distribución discreta. La fórmula básica implica sumar el producto de cada posible valor k por su probabilidad correspondiente:
E[X]=∑k=0nk·P(X=k)Sustituyendo la función de masa de probabilidad, obtenemos una expresión que puede simplificarse utilizando propiedades del coeficiente binomial y el teorema del binomio de Newton. Tras las operaciones algebraicas correspondientes, se demuestra que la esperanza es simplemente el producto del número de ensayos por la probabilidad de éxito:
E[X]=npEste resultado indica que el número esperado de éxitos en n ensayos es proporcional tanto a la cantidad de intentos como a la probabilidad individual de éxito.
Determinación de la varianza
La varianza mide la dispersión de los valores de X alrededor de la media. Para calcularla, se utiliza la relación estándar que vincula la varianza con los dos primeros momentos de la distribución. El cálculo requiere evaluar la suma de los cuadrados de los valores posibles ponderados por sus probabilidades.
Al aplicar las mismas técnicas algebraicas basadas en el teorema del binomio de Newton y las propiedades de las sumas, se obtiene que la varianza de la distribución binomial es:
Var(X)=np(1−p)Esta fórmula revela que la dispersión depende no solo de n y p, sino también del producto de la probabilidad de éxito y fracaso. La varianza alcanza su máximo cuando p es igual a 0.5, lo que indica mayor incertidumbre cuando los dos resultados posibles son igualmente probables.
¿Qué diferencia a la distribución binomial de otras leyes?
La distribución binomial se distingue de otras leyes de probabilidad por su capacidad para modelar conteos acumulativos en secuencias de ensayos independientes, diferenciándose claramente de la distribución de Bernoulli, que representa el caso particular de un solo ensayo. Mientras que la variable aleatoria de Bernoulli toma valores en el conjunto {0, 1}, la variable binomial X toma valores enteros en el rango [0,n], donde n es el número total de ensayos y p es la probabilidad fija de éxito. Esta relación fundamental permite entender la distribución binomial como la suma de n variables aleatorias de Bernoulli independientes e idénticamente distribuidas. Esta propiedad de aditividad es crucial: si X1 sigue una distribución binomial B(n1,p) y X2 sigue B(n2,p), entonces su suma X1+X2 sigue una distribución B(n1+n2,p), siempre que la probabilidad de éxito p permanezca constante entre ambos conjuntos de ensayos.
Aproximaciones mediante teoremas límite
Debido a la naturaleza discreta y a veces compleja del cálculo del coeficiente binomial para grandes valores de n, la distribución binomial se aproxima mediante otras distribuciones continuas o discretas bajo condiciones específicas. Estas aproximaciones facilitan el cálculo de probabilidades y la inferencia estadística, basándose en teoremas clásicos de la teoría de la probabilidad.
| Distribución de aproximación | Condiciones principales | Parámetros de la aproximación |
|---|---|---|
| Distribución de Poisson | El número de ensayos n es grande y la probabilidad de éxito p es pequeña (ensayos raros). Generalmente se requiere que n≥20 y p≤0.05, o que el producto np sea moderado. | El parámetro λ (lambda) de Poisson se estima como λ=np. |
| Distribución Normal (De Moivre-Laplace) | El número de ensayos n es grande y la probabilidad de éxito p no es extremadamente cercana a 0 o 1. Se requiere que tanto np como n(1−p) sean suficientemente grandes (comúnmente ≥5 o ≥10). | Media μ=np y varianza σ2=np(1−p). Se aplica una corrección de continuidad al pasar de lo discreto a lo continuo. |
La aproximación normal, conocida como el teorema de De Moivre-Laplace, es un caso particular del Teorema del Límite Central aplicado a la suma de variables de Bernoulli. Esta aproximación es particularmente útil cuando n es grande, ya que la forma de la distribución binomial se vuelve simétrica y campaniforme, especialmente cuando p=0.5. Por otro lado, la aproximación de Poisson es más adecuada cuando los éxitos son eventos raros en una gran cantidad de ensayos, lo que hace que la distribución binomial se vuelva asimétrica. La elección entre estas aproximaciones depende directamente de los valores de los parámetros n y p, así como de la precisión requerida en el cálculo de la función de masa de probabilidad.
Inferencia estadística y estimación de parámetros
La inferencia estadística para la distribución binomial permite estimar los parámetros desconocidos n y p a partir de datos observados. Dado que la distribución está definida por estos dos parámetros, los métodos de estimación varían según cuál de ellos se considera fijo o desconocido.
Estimación de máxima verosimilitud
El método de máxima verosimilitud (MLE) es uno de los enfoques más comunes para estimar la probabilidad de éxito p. Si se conoce el número de ensayos n y se observa un número k de éxitos, la función de verosimilitud se maximiza cuando el estimador p^ es igual a la proporción de éxitos observados. Específicamente, el estimador de máxima verosimilitud para p es p^=k/n. Este estimador es intuitivo porque refleja directamente la frecuencia relativa de los éxitos en la muestra. La propiedad de consistencia asegura que, a medida que n aumenta, p^ converge hacia el valor verdadero de p.
Estimación bayesiana y la regla de sucesión de Laplace
En el enfoque bayesiano, la probabilidad p se trata como una variable aleatoria con una distribución previa. Un caso clásico es asumir una distribución previa uniforme para p, lo que equivale a una distribución Beta(1, 1). Tras observar k éxitos en n ensayos, la distribución posterior de p sigue una distribución Beta(k+1, n−k+1). La media de esta distribución posterior proporciona el estimador de Bayes para p, dado por (k+1)/(n+2). Este resultado es conocido como la regla de sucesión de Laplace. Esta regla es particularmente útil cuando los datos son escasos, ya que evita que la probabilidad estimada sea exactamente 0 o 1, incorporando una ligera contracción hacia el valor medio de la distribución previa.
La regla de tres para sucesos raros
Cuando la probabilidad de éxito p es pequeña y se observan pocos éxitos, se utiliza la regla de tres para estimar un límite superior para p. Esta regla proporciona una aproximación rápida basada en la distribución de Poisson, que es una aproximación de la binomial cuando n es grande y p es pequeña. Si se observan k éxitos en n ensayos, el límite superior al 95% de confianza para p se aproxima por 3/n cuando k=0. Para un número general de éxitos k, la regla de tres se generaliza para proporcionar un intervalo de confianza que ayuda a cuantificar la incertidumbre en la estimación de p en situaciones de datos limitados o sucesos raros.
Aplicaciones prácticas y ejemplos intuitivos
Modelado de ensayos de Bernoulli
La aplicación más directa de la distribución binomial surge al analizar secuencias de ensayos de Bernoulli independientes. Un experimento de Bernoulli se caracteriza por ser dicotómico, esto es, solo dos resultados son posibles; a uno de estos se le denomina “éxito” y tiene una probabilidad de ocurrencia fija, y al otro se le denomina “fracaso”. La distribución binomial cuenta el número de éxitos en una secuencia de estos ensayos independientes entre sí con una probabilidad fija de ocurrencia de éxito entre los ensayos. Este modelo es fundamental porque permite cuantificar la variabilidad esperada en procesos repetitivos donde cada intento tiene las mismas condiciones iniciales.
Ejemplo clásico: Lanzamiento de moneda
Un ejemplo intuitivo es el lanzamiento de una moneda justa. Supongamos que lanzamos una moneda n veces. Cada lanzamiento es un ensayo de Bernoulli donde "salir cara" se considera un éxito con probabilidad p = 0.5 y "salir cruz" es un fracaso con probabilidad 1-p = 0.5. Si deseamos calcular la probabilidad de obtener exactamente k caras en n lanzamientos, aplicamos la función de masa de probabilidad: P(X=k)=(nk)pk(1-p)n-k. Esta fórmula utiliza el coeficiente binomial para contar las combinaciones posibles de éxitos y fracasos.
Visualización con árboles de probabilidad
Para visualizar estos ensayos, se utilizan árboles de probabilidad. Cada rama representa un resultado posible (éxito o fracaso) y está etiquetada con su respectiva probabilidad (p o 1-p). Al multiplicar las probabilidades a lo largo de las ramas que conducen a un mismo número de éxitos k, se obtiene la probabilidad de esa secuencia específica. La suma de las probabilidades de todas las secuencias que resultan en k éxitos da lugar al término C(n,k) * p^k * (1-p)^(n-k). Esta representación gráfica ayuda a comprender por qué el coeficiente binomial es necesario: cuenta cuántas rutas diferentes en el árbol conducen al mismo resultado final en términos de conteo de éxitos.