Variables aleatorias discretas

Q: ¿Por qué se llama "discreta" a esta variable?

El término proviene de la palabra latina discretus, que significa "separado" o "distinto". Se llama así porque los valores que puede tomar la variable están separados entre sí; no existen valores intermedios entre dos puntos consecutivos del dominio, a diferencia de una línea continua donde los puntos están unidos.

Una variable aleatoria discreta es una función que asigna un valor numérico a cada resultado posible de un experimento aleatorio, donde el conjunto de valores posibles es finito o numerable. A diferencia de las variables continuas, que pueden tomar cualquier valor dentro de un intervalo, las variables discretas se caracterizan por tener "saltos" o huecos entre sus valores, lo que permite contarlos uno a uno.

Estas variables son fundamentales en la teoría de la probabilidad y la estadística porque permiten cuantificar fenómenos que, a primera vista, parecen categóricos. Al transformar resultados como "cara o cruz" o "éxito o fracaso" en números, se habilita el uso de herramientas matemáticas precisas para predecir comportamientos, calcular riesgos y analizar datos en campos tan diversos como la ingeniería, la economía y la ciencia de datos.

Definición y concepto

Una variable aleatoria discreta es una función que asigna un número real a cada resultado posible de un experimento aleatorio. A diferencia de las variables continuas, que pueden tomar cualquier valor dentro de un intervalo, las discretas toman valores aislados y separados. Esto significa que entre dos valores consecutivos no existe otro posible resultado. Piensa en el lanzamiento de un dado: los resultados son 1, 2, 3, 4, 5 o 6. No puede salir un 3.5 si no se divide la cara. Esta separación es la esencia de lo discreto.

El espacio muestral contable

La característica fundamental de estas variables radica en su espacio muestral. Un espacio muestral es el conjunto de todos los resultados posibles de un experimento. Para que una variable sea discreta, este conjunto debe ser contable. Ser contable significa que los elementos pueden ponerse en correspondencia uno a uno con los números naturales. Puede ser finito, como los seis resultados del dado, o infinito pero numerable, como los lanzamientos necesarios para obtener la primera cara al lanzar una moneda.

Este concepto de contabilidad permite enumerar los resultados. Si puedes listarlos como x1, x2, x3... hasta el infinito, la variable es discreta. Si necesitas medir con una regla y el valor puede ser 1.0001, 1.00001 o cualquier otro decimal, la variable es continua. La distinción no es solo teórica; determina cómo calculamos las probabilidades. En lo discreto, sumamos probabilidades de puntos individuales. En lo continuo, integramos sobre intervalos.

Notación estándar

En la teoría de la probabilidad, se utiliza una convención específica para distinguir la variable de sus valores. La letra mayúscula, generalmente X, representa la variable aleatoria como función. La letra minúscula correspondiente, x, representa un valor específico que esa variable puede tomar. Esta distinción es crucial para la claridad matemática.

Cuando escribimos X = 3, estamos diciendo que el resultado del experimento ha sido el valor 3. La probabilidad de que esto ocurra se denota como P(X = x). Para una variable discreta, la suma de las probabilidades de todos los valores posibles debe ser igual a uno. Esta propiedad se expresa mediante la fórmula de la función de masa de probabilidad:

i \sum P (X = x_{i}) = 1

Dato curioso: El uso de la letra X proviene de la estadística clásica, donde se utilizaba para representar la "incógnita" o el valor desconocido antes de realizar la medición. Esta convención se ha mantenido por más de un siglo.

Es importante notar que no todas las variables discretas son enteros. Aunque es lo más común, una variable discreta puede tomar valores como 0.5, 1.0, 1.5, siempre que estos estén separados por un "hueco" donde no hay otros valores posibles. Lo que define la discreción no es el tipo de número, sino la estructura del conjunto de valores posibles. Esta estructura permite el uso de tablas de distribución y gráficas de barras, herramientas esenciales para el análisis inicial de datos discretos.

¿Cómo se modela la probabilidad en variables discretas?. Imagen: Diacritica / Wikimedia Commons / CC BY-SA 3.0

¿Cómo se modela la probabilidad en variables discretas?

El modelado de variables aleatorias discretas se basa en asignar un peso numérico a cada posible resultado. Esta asignación no es arbitraria; sigue reglas estrictas que garantizan coherencia lógica. La herramienta principal para esto es la Función de Masa de Probabilidad (FMP), también conocida como PMF por sus siglas en inglés. La FMP define exactamente qué tan probable es que la variable tome un valor específico.

Propiedades fundamentales de la FMP

Toda función que pretenda describir una variable discreta debe cumplir tres condiciones matemáticas. Si falla en una, el modelo se quiebra. Primero, la probabilidad de cualquier resultado individual debe ser no negativa. No puede haber menos de cero posibilidades de que ocurra un evento. Segundo, la suma de las probabilidades de todos los resultados posibles debe ser exactamente uno. Esto refleja la certeza absoluta de que ocurrirá algo dentro del espacio muestral. Tercero, la probabilidad de un intervalo de valores se obtiene sumando las probabilidades individuales dentro de ese rango.

Dato curioso: La condición de que la suma sea uno es lo que diferencia a las variables discretas finitas de las infinitas, donde a veces se requiere el concepto de serie convergente para asegurar que el total no se desborde.

Ejemplo práctico: El dado justo

Considera un dado estándar de seis caras. La variable aleatoria X representa el número que sale al lanzarlo. Los valores posibles son {1, 2, 3, 4, 5, 6}. Como el dado es justo, cada cara tiene la misma oportunidad de aparecer. La FMP asigna 1/6 a cada uno de estos seis números. Para cualquier otro número, como el 7 o el 0, la probabilidad es 0. La suma de estas seis fracciones es 6/6, que equivale a 1. Este ejemplo ilustra la propiedad de normalización de manera directa.

La Función de Distribución Acumulada

Mientras la FMP mira un punto específico, la Función de Distribución Acumulada (FDA) mira hacia atrás. La FDA, denotada comúnmente como F(x), responde a la pregunta: ¿cuál es la probabilidad de que la variable sea menor o igual a x? Se calcula sumando las probabilidades de la FMP desde el primer valor posible hasta x. Esta función siempre es escalonada y no decreciente. Comienza en cero y termina en uno a medida que x avanza hacia el infinito.

La relación entre ambas funciones es fundamental para el cálculo de probabilidades en intervalos. La diferencia entre dos valores de la FDA nos da la probabilidad de que la variable caiga entre esos dos puntos. Esta propiedad convierte a la FDA en una herramienta poderosa para analizar rangos sin tener que sumar manualmente cada término de la FMP. La precisión en el uso de estas funciones evita errores comunes en el análisis estadístico básico.

Distribuciones discretas fundamentales

Las distribuciones discretas fundamentales modelan fenómenos donde el resultado es contable y depende de parámetros específicos. Cada una surge de un experimento aleatorio distinto, lo que determina su estructura matemática y su aplicación práctica.

Distribución de Bernoulli

Es el bloque básico de las discretas. Modela un único ensayo con dos resultados posibles: éxito (1) o fracaso (0). El parámetro es la probabilidad de éxito, denotada como $p$ . La función de masa de probabilidad asigna $p$ al 1 y $1 - p$ al 0. Su media es simplemente $p$ , y la varianza es $p (1 - p)$ .

Distribución Binomial

Surge al repetir $n$ veces un ensayo de Bernoulli, manteniendo la independencia entre ellos. Cuenta el número total de éxitos. El soporte abarca desde 0 hasta $n$ . La fórmula de la probabilidad de obtener exactamente $k$ éxitos es:

P (X = k) = (k n) p^{k} (1 - p)^{n - k}

La media es

n p

y la varianza

n p (1 - p)

. Es fundamental en control de calidad y encuestas.

Distribución Geométrica

Modela el número de ensayos necesarios para obtener el primer éxito en una secuencia de Bernoulli. El soporte comienza en 1 y va hasta el infinito. La probabilidad de que el primer éxito ocurra en el ensayo $k$ es:

P (X = k) = (1 - p)^{k - 1} p

La media es

1/ p

y la varianza

(1 - p) / p^{2}

. Se usa cuando interesa el "tiempo de espera" hasta el primer evento.

Distribución de Poisson

Describe el número de eventos que ocurren en un intervalo fijo de tiempo o espacio, con una tasa media constante $λ$ . Es útil cuando los eventos son raros pero el número de oportunidades es grande. La fórmula es:

P (X = k) = \frac{λ ^{k} e ^{- λ}}{k !}

Tanto la media como la varianza son iguales a

λ

. Aplica en tráfico de servidores o llegadas a una cola.

Distribución Hipergeométrica

Similar a la Binomial, pero los ensayos son sin reemplazo. Si sacas bolas de una urna y no las devuelves, las probabilidades cambian en cada paso. Los parámetros son el tamaño de la población $N$ , el número de éxitos en la población $K$ y el tamaño de la muestra $n$ . La media es $n \frac{K}{N}$ . Es clave en muestreo estadístico finito.

Dato curioso: La distribución de Poisson puede aproximarse a la Binomial cuando $n$ es muy grande y $p$ es muy pequeña, manteniendo $n p = λ$ . Esto simplifica cálculos complejos en ingeniería.

Tabla comparativa de distribuciones discretas

Distribución	Parámetros	Soporte	Media	Varianza
Bernoulli	$p$	${0, 1}$	$p$	$p (1 - p)$
Binomial	$n, p$	${0, \dots, n}$	$n p$	$n p (1 - p)$
Geométrica	$p$	${1, 2, \dots}$	$1/ p$	$(1 - p) / p^{2}$
Poisson	$λ$	${0, 1, \dots}$	$λ$	$λ$
Hipergeométrica	$N, K, n$	${0, \dots, n}$	$n \frac{K}{N}$	$n \frac{K}{N} (1 - \frac{K}{N}) \frac{N - n}{N - 1}$

La elección entre estas distribuciones depende de si los ensayos son independientes, si hay reemplazo y si se cuenta éxitos o tiempos de espera. Entender estas diferencias evita errores comunes en el modelado de datos discretos.

Medidas de tendencia central y dispersión

Las medidas de tendencia central y dispersión permiten resumir la distribución de probabilidad de una variable aleatoria discreta. Estas estadísticas no solo describen dónde se concentra la probabilidad, sino también qué tan extendida está. La esperanza matemática y la varianza son las dos herramientas fundamentales para este análisis.

Esperanza matemática: el valor esperado

La esperanza matemática, también conocida como media o valor esperado, representa el promedio ponderado de todos los valores posibles de la variable. No es necesariamente un valor que la variable tome con frecuencia, sino el resultado promedio si se repitiera el experimento un número infinito de veces.

Para una variable aleatoria discreta $X$ que toma valores $x_{i}$ con probabilidades $P (X = x_{i})$ , la esperanza se calcula sumando el producto de cada valor por su probabilidad. Si el conjunto de valores es finito o infinito numerable, la fórmula general es:

E [X] = i \sum x_{i} \cdot P (X = x_{i})

Esta suma debe converger para que la esperanza exista. En el caso de una moneda justa, donde $X = 1$ (cara) con probabilidad 0.5 y $X = 0$ (sello) con probabilidad 0.5, la esperanza es $1 \cdot 0.5 + 0 \cdot 0.5 = 0.5$ . Esto significa que, a largo plazo, el valor promedio por lanzamiento es medio punto.

Dato curioso: La paradoja de San Petersburgo demuestra que una variable puede tener una esperanza matemática infinita, aunque los pagos individuales sean finitos. Esto ocurre cuando la suma de los productos de valor por probabilidad crece sin límite.

Varianza y desviación estándar

La varianza mide la dispersión de los valores alrededor de la esperanza. Una varianza pequeña indica que los valores tienden a agruparse cerca de la media; una varianza grande indica que están más esparcidos. Se define como la esperanza del cuadrado de la desviación respecto a la media.

La fórmula de la varianza de $X$ , denotada como $V a r (X)$ o $σ^{2}$ , es:

V a r (X) = E [(X - E [X])^{2}] = i \sum (x_{i} - μ)^{2} \cdot P (X = x_{i})

Donde $μ = E [X]$ es la esperanza matemática. Calcular la varianza directamente puede ser laborioso. Una forma más práctica, derivada de las propiedades de la esperanza, es:

V a r (X) = E [X^{2}] - (E [X])^{2}

Esto significa que la varianza es igual a la esperanza del cuadrado menos el cuadrado de la esperanza. Para obtener una medida en las mismas unidades que la variable original, se toma la raíz cuadrada de la varianza, obteniendo la desviación estándar $σ$ .

Estas medidas son esenciales en estadística y probabilidad. La esperanza indica la tendencia central, mientras que la varianza cuantifica la incertidumbre. Juntas, proporcionan una visión completa de la distribución de una variable aleatoria discreta.

¿Qué diferencia a las variables discretas de las continuas?. Imagen: Diacritica / Wikimedia Commons / CC BY-SA 3.0

¿Qué diferencia a las variables discretas de las continuas?

La distinción entre variables aleatorias discretas y continuas no es solo un detalle técnico, sino la base para elegir las herramientas matemáticas correctas. La diferencia radica en la naturaleza del espacio muestral: qué valores puede tomar la variable y cómo se miden esos valores. Entender esta separación evita errores comunes en el cálculo de probabilidades y en la interpretación de datos reales.

Espacio muestral: Contable vs. Incontable

Una variable aleatoria discreta toma valores en un conjunto contable. Esto significa que sus posibles resultados pueden enumerarse uno a uno, como los números enteros. Piense en el lanzamiento de un dado: los resultados son 1, 2, 3, 4, 5 o 6. Aunque el conjunto sea infinito, como en la distribución de Poisson, sigue siendo "contable" porque existe una correspondencia uno a uno con los números naturales.

En cambio, una variable aleatoria continua toma valores en un intervalo de números reales. El espacio muestral es incontable. No se pueden listar todos los valores posibles entre 0 y 1 sin dejar huecos. La altura de una persona o el tiempo de espera en una cola son ejemplos clásicos. Entre cualquier dos valores, siempre hay infinitos otros posibles. Esta densidad cambia completamente cómo calculamos la probabilidad.

Cálculo de probabilidad: Suma vs. Integral

Para variables discretas, la probabilidad de un evento es la suma de las probabilidades de sus valores individuales. Si queremos saber la probabilidad de sacar un número par en un dado, sumamos P(2) + P(4) + P(6). La herramienta principal es la Función de Masa de Probabilidad (FMP), que asigna una probabilidad específica a cada punto.

Para variables continuas, la suma simple falla porque hay infinitos puntos. Aquí entra la Función de Densidad de Probabilidad (PDF). La probabilidad de que la variable caiga en un intervalo se calcula mediante una integral de la PDF sobre ese intervalo. No se suma punto a punto; se mide el área bajo la curva.

Dato curioso: La confusión entre suma e integral es el error más frecuente en estudiantes de primer año. Intentar sumar las probabilidades de cada segundo en una hora de espera lleva a un resultado infinito o cero, dependiendo del enfoque equivocado.

El mito de P(X=x) = 0

Un concepto contraintuitivo en las variables continuas es que la probabilidad de que la variable tome un valor exacto es cero. Esto no significa que el valor sea imposible, sino que es un punto sin "ancho" en una línea continua. La probabilidad se concentra en intervalos. Por ejemplo, la probabilidad de que una persona mida exactamente 1.75 metros es técnicamente cero; lo relevante es que mida entre 1.74 y 1.76 metros.

En variables discretas, P(X=x) puede ser mayor que cero. Un dado puede caer exactamente en 3. Esta diferencia es crucial al interpretar datos. Medir con precisión infinita es raro en la práctica, lo que hace que el modelo continuo sea una aproximación poderosa pero que requiere cuidado al definir los intervalos de interés.

La elección entre modelo discreto o continuo depende de la precisión de la medición y de la naturaleza del fenómeno. Un reloj digital muestra tiempo discreto; un reloj analógico, continuo. Ambos miden lo mismo, pero requieren matemáticas distintas para predecir su comportamiento.

Aplicaciones en investigación y ciencia de datos

Las variables aleatorias discretas no son solo abstracciones matemáticas; son herramientas fundamentales para cuantificar fenómenos donde el resultado se cuenta en unidades enteras. Su utilidad radica en la capacidad de modelar la incertidumbre mediante distribuciones específicas que capturan la esencia del proceso generador. Elegir la distribución adecuada no es un detalle menor; define la precisión de las predicciones en campos tan diversos como la genómica o la logística.

Modelado en biología y salud

En biología molecular, el conteo de mutaciones en una secuencia de ADN se modela frecuentemente con la distribución de Poisson. Esta elección se justifica cuando las mutaciones ocurren con una tasa media constante y de forma independiente a lo largo del tiempo o del espacio genómico. La fórmula de probabilidad es:

P (X = k) = \frac{λ ^{k} e ^{- λ}}{k !}

Donde λ representa el número esperado de eventos. Si un genoma de 3 billones de pares de bases presenta una tasa de error específica, esta distribución permite predecir la probabilidad de encontrar exactamente k mutaciones en una muestra. Esto es crucial para diferenciar el "ruido" genético de las variantes significativas en estudios de asociación.

Logística y economía: la teoría de colas

En economía y gestión de servicios, el número de clientes que llegan a un punto de venta en un intervalo de tiempo suele seguir una distribución de Poisson, mientras que el tiempo entre llegadas sigue una distribución exponencial. Sin embargo, si se analiza el número de éxitos en una serie de ensayos de Bernoulli (por ejemplo, cuántos de 100 clientes compran un producto), la distribución Binomial es la más precisa.

Dato curioso: La distribución de Poisson debe su nombre a Siméon Denis Poisson, quien la introdujo en 1837 para estudiar los juicios criminales en París, mucho antes de su aplicación masiva en la teoría de colas moderna.

La elección entre Binomial y Poisson depende del tamaño de la muestra. Cuando el número de ensayos es grande y la probabilidad de éxito es pequeña, la Binomial converge hacia la Poisson, simplificando los cálculos sin perder mucha precisión.

Control de calidad en ingeniería

En ingeniería, el control de calidad utiliza variables discretas para contar defectos por unidad de producto. Si se inspecciona una tela de 10 metros, el número de manchas puede modelarse con Poisson si los defectos aparecen aleatoriamente. En cambio, si se clasifica cada pieza como "bueno" o "defectuoso" en una línea de producción continua, la distribución Geométrica puede predecir cuántas piezas se necesitan revisar hasta encontrar el primer defecto.

La distribución Geométrica se define como:

P (X = k) = (1 - p)^{k - 1} p

Donde p es la probabilidad de éxito (encontrar un defecto) y k es el número de ensayos. Esta distinción es vital para optimizar el tiempo de inspección y reducir los costes operativos.

Ciencias sociales y encuestas

En ciencias sociales, las encuestas con respuestas categóricas (como "Sí/No" o escalas de Likert) generan datos discretos. El análisis de estos datos a menudo emplea la distribución Binomial para estimar proporciones poblacionales. Por ejemplo, si el 60% de los votantes prefieren al candidato A, la Binomial permite calcular la probabilidad de que, en una muestra de 50 personas, exactamente 30 voten por A.

La precisión de estas estimaciones depende directamente del tamaño de la muestra y de la varianza de la distribución subyacente. Ignorar la naturaleza discreta de los datos puede llevar a errores sistemáticos en la interpretación de tendencias sociales y políticas. La elección correcta de la distribución transforma datos crudos en evidencia estadística sólida.

Ejercicios resueltos

Ejemplo 1: Media y varianza de una distribución binomial

Consideremos un lanzamiento de moneda sesgada donde la cara sale con una probabilidad de 0.6. Si lanzamos la moneda 10 veces, queremos hallar la media y la varianza del número de caras. Este escenario sigue una distribución binomial con parámetros n = 10 y p = 0.6.

La fórmula para la media μ es el producto del número de ensayos por la probabilidad de éxito. Calculamos:

\mu = n \cdot p = 10 \cdot 0.6 = 6 \]\

Esperamos, en promedio, 6 caras. Para la varianza σ², multiplicamos la media por la probabilidad de fracaso q (que es 1 - 0.6 = 0.4):

\sigma^2 = n \cdot p \cdot (1 - p) = 10 \cdot 0.6 \cdot 0.4 = 2.4 \]\

La desviación estándar sería la raíz cuadrada de 2.4, aproximadamente 1.55. Esto indica la dispersión típica alrededor de la media.

Ejemplo 2: Predicción de eventos con Poisson

La distribución de Poisson es ideal para eventos raros en un intervalo fijo. Supongamos que una tienda recibe, en promedio, 3 clientes por hora. Queremos saber la probabilidad de que lleguen exactamente 2 clientes en una hora específica.

Usamos la función de masa de probabilidad con λ = 3 y k = 2. La fórmula es:

P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!} \]\

Sustituimos los valores:

P(X = 2) = \frac{3^2 \cdot e^{-3}}{2!} = \frac{9 \cdot 0.0498}{2} \approx 0.224 \]\

Hay un 22.4% de probabilidad. Este modelo asume que los llegadas son independientes entre sí.

Ejemplo 3: Probabilidad acumulada con la FDA

La Función de Distribución Acumulada (FDA) nos da la probabilidad de que la variable sea menor o igual a un valor x. Tomemos una variable discreta X con la siguiente distribución de probabilidad:

x	P(X=x)
1	0.2
2	0.5
3	0.3

Para calcular F(2), sumamos las probabilidades de todos los valores menores o iguales a 2:

F(2) = P(X \leq 2) = P(X=1) + P(X=2) \]\

El cálculo es directo:

F(2) = 0.2 + 0.5 = 0.7 \]\

Esto significa que hay un 70% de probabilidad de obtener un resultado de 2 o menos. La FDA siempre es una función no decreciente.

Dato curioso: La distribución de Poisson fue descubierta por Siméon Denis Poisson en 1837, inicialmente para analizar los datos de fallecimientos por suicidio en Prusia. Su aplicación va mucho más allá de la estadística básica.

Preguntas frecuentes

¿Cuál es la diferencia principal entre una variable discreta y una continua?

La diferencia radica en la naturaleza de sus valores posibles. Una variable discreta toma valores aislados que se pueden contar (como el número de hijos en una familia), mientras que una variable continua puede tomar cualquier valor dentro de un rango, incluyendo decimales infinitos (como la estatura o el tiempo), lo que implica que se mide en lugar de contarse.

¿Qué es la función de masa de probabilidad (FMP)?

La función de masa de probabilidad es una función que asigna a cada valor posible de una variable aleatoria discreta la probabilidad de que esa variable tome ese valor específico. A diferencia de la función de densidad en variables continuas, la suma de todas las probabilidades en la FMP debe ser exactamente igual a 1.

¿Por qué se llama "discreta" a esta variable?

El término proviene de la palabra latina discretus, que significa "separado" o "distinto". Se llama así porque los valores que puede tomar la variable están separados entre sí; no existen valores intermedios entre dos puntos consecutivos del dominio, a diferencia de una línea continua donde los puntos están unidos.

¿Es el tiempo una variable discreta o continua?

En rigor matemático, el tiempo es una variable continua porque puede dividirse en intervalos infinitamente pequeños (segundos, milisegundos, nanosegundos). Sin embargo, en aplicaciones prácticas como la estadística o la ciencia de datos, a menudo se trata como discreta al redondearlo a unidades específicas (por ejemplo, "el tiempo de espera fue de 5 minutos").

¿Qué distribución se usa cuando solo hay dos resultados posibles?

Cuando un experimento tiene solo dos resultados posibles (generalmente llamados "éxito" y "fracaso"), se utiliza la distribución de Bernoulli. Si se repite este experimento varias veces de forma independiente, se aplica la distribución binomial.

Resumen

Las variables aleatorias discretas son herramientas esenciales para modelar fenómenos contables mediante la asignación de valores numéricos a resultados aleatorios. Su análisis se basa en funciones de masa de probabilidad y distribuciones fundamentales como la binomial, la Poisson y la geométrica, que permiten calcular medidas de tendencia central y dispersión.

Comprender la distinción entre variables discretas y continuas es crucial para elegir los modelos estadísticos adecuados en investigación y ciencia de datos. Estas variables permiten transformar datos cualitativos en cuantitativos, facilitando la predicción y el análisis de riesgos en contextos reales, desde el control de calidad industrial hasta la evaluación de riesgos financieros.