ESTADÍSTICA DESCRIPTIVA (parte2)
#SLICEofDATA Tu porción diaria de Data Analytics en solo 15 minutos
Venimos de: ESTADÍSTICA DESCRIPTIVA (parte1)
En esta entrada vamos a analizar las distribuciones principales:
Distribución de Bernoulli
La distribución de Bernoulli es una distribución discreta con dos posibles valores:
• Éxito = 1
• Fallo = 0
Distribución Binomial
La distribución Binomial es una distribución discreta que cuenta el número de éxitos en una secuencia de n ensayos de Bernoulli independientes entre si y con una probabilidad de éxito fija [Media = np, Varianza = np(1-p)]
La distribución geométrica se utiliza para representar tiempos de espera y
se define como el número de experimentos Bernoulli necesarios hasta el
primer 1.La distribución binomial negativa también se utiliza para representar
tiempos de espera y se define como el número de experimentos Bernoulli
necesarios hasta un cierto número de 1’s.
Distribución de Poisson
La distribución de Poisson es una distribución discreta que, a partir de una frecuencia de ocurrencia media, calcula la probabilidad de que ocurra un determinado número de eventos durante cierto período de tiempo (probabilidad de ocurrencia de sucesos con probabilidades muy pequeñas, o sucesos "raros“) [media = varianza = lambda]
Ejemplo: número de entradas a una web
Distribución Exponencial
Dada una distribución de Poisson con un ratio de oportunidad lambda, la distribución exponencial calcula la probabilidad del tiempo de espera entre dos sucesos de éxito con [media = varianza = lambda]
Ejemplo: tiempo transcurrido entre diferentes entradas a una web
Distribución Gamma
Es una generalización de la exponencial donde en lugar de medir el tiempo transcurrido hasta el primer evento esperamos hasta el evento n.
Ejemplo:tiempo transcurrido hasta la entrada n-esima a una web
Distribución Normal
La distribución normal es la que mas aparece en sucesos reales, es una distribución de probabilidad continua.
Distribución X2k
La distribución ji-cuadrado es una distribución continua con una variable k que representa los grados de libertad de la variable aleatoria.
[media = k, varianza = 2k], se acerca a una normal si k>5
Distribución t Student
La distribución t-student surge de la necesidad de estimar la media y la varianza de una población normal cuando la muestra es pequeña
[media = 0; si v>1, varianza = v/(v-2) ; si v>2]
Distribución F-Snedecor
La distribución F-Snedecor surge de dos variables independientes con distribución X2 y con grados de libertad n y m respectivamente.
Teorema Central del Límite
El Teorema Central del Límite (TCL) nos permite, bajo ciertas condiciones, usar la distribución normal para estudiar otras distribuciones más generales. Lo que nos indica es que ante experimentos muy grandes con diferentes causas que suman sus efectos, si lo que queremos estudiar es la suma de los efectos y no el detalle de cada uno de ellos, bajo ciertas condiciones el experimento se comportaría como una normal.
Transformación de var. Aleatorias
La tipificación de una
variable consiste en restar
la media y dividir por la
desviación típica.Box-Cox, para obtener una variable
lo mas simétrica posible.
Ref: Walpole, Roland; Myers, Raymond y Ye, Keying (2002). Probability and Statistics for Engineers and Scientists. Pearson Education.