miércoles, 28 de septiembre de 2011

ESTUDIAREMOS UN POCO DE

ESTADISTICA Sucesos y Probabilidades El espacio de los sucesos. Un experimento, en estadística, es cualquier proceso que proporciona datos, numéricos o no numéricos. Un conjunto cuyos elementos representan todos los posibles resultados de un experimento se llama espacio muestral y se representa como S. El espacio muestral de un experimento siempre existe y no es necesariamente único pues, dependiendo de nuestra valoración de los resultados, podemos construir diferentes espacios muestrales. Los elementos del espacio muestral se llaman puntos muestrales y son los distintos resultados del experimento. Si consideramos el conjunto de las partes de (P(S)) sus elementos son los sucesos. Un suceso, por tanto, es un subconjunto del espacio muestral. Existen dos tipos de sucesos: · Sucesos simples, que son aquellos que comprenden un sólo punto muestral. · Sucesos compuestos, que son los que engloban más de un punto del espacio muestral. Todo suceso compuesto se puede considerar como unión de puntos del espacio muestral o unión de sucesos simples. Azar, suceso aleatorio y probabilidad. El azar, en el lenguaje normal, se considera como la característica de un suceso imprevisible. En estadística esta definición se modifica añadiendo una propiedad adicional: El azar es la característica de un experimento que produce resultados diversos, impredecibles en cada situación concreta, pero cuyas frecuencias, a la larga, tienden a estabilizarse hacia un valor "límite" en el infinito. Como consecuencia, se definen los sucesos aleatorios como los resultados de un experimento cuya variación (la de los resultados) es debida al azar. La probabilidad de un suceso sólo se define para el caso de sucesos aleatorios. Hay varias formas de definir la probabilidad. En primer lugar podemos considerar la definición intuitiva que nos dice que la probabilidad de un suceso es la posibilidad de que éste ocurra. Esta primera definición no parece de gran utilidad por ser difícilmente cuantificable. También podemos considerar la definición clásica de probabilidad. En esta definición se empieza por considerar todos los resultados posibles de un experimento; después se contabilizan los resultados favorables a nuestro suceso, es decir, todos aquellos en que el experimento resulta en el suceso considerado; por último, suponiendo que existe simetría recíproca de todos los resultados, es decir, que todos los resultados posibles son igualmente posibles, se define la probabilidad como el número de casos favorables dividido por el número de casos posibles. Esta segunda definición presenta el inconveniente de que no siempre es posible saber cuantos son los resultados posibles de un experimento y no siempre todos los resultados posibles son igualmente probables. Por tanto, consideraremos la probabilidad definida de otra forma. Supongamos que realizamos muchas veces un experimento y vamos anotando el valor de la frecuencia relativa que, como sabemos, tiende a estabilizarse. Suponiendo que pudiéramos realizar el experimento infinitas veces, el valor de estabilización de las frecuencias en el infinito sería la probabilidad de los sucesos. Es decir, la probabilidad es el valor de la frecuencia relativa en el infinito. Es importante señalar, que este valor de estabilización no es un límite en el sentido matemático de la expresión pues, por ser un suceso aleatorio, nadie puede garantizar una ecuación matemática para el valor de la frecuencia relativa. Todo el cálculo de probabilidades y, con él, toda la estadística se basan en tres propiedades que se asignan a las probabilidades, que se llaman axiomas de Kolmogorov 1. La probabilidad de un suceso es siempre mayor o igual que cero y menor o igual que uno Si A es un suceso 2. La probabilidad del espacio muestral es igual a uno: Si S es el espacio muestral Es evidente, pues si realizamos un experimento siempre a de suceder alguna cosa. Esta propiedad se expresa como que la probabilidad de un suceso cierto es igual a uno. Si S tiene un único elemento ése es un suceso cierto. Como consecuencia, siguiendo el razonamiento anterior, la probabilidad de que no ocurra nada, lo cual es imposible, o en notación de conjuntos la probabilidad del conjunto vacío (F) es cero. P(F) = 0 Se llama suceso imposible a aquel cuya probabilidad vale cero. 3. Si A y B son sucesos mutuamente excluyentes, es decir, nunca ocurren simultáneamente (A Ç B = F) la probabilidad de su unión, es decir, de que ocurra uno u otro es la suma de sus probabilidades. P(A È B) = P(A) + P(B) Variables aleatorias Como dijimos, un experimento estadístico es cualquier proceso que proporciona datos. Para su utilización en estadística, estos datos tienen que despojarse de detalles accesorios para convertirse en descripciones numéricas del resultado; la utilización de clasificaciones cualitativas, restringe a la mera descripción las posibilidades de manejo estadístico. Estas descripciones numéricas son observaciones aleatorias. A las observaciones aleatorias se les considera como la expresión en cada caso concreto de una variable aleatoria que toma valores en los resultados del experimento. Así pues, una variable aleatoria es una función cuyos valores son números reales determinados por los elementos del espacio muestral, es decir, una variable aleatoria es una variable matemática cuyos valores posibles son las descripciones numéricas de todos los resultados posibles de un experimento estadístico. A los valores posibles de la variable aleatoria se les asigna una probabilidad que es la frecuencia del resultado al que corresponden. Se pueden distinguir distintos tipos de variables aleatorias según dos criterios de clasificación: 1. Variables cuantitativas que son las que resultan de experimentos cuyos resultados son directamente numéricos. 2. Variables cualitativas que son las que proceden de experimentos cuyos resultados expresan una cualidad no numérica que necesita ser cuantificada. Otra clasificación más operativa de las variables aleatorias sería: A. Variable discreta: Aquella que se define sobre un espacio muestral numerable, finito o infinito. Espacio numerable es aquel cuyos elementos se pueden ordenar, asignándoles a cada uno un número de la serie de los números naturales (del 1 al n ó del 1 al I). Todas las variables con un número finito de valores y todas las que tomen valores en números enteros o racionales (fraccionarios), son variables discretas. B. Variable continua: Es aquella que se define sobre un espacio asimilable al conjunto de los números reales, es decir, un espacio no numerable (o un espacio infinito de tipo C o infinito dos) En general, la regla de oro es que todas las variables que proceden de experimentos en los que se cuenta son discretas y todas las variables que proceden de experimentos en los que se mide son continuas. Variables aleatorias discretas Función de probabilidad Una variable aleatoria discreta toma cada uno de sus valores con una determinada probabilidad. Este método puede ser complicado, e incluso imposible, si los valores de la variable son muchos o infinitos. En algunos casos, existe una forma sistemática de aplicación de los valores de la probabilidad a los valores de la variable, de modo tal que se puede establecer una ecuación que ligue ambos. A esta ecuación se le llama función de probabilidad. Por tanto, la función de probabilidad de una variable aleatoria discreta X es una función tal que, al sustituir x por un valor de la variable, el valor que toma la función es la probabilidad de que la variable X asuma el valor x. Habitualmente, la función de probabilidad se representa como f(x). f(x) = P(X = x) Las funciones de probabilidad sólo se definen para los valores de la variable aleatoria y deben cumplir tres propiedades: P(X = x) = f(x) Por definición. Función de distribución La función de distribución F(x) de una variable aleatoria discreta X, con función de probabilidad f(x), es una función de la variable en la que al sustituir x por un valor, el valor de la función es la probabilidad de que la variable tome valores menores o iguales que dicho valor x. La función de distribución se define para todos los números reales, no sólo para los valores de la variable. Su máximo es siempre 1 pues cuando el valor que se sustituye es mayor o igual que el valor máximo de la variable, la probabilidad de que ésta tome valores menores o iguales que el sustituido es la probabilidad del espacio muestral. Normalmente, sus valores se dan de forma tabular. Supongamos, por ejemplo que los valores de la variable X sean x1, x2, x3,... , xn Variables aleatorias continuas Función de densidad Una variable aleatoria continua tiene la característica de tomar cada uno de sus valores con probabilidad infinitesimal, a efectos prácticos, 0. Por tanto, no se pueden expresar en forma tabular. Sin embargo, aunque no se pueden considerar probabilidades de valores concretos, puede calcularse la probabilidad de que la variable tome valores en determinados intervalos (los intervalos en cuestión pueden ser abiertos o cerrados, sin que se modifique la probabilidad total). P(a ≤ X ≤ b) = P(X = a) + P(a < X < b) + P(X = b) = P(a < X < b) Tal como ocurría en el caso de las variables discretas, cuando existe una asignación regular de probabilidad se puede definir una función que nos permita calcular probabilidades para cualquier intervalo de valores, a esta función se le llama función de densidad, f(x) La función de densidad de una variable aleatoria continua X es una función continua tal que su integral entre los extremos de un intervalo nos da el valor de la probabilidad de que X tome valores en ese intervalo. La representación gráfica de la función de densidad en un sistema de ejes cartesianos es la de una curva continua, construida de forma tal que la altura de la curva, sobre el eje de las X, en cada punto es el cociente entre el diferencial de la probabilidad en dicho punto y el diferencial de x. Esta construcción es una extensión por diferenciación del concepto de histograma. Como consecuencia, la integral de f(x) sobre todo el campo de variación de X es igual a 1. Es evidente que f(x) es siempre positiva pues si no lo fuera cabría la posibilidad de encontrar intervalos para los cuales la integral sería negativa y eso significaría probabilidad negativa, en abierta contradicción con la definición de probabilidad. La función de densidad siempre se define para todos los valores en el intervalo (-∞,∞) Esto no ofrece problemas si el campo de variación de X se extiende por todo el intervalo; si no fuera así, la función se define como igual a cero para todos los valores no incluidos en el campo de variación de X. La función de densidad debe cumplir tres condiciones análogas a las de la función de probabilidad: Función de distribución Para variables continuas también se define la función de distribución, de la siguiente manera: Las características de F(x) son iguales a las expuestas para el caso de las variables discretas, salvo que, obviamente, nunca se expresan en forma tabular. En general, cualquiera que sea el tipo de variable, las funciones de distribución nos pueden servir para calcular probabilidades. Por ejemplo, en el caso de las variables continuas: Dada su definición, resulta que, para variables continuas, la función de densidad es la derivada respecto a X de la función de distribución. Las funciones de distribución de las variables continuas más interesantes están tabuladas. Distribución conjunta de dos variables Cuando tenemos dos variables aleatorias X e Y, si queremos estudiarlas conjuntamente debemos establecer una relación que ligue los valores de una con los de la otra. Esta relación podrá ser lógica o no, útil o no, en cualquier caso, dadas dos variables cualesquiera y una relación que las ligue se puede pensar en realizar un estudio estadístico conjunto, es decir, aun cuando en la práctica sólo se utilicen variables unidas por nexos lógicos, desde un punto de vista puramente teórico, toda relación imaginable puede ser estudiada. Así pues, en una situación como esta, para variables discretas, se puede establecer una función de probabilidad para las posibles parejas de valores de ambas variables; a esta función se le llama función de probabilidad conjunta, f(x,y). Una función de probabilidad conjunta de las variables X e Y es una función de las dos variables tal que, al sustituir la x por un valor de la variable X y la y por un valor de la variable Y, el valor de la función nos da la probabilidad de que X e Y tomen simultáneamente esa pareja de valores anteriormente citados. Las propiedades que debe cumplir la función de probabilidad conjunta son: Donde X x Y es el producto cartesiano de X por Y, o sea, el conjunto de todos las parejas de valores x,y . Si X e Y son variables continuas, la función que se define es una función de densidad conjunta y es una función que al integrarla respecto de x e y sobre unos intervalos nos d la probabilidad de que la variable tome valores en esos intervalos. Variables aleatorias independientes Dos variables aleatorias X e Y, discretas o continuas cuyas funciones de probabilidad o densidad son g(x) y h(y), respectivamente, con función de probabilidad o densidad conjunta f(x , y), son estadísticamente independientes si y sólo si

No hay comentarios:

Padres eficaces

Al entrar en la enseñanza Secundaria hay una cierta relajación en la atención que los padres prestan a sus adolescentes. Nada más equivocado...