COMENTARIO SOBRE LA PROBABILIDAD:
EN SI LA PROBABILIDAD ES LA QUE MIDE LA FRECUENCIA CON LA QUE APARECE UN RESULTADO EN UN MOMENTO DETERMINADO MAS QUE TODO CUANDO SE REALIZA O SE QUIERA REALIZAR UN EXPERIMENTO EN UN MOMENTO DETERMINADO.
COMENTARIO SOBRE SUCESO ELEMENTAL:
Un suceso se dice que es un suceso elemental si está formado por un único elemento del espacio muestral
si lanzamos un dado y si cae 1,2,3,4,5,o 6 a esos se le llama sucesos elementales.
COMENTARIO DE SUCESOS COMPUESTOS:
Suceso compuesto
Un suceso se dice que es un suceso compuesto si está formado por más de un elemento del espacio muestral.
4.- Entre los sucesos que has utilizado anteriormente indica cuál representa: a) El suceso seguro.
b) El suceso imposible.
c) Sucesos elementales.
b) Sucesos compuestos.
COMENTARIO ESPACIO MUESTRAL:
EN SI EL ESPACIO MUESTRAL ES TODAS LAS CANTIDADES DE POSIBLES RESPUESTAS.
COMENTARIO PERMUTACIONES:
EN SI LE LLAMASMOS PERMUTACIONES A LOS ARREGLOS DONDE IMPORTA EL ORDEN
COMENTARIO COMBINACIONES:
SE LE LLAMA ASI A LA UNION DE DOS COSAS EN UNA MISMA PERO ESTA ES TOTALMENTE LO CONTRARIO A LAS PERMUTACIONES PORQUE EN ELLAS NO IMPORTA LO QUE ES EL ORDEN OSEA EL ORDEN NO ALTERA EL RESULTADO.
PRINCIPIO FUNDAMENTAL DEL CONTEO:
ESTA COMPUESTO POR LO QUE SON LAS PERMUTACIONES Y COMBINACIONES
COMENTARIO SOBRE LA PROBABILIDAD:
ES LA CREACION ENTRE EL NUMERO DE RESULTADOS DE EXITO RESPECTO AL TOTAL DE RESULTADOS POSIBLES Y ESTA PUEDE SER SUBJETIVA U OBJETIVA.
COMENTARIO SUBJETIVA:
REFLEJA LA PERCEPCION DE QUIEN LA EMITE
COMENTARIO OBJETIVA: ES EL RESULTADO DE CALCULOS
COMENTARIO DE AXIOMAS:
ES LA COSTRUCCION DE CONOCIMIENTOS PROBABILISTICOS EN BASE A LA DEDUCCION
TIPOS DE AXIOMAS:
MUTUAMENTE EXCLUYENTES: SON AQUELLOS QUE NO PUEDEN OCURRIR AL MISMO TIEMPO
INDEPENDIENTES: SON LOS QUE NO SE VEN AFECTADOS POR OTROS OSEA QUE NO AFECTAN LOS OTROS SUCESOS
DEPENDIENTES: SON EVENTOS QUE AFECTAN LA PROBABILIDAD MATEMATICA DE OTRO
NO EXCLUYENTES: ESTOS IMPIDEN QUE LA OCURRENCIA DE OTRO
COMENTARIO DIAGRAMA DE ARBOL DE LA PROBABILIDAD:
EN SI ESTE ES UN TIPO DE GRAFICA EN EL CUAL REPRESENTA RESULTADOS POSIBLES DE UN DETERMINADO EVENTO
Esperanza matemática
En estadística la esperanza matemática (o simplemente esperanza) o valor esperado de una variable aleatoria es la suma del producto de la probabilidad de cada suceso por el valor de dicho suceso. Por ejemplo, en un juego de azar el valor esperado es el beneficio medio.
Si todos los sucesos son de igual probabilidad la esperanza es la media aritmética.
comentario esperanza matematica:
tiene por objeto calcular el promedio de ciertos resultado probabilisticos.
viernes, 26 de septiembre de 2008
comentarios.
COMENTARIO TEORIA DE CONJUNTOS:
EN SI LA TEORIA DE CONJUNTOS ES TODA LA SUBDIVICION DE CONJUNTOS COMO POR EJEMPLO LA UNION, INTERSECCION, DIFERENCIA ENTRE OTROS PERO EN SI TODOS ESTOS NECESITAN DE DOS O MAS CONJUNTOS CON CIERTA O DETERMINADA CANTIDAD DE ELEMENTOS.
COMENTARIO UNION DE CONJUNTOS:
EN SI SE LE LLAMA UNION DE CONJUNTOS A LA CREACION DE UN NUEVO CONJUNTO CON LOS ELEMENTOS DE DOS CONJUNTOS.
COMENTARIO INTERSECCION:
SE LE LLAMA ASI A LA CREACION DE UN NUEVO CONJUNTO PERO EN SI SEPARANDO LOS ELEMENTOS DISTINTOS DE DOS CONJUNTOS.
COMENTARIO DE DIFERENCIA:
LA DIFERENCIA EN SI ES CUANDO FORMAN UN CONJUNTO EN LA QUE NO SE ENCUENTRAN LOS ELEMENTOS DEL PRIMER CONJUNTO BASICAMENTE PODRIAMOS DECIR QUE SI TENEMOS EL CONJUNTO !!A!! Y FORMAMOS OTRO CONJUNTO PERO CON LOS ELEMENTOS DIFERENTES DE LA QUE SE ENCUENTRA EN EL PRIMER CONJUNTO DADO.
EN SI LA TEORIA DE CONJUNTOS ES TODA LA SUBDIVICION DE CONJUNTOS COMO POR EJEMPLO LA UNION, INTERSECCION, DIFERENCIA ENTRE OTROS PERO EN SI TODOS ESTOS NECESITAN DE DOS O MAS CONJUNTOS CON CIERTA O DETERMINADA CANTIDAD DE ELEMENTOS.
COMENTARIO UNION DE CONJUNTOS:
EN SI SE LE LLAMA UNION DE CONJUNTOS A LA CREACION DE UN NUEVO CONJUNTO CON LOS ELEMENTOS DE DOS CONJUNTOS.
COMENTARIO INTERSECCION:
SE LE LLAMA ASI A LA CREACION DE UN NUEVO CONJUNTO PERO EN SI SEPARANDO LOS ELEMENTOS DISTINTOS DE DOS CONJUNTOS.
COMENTARIO DE DIFERENCIA:
LA DIFERENCIA EN SI ES CUANDO FORMAN UN CONJUNTO EN LA QUE NO SE ENCUENTRAN LOS ELEMENTOS DEL PRIMER CONJUNTO BASICAMENTE PODRIAMOS DECIR QUE SI TENEMOS EL CONJUNTO !!A!! Y FORMAMOS OTRO CONJUNTO PERO CON LOS ELEMENTOS DIFERENTES DE LA QUE SE ENCUENTRA EN EL PRIMER CONJUNTO DADO.
sábado, 20 de septiembre de 2008
axiomas
Un axioma, en epistemología, es una "verdad evidente" que no requiere demostración, pues se justifica a sí misma, y sobre la cual se construye el resto de conocimientos por medio de la deducción; aunque, no todos los epistemólogos están de acuerdo con esta definición "clásica". El axioma gira siempre sobre sí mismo, mientras los postulados y conclusiones posteriores se deducen de este.
En matemática, un axioma no es necesariamente una verdad evidente, sino una expresión lógica utilizada en una deducción para llegar a una conclusión.
Contenido [ocultar]
1 Etimología
2 Lógica
2.1 Limitaciones
3 Matemáticas
3.1 Axiomas lógicos
3.2 Ejemplos
3.3 Axiomas no-lógicos
4 Véase también
5 Enlaces externos
Etimología [editar]La palabra axioma proviene del griego αξιωμα (axioma), que significa "lo que parece justo" o aquello que es considerado evidente y sin necesidad de demostración. La palabra viene del griego αξιοειν (axioein) que significa "valorar", que a su vez procede de αξιος (axios) que significa "valuable" o "digno". Entre los antiguos filósofos griegos, un axioma era aquello que parecía ser verdadero sin ninguna necesidad de prueba.
Lógica [editar]La lógica del axioma es partir de una premisa calificada verdadera por sí misma (el axioma) e inferir sobre esta otras proposiciones por medio del método deductivo, obteniendo conclusiones coherentes con el axioma. Los axiomas han de cumplir sólo un requisito: de ellos, y sólo de ellos, han de deducirse todas las demás proposiciones de la teoría dada.
Limitaciones [editar]Kurt Gödel demostró a mediados del siglo XX que los sistemas axiomáticos de cierta complejidad, por definidos y consistentes que sean, poseen serias limitaciones. En todo sistema de una cierta complejidad, siempre habrá una proposición P que sea verdadera, pero no demostrable. De hecho, Gödel prueba que, en cualquier sistema formal que incluya la aritmética, puede formarse una proposición P que afirme que este enunciado no es demostrable. Si se pudiera demostrar P, el sistema sería contradictorio: no sería consistente. Luego P no es demostrable y, por tanto, P es verdadero.
Matemáticas [editar]En lógica matemática, un axioma no es necesariamente una verdad evidente, sino una expresión lógica utilizada en una deducción para llegar a una conclusión. En matemática se distinguen dos tipos de axiomas: axiomas lógicos y axiomas no-lógicos.
Axiomas lógicos [editar]Éstas son ciertas fórmulas en un lenguaje que son universalmente válidas, esto es, fórmulas que son satisfechas por cualquier estructura y por cualquier función variable, en términos coloquiales, éstos son enunciados que son verdaderos en cualquier universo posible, bajo cualquier interpretación posible y con cualquier asignación de valores. Usualmente uno toma como axiomas lógicos un conjunto mínimo de tautologías que es suficiente para probar todas las tautologías en el lenguaje.
Ejemplos [editar]En el cálculo proposicional es común tomar como axiomas lógicos todas las fórmulas siguientes, donde , , y pueden ser cualquier fórmula en el lenguaje:
Cada uno de estos patrones es un esquema de axiomas, una regla para generar un número infinito de axiomas. Por ejemplo, si A, B, y C son variables proposicionales, entonces y son instancias del esquema 1 y por lo tanto son axiomas. Puede probarse que con solamente estos tres esquemas de axiomas y la regla de inferencia modus ponens, alguien puede probar todas las tautologías del cálculo proposicional, también puede probarse que ningún par de estos esquemas es suficiente para probar todas las tautologías utilizando modus ponens. Este conjunto de esquemas axiomáticos también es utilizado en el cálculo de predicados pero son necesarios más axiomas lógicos.
Ejemplo: Sea un lenguaje de primer orden. Para cada variable , la fórmula es universalmente valida.
Esto significa que, para cualquier símbolo variable , la fórmula puede considerarse un axioma. Para no caer en la vaguedad o en una serie infinita de "nociones primitivas", primeramente se necesita ya sea una idea de lo que queremos decir con o un definir un uso puramente formal y sintáctico del símbolo , y de hecho, la lógica matemática lo hace.
Ejemplo: Otro ejemplo interesante, es el de la instanciación universal. Para una fórmula en un lenguaje de primer orden , una variable y un término que es sustituible por en , la fórmula es válida universalmente.
En términos informales, este ejemplo nos permite afirmar que si conocemos que una cierta propiedad se cumple para toda y que si es un objeto particular en nuestra estructura, entonces deberíamos ser capaces de afirmar . De nuevo, estamos afirmando que la fórmula es válida, esto es, debemos ser capaces de dar una prueba de este hecho, o mejor dicho, una metaprueba. De hecho, estos ejemplos son metateoremas de nuestra teoría de la lógica matemática ya que nos referimos meramente al concepto de demostración en sí. Además de esto, también podemos tener una generalización existencial:
Esquema axiomático: Para una fórmula en un lenguaje de primer orden , una variable y un término que es sustituible por en , la es universalmente válida.
Axiomas no-lógicos [editar]Los Axiomas no-lógicos son fórmulas específicas de una teoría y se aceptan solamente por acuerdo. Razonando acerca de dos estructuras diferentes, por ejemplo, los números naturales y los números enteros puede involucrar a los mismos axiomas lógicos, sin embargo, los axiomas no-lógicos capturan lo que es especial acerca de una estructura en particular (o un conjunto de estructuras). Por lo tanto los axiomas no-lógicos, a diferencia de los axiomas lógicos, no son tautologías. Otro nombre para los axiomas no-lógicos es postulado.
Casi cualquier teoría matemática moderna se fundamenta en un conjunto de axiomas no-lógicos, se pensaba que en principio cualquier teoría puede ser axiomatizada y formalizada, posteriormente esto se demostró imposible.
En el discurso matemático a menudo se hace referencia a los axiomas no-lógicos simplemente como axiomas, esto no significa que sean verdaderos en un sentido absoluto. Por ejemplo en algunos grupos, una operación puede ser conmutativa y esto puede ser afirmado introduciendo un axioma adicional, pero aún sin la introducción de este axioma se puede desarrollar la teoría de grupos e incluso se puede tomar su negación como un axioma para estudiar los grupos no-conmutativos.
Un axioma es el elemento básico de un sistema de lógica formal y junto con las reglas de inferencia definen un sistema deductivo
En matemática, un axioma no es necesariamente una verdad evidente, sino una expresión lógica utilizada en una deducción para llegar a una conclusión.
Contenido [ocultar]
1 Etimología
2 Lógica
2.1 Limitaciones
3 Matemáticas
3.1 Axiomas lógicos
3.2 Ejemplos
3.3 Axiomas no-lógicos
4 Véase también
5 Enlaces externos
Etimología [editar]La palabra axioma proviene del griego αξιωμα (axioma), que significa "lo que parece justo" o aquello que es considerado evidente y sin necesidad de demostración. La palabra viene del griego αξιοειν (axioein) que significa "valorar", que a su vez procede de αξιος (axios) que significa "valuable" o "digno". Entre los antiguos filósofos griegos, un axioma era aquello que parecía ser verdadero sin ninguna necesidad de prueba.
Lógica [editar]La lógica del axioma es partir de una premisa calificada verdadera por sí misma (el axioma) e inferir sobre esta otras proposiciones por medio del método deductivo, obteniendo conclusiones coherentes con el axioma. Los axiomas han de cumplir sólo un requisito: de ellos, y sólo de ellos, han de deducirse todas las demás proposiciones de la teoría dada.
Limitaciones [editar]Kurt Gödel demostró a mediados del siglo XX que los sistemas axiomáticos de cierta complejidad, por definidos y consistentes que sean, poseen serias limitaciones. En todo sistema de una cierta complejidad, siempre habrá una proposición P que sea verdadera, pero no demostrable. De hecho, Gödel prueba que, en cualquier sistema formal que incluya la aritmética, puede formarse una proposición P que afirme que este enunciado no es demostrable. Si se pudiera demostrar P, el sistema sería contradictorio: no sería consistente. Luego P no es demostrable y, por tanto, P es verdadero.
Matemáticas [editar]En lógica matemática, un axioma no es necesariamente una verdad evidente, sino una expresión lógica utilizada en una deducción para llegar a una conclusión. En matemática se distinguen dos tipos de axiomas: axiomas lógicos y axiomas no-lógicos.
Axiomas lógicos [editar]Éstas son ciertas fórmulas en un lenguaje que son universalmente válidas, esto es, fórmulas que son satisfechas por cualquier estructura y por cualquier función variable, en términos coloquiales, éstos son enunciados que son verdaderos en cualquier universo posible, bajo cualquier interpretación posible y con cualquier asignación de valores. Usualmente uno toma como axiomas lógicos un conjunto mínimo de tautologías que es suficiente para probar todas las tautologías en el lenguaje.
Ejemplos [editar]En el cálculo proposicional es común tomar como axiomas lógicos todas las fórmulas siguientes, donde , , y pueden ser cualquier fórmula en el lenguaje:
Cada uno de estos patrones es un esquema de axiomas, una regla para generar un número infinito de axiomas. Por ejemplo, si A, B, y C son variables proposicionales, entonces y son instancias del esquema 1 y por lo tanto son axiomas. Puede probarse que con solamente estos tres esquemas de axiomas y la regla de inferencia modus ponens, alguien puede probar todas las tautologías del cálculo proposicional, también puede probarse que ningún par de estos esquemas es suficiente para probar todas las tautologías utilizando modus ponens. Este conjunto de esquemas axiomáticos también es utilizado en el cálculo de predicados pero son necesarios más axiomas lógicos.
Ejemplo: Sea un lenguaje de primer orden. Para cada variable , la fórmula es universalmente valida.
Esto significa que, para cualquier símbolo variable , la fórmula puede considerarse un axioma. Para no caer en la vaguedad o en una serie infinita de "nociones primitivas", primeramente se necesita ya sea una idea de lo que queremos decir con o un definir un uso puramente formal y sintáctico del símbolo , y de hecho, la lógica matemática lo hace.
Ejemplo: Otro ejemplo interesante, es el de la instanciación universal. Para una fórmula en un lenguaje de primer orden , una variable y un término que es sustituible por en , la fórmula es válida universalmente.
En términos informales, este ejemplo nos permite afirmar que si conocemos que una cierta propiedad se cumple para toda y que si es un objeto particular en nuestra estructura, entonces deberíamos ser capaces de afirmar . De nuevo, estamos afirmando que la fórmula es válida, esto es, debemos ser capaces de dar una prueba de este hecho, o mejor dicho, una metaprueba. De hecho, estos ejemplos son metateoremas de nuestra teoría de la lógica matemática ya que nos referimos meramente al concepto de demostración en sí. Además de esto, también podemos tener una generalización existencial:
Esquema axiomático: Para una fórmula en un lenguaje de primer orden , una variable y un término que es sustituible por en , la es universalmente válida.
Axiomas no-lógicos [editar]Los Axiomas no-lógicos son fórmulas específicas de una teoría y se aceptan solamente por acuerdo. Razonando acerca de dos estructuras diferentes, por ejemplo, los números naturales y los números enteros puede involucrar a los mismos axiomas lógicos, sin embargo, los axiomas no-lógicos capturan lo que es especial acerca de una estructura en particular (o un conjunto de estructuras). Por lo tanto los axiomas no-lógicos, a diferencia de los axiomas lógicos, no son tautologías. Otro nombre para los axiomas no-lógicos es postulado.
Casi cualquier teoría matemática moderna se fundamenta en un conjunto de axiomas no-lógicos, se pensaba que en principio cualquier teoría puede ser axiomatizada y formalizada, posteriormente esto se demostró imposible.
En el discurso matemático a menudo se hace referencia a los axiomas no-lógicos simplemente como axiomas, esto no significa que sean verdaderos en un sentido absoluto. Por ejemplo en algunos grupos, una operación puede ser conmutativa y esto puede ser afirmado introduciendo un axioma adicional, pero aún sin la introducción de este axioma se puede desarrollar la teoría de grupos e incluso se puede tomar su negación como un axioma para estudiar los grupos no-conmutativos.
Un axioma es el elemento básico de un sistema de lógica formal y junto con las reglas de inferencia definen un sistema deductivo
lunes, 18 de agosto de 2008
AXIOMAS
Los axiomas de probabilidad son las condiciones mínimas que deben verificarse para que una función que definimos sobre unos sucesos determine consistentemente valores de probabilidad sobre dichos sucesos.
La probabilidad P de un suceso E, denotada por P(E), se define con respecto a un "universo" o espacio muestral Ω, conjunto de todos los posibles sucesos elementales, tal que P verifique los Axiomas de Kolmogórov, enunciados por el matemático ruso de este nombre en 1933. En este sentido, el suceso E es, en términos matemáticos, un subconjunto de Ω.
Contenido [ocultar]
1 Axiomas de Kolmogórov
1.1 Primer axioma
1.2 Segundo axioma
1.3 Tercer axioma
1.4 Propiedades que se deducen de los axiomas
2 Véase también
3 Referencias
4 Enlaces externos
Axiomas de Kolmogórov [editar]Dado un conjunto de sucesos elementales, Ω, sobre el que se ha definida una σ-álgebra (léase sigma-algebra) σ de subconjuntos de Ω y una función P que asigna valores reales a los miembros de σ, a los que denominamos "sucesos", diremos que P es una probabilidad sobre (Ω,σ) si se cumplen los siguientes tres axiomas.
Primer axioma [editar]La probabilidad de un suceso A es un número real mayor o igual que 0.
La probabilidad de un suceso es un número positivo o nulo.
Segundo axioma [editar]La probabilidad del total, Ω, es igual a 1.
Ω representa todas las posibles alternativas y se denomina suceso seguro.
Tercer axioma [editar]Si A1, A2... son sucesos mutuamente excluyentes (incompatibles dos a dos, disjuntos o de intersección vacía dos a dos),
entonces:
.
Según este axioma se puede calcular la probabilidad de un suceso compuesto de varias alternativas mutuamente excluyentes sumando las probabilidades de sus componentes.
Propiedades que se deducen de los axiomas [editar]De los axiomas anteriores se deducen otras propiedades de la probabilidad:
donde el conjunto vacío representa en probabilidad el suceso imposible
Para cualquier suceso
Si entonces
En términos más formales, una probabilidad es una medida sobre una σ-álgebra de subconjuntos del espacio muestral, siendo los subconjuntos miembros de la σ-algebra los sucesos y definida de tal manera que la medida del total sea 1. Tal medida, gracias a su definición matemática, verifica igualmente los tres axiomas de Kolmogórov. A la terna formada por el espacio muestral, la σ-álgebra y la función de probabilidad se la denomina Espacio probabilístico, esto es, un "espacio de sucesos" (el espacio muestral) en el que se han definido los posibles sucesos a considerar (la σ-álgebra) y la probabilidad de cada suceso (la función de probabilidad).
Como ejemplo se puede tomar como espacio muestral a los posibles resultados al arrojar un dado corriente , tomaremos como σ-algebra todos los subconjuntos posibles de Ω (que en matemáticas se denota por ) y como función de probabilidad
Es fácil comprobar que esta función verifica los tres axiomas de Kolmogórov y, por tanto, consituye una probabilidad sobre este conjunto.
, puesto que es el cociente de dos números positivos
Si de tal manera que entonces
con lo que
COMENTARIO: Axiomas es parte de la probabilidad ya que es el resultado posible o un grupo de resultados posibles de un experimento y es la minima unidad de analisis para efectos de calculos probabilisticos.
La probabilidad P de un suceso E, denotada por P(E), se define con respecto a un "universo" o espacio muestral Ω, conjunto de todos los posibles sucesos elementales, tal que P verifique los Axiomas de Kolmogórov, enunciados por el matemático ruso de este nombre en 1933. En este sentido, el suceso E es, en términos matemáticos, un subconjunto de Ω.
Contenido [ocultar]
1 Axiomas de Kolmogórov
1.1 Primer axioma
1.2 Segundo axioma
1.3 Tercer axioma
1.4 Propiedades que se deducen de los axiomas
2 Véase también
3 Referencias
4 Enlaces externos
Axiomas de Kolmogórov [editar]Dado un conjunto de sucesos elementales, Ω, sobre el que se ha definida una σ-álgebra (léase sigma-algebra) σ de subconjuntos de Ω y una función P que asigna valores reales a los miembros de σ, a los que denominamos "sucesos", diremos que P es una probabilidad sobre (Ω,σ) si se cumplen los siguientes tres axiomas.
Primer axioma [editar]La probabilidad de un suceso A es un número real mayor o igual que 0.
La probabilidad de un suceso es un número positivo o nulo.
Segundo axioma [editar]La probabilidad del total, Ω, es igual a 1.
Ω representa todas las posibles alternativas y se denomina suceso seguro.
Tercer axioma [editar]Si A1, A2... son sucesos mutuamente excluyentes (incompatibles dos a dos, disjuntos o de intersección vacía dos a dos),
entonces:
.
Según este axioma se puede calcular la probabilidad de un suceso compuesto de varias alternativas mutuamente excluyentes sumando las probabilidades de sus componentes.
Propiedades que se deducen de los axiomas [editar]De los axiomas anteriores se deducen otras propiedades de la probabilidad:
donde el conjunto vacío representa en probabilidad el suceso imposible
Para cualquier suceso
Si entonces
En términos más formales, una probabilidad es una medida sobre una σ-álgebra de subconjuntos del espacio muestral, siendo los subconjuntos miembros de la σ-algebra los sucesos y definida de tal manera que la medida del total sea 1. Tal medida, gracias a su definición matemática, verifica igualmente los tres axiomas de Kolmogórov. A la terna formada por el espacio muestral, la σ-álgebra y la función de probabilidad se la denomina Espacio probabilístico, esto es, un "espacio de sucesos" (el espacio muestral) en el que se han definido los posibles sucesos a considerar (la σ-álgebra) y la probabilidad de cada suceso (la función de probabilidad).
Como ejemplo se puede tomar como espacio muestral a los posibles resultados al arrojar un dado corriente , tomaremos como σ-algebra todos los subconjuntos posibles de Ω (que en matemáticas se denota por ) y como función de probabilidad
Es fácil comprobar que esta función verifica los tres axiomas de Kolmogórov y, por tanto, consituye una probabilidad sobre este conjunto.
, puesto que es el cociente de dos números positivos
Si de tal manera que entonces
con lo que
COMENTARIO: Axiomas es parte de la probabilidad ya que es el resultado posible o un grupo de resultados posibles de un experimento y es la minima unidad de analisis para efectos de calculos probabilisticos.
PRINCIPIO FUNDAMENTAL DEL CONTEO
principio fundamental de conteo
Principio que establece que todos los posibles resultados en una situaciףn dada se pueden encontrar multiplicando el nתmero de formas en la que puede suceder cada evento.
Por ejemplo, si podemos viajar de San Francisco a Chicago de 3 formas y despuיs de Chicago a Nueva York en 2 formas, entonces podemos ir de San Francisco a Nueva York en 3׳2, o 6 formas.
Principio que establece que todos los posibles resultados en una situaciףn dada se pueden encontrar multiplicando el nתmero de formas en la que puede suceder cada evento.
Por ejemplo, si podemos viajar de San Francisco a Chicago de 3 formas y despuיs de Chicago a Nueva York en 2 formas, entonces podemos ir de San Francisco a Nueva York en 3׳2, o 6 formas.
PERMUTACION Y COMBINACION
Para ver de una manera objetiva la diferencia entre una combinación y una permutación, plantearemos cierta situación.
Suponga que un salón de clase está constituido por 35 alumnos. a) El maestro desea que tres de los alumnos lo ayuden en actividades tales como mantener el aula limpia o entregar material a los alumnos cuando así sea necesario.
b) El maestro desea que se nombre a los representantes del salón (Presidente, Secretario y Tesorero).
Solución:
a) Suponga que por unanimidad se ha elegido a Daniel, Arturo y a Rafael para limpiar el aula o entregar material, (aunque pudieron haberse seleccionado a Rafael, Daniel y a Enrique, o pudo haberse formado cualquier grupo de tres personas para realizar las actividades mencionadas anteriormente).
¿Es importante el orden como se selecciona a los elementos que forma el grupo de tres personas?
Reflexionando al respecto nos damos cuenta de que el orden en este caso no tiene importancia, ya que lo único que nos interesaría es el contenido de cada grupo, dicho de otra forma, ¿quiénes están en el grupo? Por tanto, este ejemplo es una combinación, quiere decir esto que las combinaciones nos permiten formar grupos o muestras de elementos en donde lo único que nos interesa es el contenido de los mismos.
b) Suponga que se han nombrado como representantes del salón a Daniel como Presidente, a Arturo como secretario y a Rafael como tesorero, pero resulta que a alguien se le ocurre hacer algunos cambios, los que se muestran a continuación:
CAMBIOS
PRESIDENTE:
Daniel
Arturo
Rafael
Daniel
SECRETARIO:
Arturo
Daniel
Daniel
Rafael
TESORERO:
Rafael
Rafael
Arturo
Arturo
Ahora tenemos cuatro arreglos, ¿se trata de la misma representación?
Creo que la respuesta sería no, ya que el cambio de función que se hace a los integrantes de la representación original hace que definitivamente cada una de las representaciones trabaje de manera diferente, ¿importa el orden de los elementos en los arreglos?. La respuesta definitivamente sería sí, luego entonces las representaciones antes definidas son diferentes ya que el orden o la forma en que se asignan las funciones sí importa, por lo tanto es este caso estamos tratando con permutaciones.
A continuación obtendremos las fórmulas de permutaciones y de combinaciones, pero antes hay que definir lo que es n! (ene factorial), ya que está involucrado en las fórmulas que se obtendrán y usarán para la resolución de problemas.
n!= al producto desde la unidad hasta el valor que ostenta n.
n!= 1 x 2 x 3 x 4 x...........x n
Ejem.
10!=1 x 2 x 3 x 4 x.........x 10=3,628,800
8!= 1 x 2 x 3 x 4 x.........x 8=40,320
6!=1 x 2 x 3 x 4 x..........x 6=720, etc., etc.
Obtención de fórmula de permutaciones.
Para hacer esto, partiremos de un ejemplo.
¿Cuántas maneras hay de asignar los cuatro primeros lugares de un concurso de creatividad que se verifica en las instalaciones de nuestro instituto, si hay 14 participantes?
Solución:
Haciendo uso del principio multiplicativo,
14x13x12x11 = 24,024 maneras de asignar los primeros tres lugares del concurso
Esta solución se debe, a que al momento de asignar el primer lugar tenemos a 14 posibles candidatos, una vez asignado ese lugar nos quedan 13 posibles candidatos para el segundo lugar, luego tendríamos 12 candidatos posibles para el tercer lugar y por último tendríamos 11 candidatos posibles para el cuarto lugar.
Luego si n es el total de participantes en el concurso y r es el número de participantes que van a ser premiados, y partiendo de la expresión anterior, entonces.
14x13x12x11= n x (n - 1) x (n - 2) x .......... x (n – r + 1)
si la expresión anterior es multiplicada por (n – r)! / (n – r)!, entonces
= n x (n –1 ) x (n – 2) x ......... x (n – r + 1) (n – r)! / (n – r)!
= n!/ (n – r)!
Por tanto, la fórmula de permutaciones de r objetos tomados de entre n objetos es:
Esta fórmula nos permitirá obtener todos aquellos arreglos en donde el orden es importante y solo se usen parte (r) de los n objetos con que se cuenta, además hay que hacer notar que no se pueden repetir objetos dentro del arreglo, esto es, los n objetos son todos diferentes.
Entonces, ¿ qué fórmula hay que usar para arreglos en donde se utilicen los n objetos con que se cuenta?
Si en la fórmula anterior se sustituye n en lugar de r, entonces.
nPn= n!/ (n –n)! = n! / 0! = n! / 1 = n!
Como 0! = 1 de acuerdo a demostración matemática, entonces
nPn= n!
Ejemplos:
1) ¿Cuantas representaciones diferentes serán posibles formar, si se desea que consten de Presidente, Secretario, Tesorero, Primer Vocal y Segundo Vocal?, sí esta representación puede ser formada de entre 25 miembros del sindicato de una pequeña empresa.
Solución:
Por principio multiplicativo:
25 x 24 x 23 x 22 x 21 = 6,375,600 maneras de formar una representación de ese sindicato que conste de presidente, secretario, etc., etc.
Por Fórmula:
n = 25, r = 5
25P5 = 25!/ (25 –5)! = 25! / 20! = (25 x 24 x 23 x 22 x 21 x....x 1) / (20 x 19 x 18 x ... x 1)=
= 6,375,600 maneras de formar la representación
2) a. ¿Cuántas maneras diferentes hay de asignar las posiciones de salida de 8 autos que participan en una carrera de fórmula uno? (Considere que las posiciones de salida de los autos participantes en la carrera son dadas totalmente al azar) b. ¿Cuántas maneras diferentes hay de asignar los primeros tres premios de esta carrera de fórmula uno?
Solución:
a. Por principio multiplicativo:
8 x 7 x 6 x 5 x 4 x 3 x 2 x 1= 40,320 maneras de asignar las posiciones de salida de los autos participantes en la carrera
Por Fórmula:
n = 8, r = 8
8P8= 8! = 8 x 7 x 6 x 5 x 4 x......x 1= 40,320 maneras de asignar las posiciones de salida ......etc., etc.
b. Por principio multiplicativo:
8 x 7 x 6 = 336 maneras de asignar los tres primeros lugares de la carrera
Por fórmula:
n =8, r = 3
8P3 = 8! / (8 – 3)! = 8! / 5! = (8 x 7 x 6 x 5 x ........x1)/ (5 x 4 x 3 x......x1) = 336 maneras de asignar los tres primeros lugares de la carrera
3) ¿Cuántos puntos de tres coordenadas ( x, y, z ), será posible generar con los dígitos 0, 1, 2, 4, 6 y 9?, Si, a. No es posible repetir dígitos, b. Es posible repetir dígitos.
Solución:
a. Por fórmula
n = 6, r = 3
6P3 = 6! / (6 – 3)! = 6! / 3! = 6 x 5 x 4 x 3! / 3! = 6 x 5 x 4 = 120 puntos posibles
Nota: este inciso también puede ser resuelto por el principio multiplicativo
b. Por el principio multiplicativo
6 x 6 x 6 = 216 puntos posibles
¿Cuál es la razón por la cuál no se utiliza en este caso la fórmula?. No es utilizada debido a que la fórmula de permutaciones sólo se usa cuando los objetos no se repiten, esto quiere decir que en el inciso a. Los puntos generados siempre van a tener coordenadas cuyos valores son diferentes ejem. (1, 2, 4), (2, 4, 6), (0, 4, 9), etc. etc., mientras que los puntos generados en el inciso b. Las coordenadas de los puntos pueden tener valores diferentes o repeticiones de algunos valores o pueden tener todas las coordenadas un mismo valor ejem. (1, 2, 4), (1, 2, 2), (1, 1, 1), etc., etc.
4) a. ¿Cuántas maneras hay de asignar las 5 posiciones de juego de un equipo de básquetbol, si el equipo consta de 12 integrantes?, b. ¿Cuántas maneras hay de asignar las posiciones de juego si una de ellas solo puede ser ocupada por Uriel José Esparza?, c. ¿Cuántas maneras hay de que se ocupen las posiciones de juego si es necesario que en una de ellas este Uriel José Esparza y en otra Omar Luna?
Solución:
a. Por fórmula:
n = 12, r = 5
12P5 = 12! / (12 – 5 )! = 12 x 11 x 10 x 9 x 8 = 95,040 maneras de asignar las cinco posiciones de juego
a. Por principio multiplicativo:
1 x 11 x 10 x 9 x 8 =7,920 maneras de asignar las posiciones de juego
Por fórmula:
1 x 11P4 = 1 x 11! / (11 – 4)! = 11! / 7! = 11 x 10 x 9 x 8 = 7,920 maneras de asignar las posiciones de juego con Uriel José en una determinada posición
a. Por principio multiplicativo
1 x 1 x 10 x 9 x 8 = 720 maneras de ocupar las diferentes posiciones de juego
Por fórmula:
1 x 1 x 10P3 = 1 x 1 x 10! / (10 – 3)! = 10! / 7! = 10 x 9 x 8 = 720 maneras de ocupar las posiciones de juego con Uriel José y Omar Luna en posiciones previamente definidas
5) Cuántas claves de acceso a una computadora será posible diseñar, si debe constar de dos letras, seguidas de cinco dígitos, las letras serán tomadas del abecedario y los números de entre los dígitos del 0 al 9. a. Considere que se pueden repetir letras y números, b. Considere que no se pueden repetir letras y números, c. ¿Cuántas de las claves del inciso b empiezan por la letra A y terminan por el número 6?, d. ¿Cuántas de las claves del inciso b tienen la letra R seguida de la L y terminan por un número impar?
Solución:
a. Por principio multiplicativo:
26 x 26 x 10 x 10 x 10 x 10 x 10 = 67,600,000 claves de acceso
Por fórmula:
26P2 x 10P5 = 26 x 25 x 10 x 9 x 8 x 7 x 6=19,656,000 claves de acceso
a. Por fórmula:
1 x 25P1 x 9P4 x 1 = 1 x 25 x 9 x 8 x 7 x 6 x 1 = 75,600 claves de acceso que empiezan por la letra A y terminan por el número 6
b. Por fórmula:
1 x 1 x 9P4 x 5 = 1 x 1 x 9 x 8 x 7 x 6 x 5 =15,120 claves de acceso que tienen la letra R seguida de la L y terminan por un número impar.
Suponga que un salón de clase está constituido por 35 alumnos. a) El maestro desea que tres de los alumnos lo ayuden en actividades tales como mantener el aula limpia o entregar material a los alumnos cuando así sea necesario.
b) El maestro desea que se nombre a los representantes del salón (Presidente, Secretario y Tesorero).
Solución:
a) Suponga que por unanimidad se ha elegido a Daniel, Arturo y a Rafael para limpiar el aula o entregar material, (aunque pudieron haberse seleccionado a Rafael, Daniel y a Enrique, o pudo haberse formado cualquier grupo de tres personas para realizar las actividades mencionadas anteriormente).
¿Es importante el orden como se selecciona a los elementos que forma el grupo de tres personas?
Reflexionando al respecto nos damos cuenta de que el orden en este caso no tiene importancia, ya que lo único que nos interesaría es el contenido de cada grupo, dicho de otra forma, ¿quiénes están en el grupo? Por tanto, este ejemplo es una combinación, quiere decir esto que las combinaciones nos permiten formar grupos o muestras de elementos en donde lo único que nos interesa es el contenido de los mismos.
b) Suponga que se han nombrado como representantes del salón a Daniel como Presidente, a Arturo como secretario y a Rafael como tesorero, pero resulta que a alguien se le ocurre hacer algunos cambios, los que se muestran a continuación:
CAMBIOS
PRESIDENTE:
Daniel
Arturo
Rafael
Daniel
SECRETARIO:
Arturo
Daniel
Daniel
Rafael
TESORERO:
Rafael
Rafael
Arturo
Arturo
Ahora tenemos cuatro arreglos, ¿se trata de la misma representación?
Creo que la respuesta sería no, ya que el cambio de función que se hace a los integrantes de la representación original hace que definitivamente cada una de las representaciones trabaje de manera diferente, ¿importa el orden de los elementos en los arreglos?. La respuesta definitivamente sería sí, luego entonces las representaciones antes definidas son diferentes ya que el orden o la forma en que se asignan las funciones sí importa, por lo tanto es este caso estamos tratando con permutaciones.
A continuación obtendremos las fórmulas de permutaciones y de combinaciones, pero antes hay que definir lo que es n! (ene factorial), ya que está involucrado en las fórmulas que se obtendrán y usarán para la resolución de problemas.
n!= al producto desde la unidad hasta el valor que ostenta n.
n!= 1 x 2 x 3 x 4 x...........x n
Ejem.
10!=1 x 2 x 3 x 4 x.........x 10=3,628,800
8!= 1 x 2 x 3 x 4 x.........x 8=40,320
6!=1 x 2 x 3 x 4 x..........x 6=720, etc., etc.
Obtención de fórmula de permutaciones.
Para hacer esto, partiremos de un ejemplo.
¿Cuántas maneras hay de asignar los cuatro primeros lugares de un concurso de creatividad que se verifica en las instalaciones de nuestro instituto, si hay 14 participantes?
Solución:
Haciendo uso del principio multiplicativo,
14x13x12x11 = 24,024 maneras de asignar los primeros tres lugares del concurso
Esta solución se debe, a que al momento de asignar el primer lugar tenemos a 14 posibles candidatos, una vez asignado ese lugar nos quedan 13 posibles candidatos para el segundo lugar, luego tendríamos 12 candidatos posibles para el tercer lugar y por último tendríamos 11 candidatos posibles para el cuarto lugar.
Luego si n es el total de participantes en el concurso y r es el número de participantes que van a ser premiados, y partiendo de la expresión anterior, entonces.
14x13x12x11= n x (n - 1) x (n - 2) x .......... x (n – r + 1)
si la expresión anterior es multiplicada por (n – r)! / (n – r)!, entonces
= n x (n –1 ) x (n – 2) x ......... x (n – r + 1) (n – r)! / (n – r)!
= n!/ (n – r)!
Por tanto, la fórmula de permutaciones de r objetos tomados de entre n objetos es:
Esta fórmula nos permitirá obtener todos aquellos arreglos en donde el orden es importante y solo se usen parte (r) de los n objetos con que se cuenta, además hay que hacer notar que no se pueden repetir objetos dentro del arreglo, esto es, los n objetos son todos diferentes.
Entonces, ¿ qué fórmula hay que usar para arreglos en donde se utilicen los n objetos con que se cuenta?
Si en la fórmula anterior se sustituye n en lugar de r, entonces.
nPn= n!/ (n –n)! = n! / 0! = n! / 1 = n!
Como 0! = 1 de acuerdo a demostración matemática, entonces
nPn= n!
Ejemplos:
1) ¿Cuantas representaciones diferentes serán posibles formar, si se desea que consten de Presidente, Secretario, Tesorero, Primer Vocal y Segundo Vocal?, sí esta representación puede ser formada de entre 25 miembros del sindicato de una pequeña empresa.
Solución:
Por principio multiplicativo:
25 x 24 x 23 x 22 x 21 = 6,375,600 maneras de formar una representación de ese sindicato que conste de presidente, secretario, etc., etc.
Por Fórmula:
n = 25, r = 5
25P5 = 25!/ (25 –5)! = 25! / 20! = (25 x 24 x 23 x 22 x 21 x....x 1) / (20 x 19 x 18 x ... x 1)=
= 6,375,600 maneras de formar la representación
2) a. ¿Cuántas maneras diferentes hay de asignar las posiciones de salida de 8 autos que participan en una carrera de fórmula uno? (Considere que las posiciones de salida de los autos participantes en la carrera son dadas totalmente al azar) b. ¿Cuántas maneras diferentes hay de asignar los primeros tres premios de esta carrera de fórmula uno?
Solución:
a. Por principio multiplicativo:
8 x 7 x 6 x 5 x 4 x 3 x 2 x 1= 40,320 maneras de asignar las posiciones de salida de los autos participantes en la carrera
Por Fórmula:
n = 8, r = 8
8P8= 8! = 8 x 7 x 6 x 5 x 4 x......x 1= 40,320 maneras de asignar las posiciones de salida ......etc., etc.
b. Por principio multiplicativo:
8 x 7 x 6 = 336 maneras de asignar los tres primeros lugares de la carrera
Por fórmula:
n =8, r = 3
8P3 = 8! / (8 – 3)! = 8! / 5! = (8 x 7 x 6 x 5 x ........x1)/ (5 x 4 x 3 x......x1) = 336 maneras de asignar los tres primeros lugares de la carrera
3) ¿Cuántos puntos de tres coordenadas ( x, y, z ), será posible generar con los dígitos 0, 1, 2, 4, 6 y 9?, Si, a. No es posible repetir dígitos, b. Es posible repetir dígitos.
Solución:
a. Por fórmula
n = 6, r = 3
6P3 = 6! / (6 – 3)! = 6! / 3! = 6 x 5 x 4 x 3! / 3! = 6 x 5 x 4 = 120 puntos posibles
Nota: este inciso también puede ser resuelto por el principio multiplicativo
b. Por el principio multiplicativo
6 x 6 x 6 = 216 puntos posibles
¿Cuál es la razón por la cuál no se utiliza en este caso la fórmula?. No es utilizada debido a que la fórmula de permutaciones sólo se usa cuando los objetos no se repiten, esto quiere decir que en el inciso a. Los puntos generados siempre van a tener coordenadas cuyos valores son diferentes ejem. (1, 2, 4), (2, 4, 6), (0, 4, 9), etc. etc., mientras que los puntos generados en el inciso b. Las coordenadas de los puntos pueden tener valores diferentes o repeticiones de algunos valores o pueden tener todas las coordenadas un mismo valor ejem. (1, 2, 4), (1, 2, 2), (1, 1, 1), etc., etc.
4) a. ¿Cuántas maneras hay de asignar las 5 posiciones de juego de un equipo de básquetbol, si el equipo consta de 12 integrantes?, b. ¿Cuántas maneras hay de asignar las posiciones de juego si una de ellas solo puede ser ocupada por Uriel José Esparza?, c. ¿Cuántas maneras hay de que se ocupen las posiciones de juego si es necesario que en una de ellas este Uriel José Esparza y en otra Omar Luna?
Solución:
a. Por fórmula:
n = 12, r = 5
12P5 = 12! / (12 – 5 )! = 12 x 11 x 10 x 9 x 8 = 95,040 maneras de asignar las cinco posiciones de juego
a. Por principio multiplicativo:
1 x 11 x 10 x 9 x 8 =7,920 maneras de asignar las posiciones de juego
Por fórmula:
1 x 11P4 = 1 x 11! / (11 – 4)! = 11! / 7! = 11 x 10 x 9 x 8 = 7,920 maneras de asignar las posiciones de juego con Uriel José en una determinada posición
a. Por principio multiplicativo
1 x 1 x 10 x 9 x 8 = 720 maneras de ocupar las diferentes posiciones de juego
Por fórmula:
1 x 1 x 10P3 = 1 x 1 x 10! / (10 – 3)! = 10! / 7! = 10 x 9 x 8 = 720 maneras de ocupar las posiciones de juego con Uriel José y Omar Luna en posiciones previamente definidas
5) Cuántas claves de acceso a una computadora será posible diseñar, si debe constar de dos letras, seguidas de cinco dígitos, las letras serán tomadas del abecedario y los números de entre los dígitos del 0 al 9. a. Considere que se pueden repetir letras y números, b. Considere que no se pueden repetir letras y números, c. ¿Cuántas de las claves del inciso b empiezan por la letra A y terminan por el número 6?, d. ¿Cuántas de las claves del inciso b tienen la letra R seguida de la L y terminan por un número impar?
Solución:
a. Por principio multiplicativo:
26 x 26 x 10 x 10 x 10 x 10 x 10 = 67,600,000 claves de acceso
Por fórmula:
26P2 x 10P5 = 26 x 25 x 10 x 9 x 8 x 7 x 6=19,656,000 claves de acceso
a. Por fórmula:
1 x 25P1 x 9P4 x 1 = 1 x 25 x 9 x 8 x 7 x 6 x 1 = 75,600 claves de acceso que empiezan por la letra A y terminan por el número 6
b. Por fórmula:
1 x 1 x 9P4 x 5 = 1 x 1 x 9 x 8 x 7 x 6 x 5 =15,120 claves de acceso que tienen la letra R seguida de la L y terminan por un número impar.
PERMUTACION Y COMBINACION
COMBINACIÓN Y PERMUTACION.
COMBINACIÓN:
Es todo arreglo de elementos en donde no nos interesa el lugar o posición que ocupa cada uno de los elementos que constituyen dicho arreglo.
PERMUTACIÓN:
Es todo arreglo de elementos en donde nos interesa el lugar o posición que ocupa cada uno de los elementos que constituyen dicho arreglo
COMBINACIÓN:
Es todo arreglo de elementos en donde no nos interesa el lugar o posición que ocupa cada uno de los elementos que constituyen dicho arreglo.
PERMUTACIÓN:
Es todo arreglo de elementos en donde nos interesa el lugar o posición que ocupa cada uno de los elementos que constituyen dicho arreglo
probabilidad
La teoría de la probabilidad es la teoría matemática que modela los fenómenos aleatorios. Estos deben contraponerse a los fenómenos determinísticos, en los cuales el resultado de un experimento, realizado bajo condiciones determinadas, produce un resultado único o previsible: por ejemplo, el agua calentada a 100 grados centígrados, a presión normal, se transforma en vapor. Un fenómeno aleatorio es aquel que, a pesar de realizarse el experimento bajo las mismas condiciones determinadas, tiene como resultados posibles un conjunto de alternativas, como el lanzamiento de un dado o de una moneda.
Los procesos reales que se modelizan como procesos aleatorios pueden no serlo realmente; cómo tirar una moneda o un dado no son procesos aleatorios en sentido estricto, ya que no se reproducen exactamente las mismas condiciones iniciales que lo determinan, sino sólo unas pocas. En los procesos reales que se modelizan mediante distribuciones de probabilidad corresponden a modelos complejos donde no se conocen a priori todos los parámetros que intervienen; ésta es una de las razones por las cuales la estadística, que busca determinar estos parámetros, no se reduce inmediatamente a la teoría de la probabilidad en sí.
En 1933, el matemático soviético Andréi Kolmogórov propuso un sistema de axiomas para la teoría de la probabilidad, basado en la teoría de conjuntos y en la teoría de la medida, desarrollada pocos años antes por Lebesgue, Borel y Frechet entre otros.
Esta aproximación axiomática que generaliza el marco clásico de la probabilidad, la cual obedece a la regla de cálculo de casos favorables sobre casos posibles, permitió la rigorización de muchos argumentos ya utilizados, así como el estudio de problemas fuera de los marcos clásicos. Actualmente, la teoría de la probabilidad encuentra aplicación en las más variadas ramas del conocimiento, como puede ser la física (donde corresponde mencionar el desarrollo de las difusiones y el movimiento Browniano), o las finanzas (donde destaca el modelo de Black y Scholes para la valuación de acciones. COMENTARIO:LA PROBABILIDAD ES OTRO TEMA DE SUMA IMPORTANCIA PARA LA VIDA DEL ESTUDIANTADO YA QUE POR MEDIO DE LA PROBABILIDAD PODEMOS HACER EXPERIMENTOS ALEATORIOS.
Los procesos reales que se modelizan como procesos aleatorios pueden no serlo realmente; cómo tirar una moneda o un dado no son procesos aleatorios en sentido estricto, ya que no se reproducen exactamente las mismas condiciones iniciales que lo determinan, sino sólo unas pocas. En los procesos reales que se modelizan mediante distribuciones de probabilidad corresponden a modelos complejos donde no se conocen a priori todos los parámetros que intervienen; ésta es una de las razones por las cuales la estadística, que busca determinar estos parámetros, no se reduce inmediatamente a la teoría de la probabilidad en sí.
En 1933, el matemático soviético Andréi Kolmogórov propuso un sistema de axiomas para la teoría de la probabilidad, basado en la teoría de conjuntos y en la teoría de la medida, desarrollada pocos años antes por Lebesgue, Borel y Frechet entre otros.
Esta aproximación axiomática que generaliza el marco clásico de la probabilidad, la cual obedece a la regla de cálculo de casos favorables sobre casos posibles, permitió la rigorización de muchos argumentos ya utilizados, así como el estudio de problemas fuera de los marcos clásicos. Actualmente, la teoría de la probabilidad encuentra aplicación en las más variadas ramas del conocimiento, como puede ser la física (donde corresponde mencionar el desarrollo de las difusiones y el movimiento Browniano), o las finanzas (donde destaca el modelo de Black y Scholes para la valuación de acciones. COMENTARIO:LA PROBABILIDAD ES OTRO TEMA DE SUMA IMPORTANCIA PARA LA VIDA DEL ESTUDIANTADO YA QUE POR MEDIO DE LA PROBABILIDAD PODEMOS HACER EXPERIMENTOS ALEATORIOS.
domingo, 17 de agosto de 2008
TEORIA DE CONJUNTOS
La teoría de conjuntos es una división de las matemáticas que estudia los conjuntos. El primer estudio formal sobre el tema fue realizado por el matemático alemán Georg Cantor en el Siglo XIX y más tarde reformulada por Zermelo.
El concepto de conjunto es intuitivo y se podría definir como una "colección de objetos"; así, se puede hablar de un conjunto de personas, ciudades, lapiceros o del conjunto de objetos que hay en un momento dado encima de una mesa. Un conjunto está bien definido si se sabe si un determinado elemento pertenece o no al conjunto. El conjunto de los bolígrafos azules está bien definido, porque a la vista de un bolígrafo se puede saber si es azul o no. El conjunto de las personas altas no está bien definido, porque a la vista de una persona, no siempre se podrá decir si es alta o no, o puede haber distintas personas, que opinen si esa persona es alta o no lo es. En el siglo XIX, según Frege, los elementos de un conjunto se definían sólo por tal o cual propiedad. Actualmente la teoría de conjuntos está bien definida por el sistema ZFC. Sin embargo, sigue siendo célebre la definición que publicó Cantor
Se entiende por conjunto a la agrupación en un todo de objetos bien diferenciados de nuestra intuición o nuestra mente.
Georg Cantor
Contenido [ocultar]
1 Notación
2 Igualdad entre conjuntos. Subconjuntos y Superconjuntos
2.1 Igualdad de conjuntos
2.2 Subconjuntos y Superconjuntos
3 Operaciones de conjuntos
3.1 Unión
3.2 Intersección
3.3 Diferencia
3.4 Complemento
3.5 Diferencia simétrica
4 Álgebra de conjuntos
4.1 Producto cartesiano de conjuntos o producto cruz
4.2 Cuantificadores
4.3 Funciones
5 Véase también
6 Bibliografía
7 Referencias
8 Enlaces externos
Notación [editar]Usualmente los conjuntos se representan con una letra mayúscula: A, B, K,...
Llamaremos elemento, a cada uno de los objetos que forman parte de un conjunto, estos elementos tienen carácter individual, tienen cualidades que nos permiten diferenciarlos, y cada uno de ellos es único, no habiendo elementos duplicados o repetidos. Los representaremos con una letra minúscula: a, b, k,...
De esta manera, si es un conjunto, y todos sus elementos, es común escribir:
para definir a tal conjunto . Esta notación empleada para definir al conjunto se llama notación por extensión
Para representar que un elemento pertenece a un conjunto A, escribimos (léase "x en A", "x pertenece a A" o bien "x es un elemento de A"). La negación de se escribe (léase no pertenece a ).
El conjunto universal, que siempre representaremos con la letra U (u mayúscula), es el conjunto de todas las cosas sobre las que estemos tratando. Así, si hablamos de números enteros entonces U es el conjunto de los números enteros, si hablamos de ciudades, U es el conjunto de todas las ciudades, este conjunto universal puede mencionarse explícitamente, o en la mayoría de los casos se da por supuesto dado el contexto que estemos tratando, pero siempre es necesario demostrar la existencia de dicho conjunto previamente.
Existe además, un único conjunto que no tiene elementos al que se le llama conjunto vacío y que se denota por . Es decir
La característica importante de este conjunto es que satisface todos los elementos posibles no están contenidos en él, es decir
.
Por otro lado, si todos los elementos de un conjunto A satisfacen alguna propiedad, misma que pueda ser expresada como una proposición , con la indeterminada , usamos la notación por comprensión, y se puede definir:
Lo anterior se lee "A es el conjunto de elementos x, que cumplen la propiedad p(x)". El símbolo ":" se lee "que cumplen la propiedad" o "tales que"; este símbolo puede ser remplazado por una barra .
Por ejemplo, el conjunto puede definirse por:
donde el símbolo representa al conjunto de los números naturales.
El uso de algún conjunto es muy importante, ya que de no hacerlo se podría caer en contradicciones como ejemplo:
Es decir, es el conjunto donde cada elemento satisface la propiedad . Al principio uno podría creer que ningún conjunto puede estar contenido en sí mismo y que por lo tanto no contiene elemento alguno; sin embargo, en vista de que es un conjunto, cabe hacer la pregunta "¿?" Si la respuesta es negativa () entonces cumple la propiedad y por lo tanto . Si por el contrario la respuesta es afirmativa (), entonces no cumple con la propiedad y por esta razón . Esta paradoja es muy famosa y se conoce como la paradoja del barbero esta es una de las tantas incongruencias que tenía la teoría de Cantor.
Igualdad entre conjuntos. Subconjuntos y Superconjuntos [editar]
Igualdad de conjuntos [editar]Dos conjuntos y se dicen iguales, lo que se escribe si constan de los mismos elementos. Es decir, si y solo si todo elemento de A está también contenido en B y todo elemento de B está contenido en A. En símbolos:
Subconjuntos y Superconjuntos [editar]
Diagrama de Venn que muestra Un conjunto se dice que es subconjunto de otro , si cada elemento de es también elemento de , es decir, cuando se verifique:
,
sea cual sea el elemento . En tal caso, se escribe .
Cabe señalar que, por definición, no se excluye la posibilidad de que si , se cumpla . Si tiene por lo menos un elemento que no pertenezca al conjunto , pero si todo elemento de es elemento de , entonces decimos que es un subconjunto propio de , lo que se representa por . En otras palabras, si y sólo si , y . Así, el conjunto vacío es subconjunto propio de todo conjunto (excepto de sí mismo), y todo conjunto A es subconjunto impropio de sí mismo.
Si es un subconjunto de , decimos también que es un superconjunto de , lo que se escribe . Así pues
,
y también que:
,
significando que es superconjunto propio de .
Por el principio de identidad, es siempre cierto , para todo elemento , por lo que todo conjunto es subconjunto (y también superconjunto) de sí mismo.
Vemos que es una relación de orden sobre un conjunto de conjuntos, pues
( es reflexiva)
( es antisimétrica)
( es transitiva)
Operaciones de conjuntos [editar]Sean y dos conjuntos.
Unión [editar]
Diagrama de Venn que ilustra Para cada par de conjuntos A y B existe un conjunto que se denota como el cual contiene todos los elementos de A y de B. De manera más general, para cada conjunto S existe otro conjunto denotado como de manera que sus elementos son todos los tales que . De esta manera es el caso especial donde .
Es claro que el hecho de que un elemento x pertenezca a es condición necesaria y suficiente para afirmar que x es un elemento de A o al menos de B. Es decir
Ejemplos: si tenemos los conjuntos
Entonces
Intersección [editar]
Diagrama de Venn que ilustra Los elementos comunes a y forman un conjunto denominado intersección de y , representado por . Es decir, es el conjunto que contiene a todos los elementos de A que al mismo tiempo están en B:
.
Si dos conjuntos y son tales que , entonces y se dice que son conjuntos disjuntos.
Es claro que el hecho de que es condición necesaria y suficiente para afirmar que y . Es decir
Ejemplos: si tenemos los conjuntos
Entonces:
Diferencia [editar]
Diagrama de Venn que muestra A − B
Diagrama de Venn que muestra B − ALos elementos de un conjunto que no se encuentran en otro conjunto , forman otro conjunto llamado diferencia de y , representado por . Es decir:
.
o dicho de otra manera:
Algunas personas prefieren denotar la diferencia de y como .
Una propiedad interesante de la diferencia es que
eso es porque
Ejemplos: Sin importar cual conjunto A elija usted, siempre se cumple
Complemento [editar]El complemento de un conjunto A, es el conjunto de los elementos que pertenecen a algún conjunto U pero no pertenecen a A, que lo representaremos por . Es decir
El conjunto complemento siempre lo es respecto al conjunto universal que estamos tratando, esto es, si hablamos de números enteros, y definimos el conjunto de los números pares, el conjunto complemento de los números pares, es el formado por los números no pares. Si estamos hablando de personas, y definimos el conjunto de las personas rubias, el conjunto complementario es el de las personas no rubias.
En vista de que y , entonces
,
de manera que
Pero también
de modo que
Diferencia simétrica [editar]Los elementos de dos conjuntos,A y B a excepción de aquellos que se encuentran en el área de intersección de dichos conjuntos se define la diferencia simétrica.
Álgebra de conjuntos [editar]Sean A, B, y C conjuntos cualesquiera y U un conjunto tal que , y entonces:
Elemento neutro de la unión
Elemento neutro de la intersección
Propiedad conmutativa de la intersección
Propiedad conmutativa de la unión
Propiedad de Involución.
Propiedad asociativa de la intersección
Propiedad asociativa de la unión
Propiedad distributiva de la intersección
Propiedad distributiva de la unión
Producto cartesiano de conjuntos o producto cruz [editar]Artículo principal: Producto cartesiano
Un par ordenado de números es tal si los pares y son uno mismo si y sólo si .
Dados dos conjuntos y , definimos al conjunto producto ( o producto cartesiano) de y (en ese orden), representado por , como el conjunto
Ejemplo
Sean y . Así,
Ya que el producto cartesiano está formado de pares ordenados (donde el orden de los componentes importa), resulta
Cuantificadores [editar]Los cuantificadores sirven para indicar cuantos elementos de un conjunto dado cumplen con cierta propiedad. Tales cuantificadores son
El cuantificador universal, representado por . Este cuantificador se emplea para afirmar que todos los elementos de un conjunto cumplen con determinada propiedad. Se escribe
El cuantificador existencial se usa para indicar que al menos un elemento de un conjunto cumple con una propiedad. Se escribe
.
Se definen
Funciones [editar]Artículo principal: Función matemática
Sean y dos conjuntos. Un subconjunto , se dice aplicación o función de en , lo que se representa por
siempre que se verifique
Si , el elemento se dice imagen de por , y el elemento se llama antecedente de por .
Sea una función . Se emplea la notación para representar a la imagen de por , y por tanto .
Sean las funciones y . Se define
,
y se dice que es el producto de composición de las funciones y .
Vemos que
y
por lo que
comentario:
Véase también
El concepto de conjunto es intuitivo y se podría definir como una "colección de objetos"; así, se puede hablar de un conjunto de personas, ciudades, lapiceros o del conjunto de objetos que hay en un momento dado encima de una mesa. Un conjunto está bien definido si se sabe si un determinado elemento pertenece o no al conjunto. El conjunto de los bolígrafos azules está bien definido, porque a la vista de un bolígrafo se puede saber si es azul o no. El conjunto de las personas altas no está bien definido, porque a la vista de una persona, no siempre se podrá decir si es alta o no, o puede haber distintas personas, que opinen si esa persona es alta o no lo es. En el siglo XIX, según Frege, los elementos de un conjunto se definían sólo por tal o cual propiedad. Actualmente la teoría de conjuntos está bien definida por el sistema ZFC. Sin embargo, sigue siendo célebre la definición que publicó Cantor
Se entiende por conjunto a la agrupación en un todo de objetos bien diferenciados de nuestra intuición o nuestra mente.
Georg Cantor
Contenido [ocultar]
1 Notación
2 Igualdad entre conjuntos. Subconjuntos y Superconjuntos
2.1 Igualdad de conjuntos
2.2 Subconjuntos y Superconjuntos
3 Operaciones de conjuntos
3.1 Unión
3.2 Intersección
3.3 Diferencia
3.4 Complemento
3.5 Diferencia simétrica
4 Álgebra de conjuntos
4.1 Producto cartesiano de conjuntos o producto cruz
4.2 Cuantificadores
4.3 Funciones
5 Véase también
6 Bibliografía
7 Referencias
8 Enlaces externos
Notación [editar]Usualmente los conjuntos se representan con una letra mayúscula: A, B, K,...
Llamaremos elemento, a cada uno de los objetos que forman parte de un conjunto, estos elementos tienen carácter individual, tienen cualidades que nos permiten diferenciarlos, y cada uno de ellos es único, no habiendo elementos duplicados o repetidos. Los representaremos con una letra minúscula: a, b, k,...
De esta manera, si es un conjunto, y todos sus elementos, es común escribir:
para definir a tal conjunto . Esta notación empleada para definir al conjunto se llama notación por extensión
Para representar que un elemento pertenece a un conjunto A, escribimos (léase "x en A", "x pertenece a A" o bien "x es un elemento de A"). La negación de se escribe (léase no pertenece a ).
El conjunto universal, que siempre representaremos con la letra U (u mayúscula), es el conjunto de todas las cosas sobre las que estemos tratando. Así, si hablamos de números enteros entonces U es el conjunto de los números enteros, si hablamos de ciudades, U es el conjunto de todas las ciudades, este conjunto universal puede mencionarse explícitamente, o en la mayoría de los casos se da por supuesto dado el contexto que estemos tratando, pero siempre es necesario demostrar la existencia de dicho conjunto previamente.
Existe además, un único conjunto que no tiene elementos al que se le llama conjunto vacío y que se denota por . Es decir
La característica importante de este conjunto es que satisface todos los elementos posibles no están contenidos en él, es decir
.
Por otro lado, si todos los elementos de un conjunto A satisfacen alguna propiedad, misma que pueda ser expresada como una proposición , con la indeterminada , usamos la notación por comprensión, y se puede definir:
Lo anterior se lee "A es el conjunto de elementos x, que cumplen la propiedad p(x)". El símbolo ":" se lee "que cumplen la propiedad" o "tales que"; este símbolo puede ser remplazado por una barra .
Por ejemplo, el conjunto puede definirse por:
donde el símbolo representa al conjunto de los números naturales.
El uso de algún conjunto es muy importante, ya que de no hacerlo se podría caer en contradicciones como ejemplo:
Es decir, es el conjunto donde cada elemento satisface la propiedad . Al principio uno podría creer que ningún conjunto puede estar contenido en sí mismo y que por lo tanto no contiene elemento alguno; sin embargo, en vista de que es un conjunto, cabe hacer la pregunta "¿?" Si la respuesta es negativa () entonces cumple la propiedad y por lo tanto . Si por el contrario la respuesta es afirmativa (), entonces no cumple con la propiedad y por esta razón . Esta paradoja es muy famosa y se conoce como la paradoja del barbero esta es una de las tantas incongruencias que tenía la teoría de Cantor.
Igualdad entre conjuntos. Subconjuntos y Superconjuntos [editar]
Igualdad de conjuntos [editar]Dos conjuntos y se dicen iguales, lo que se escribe si constan de los mismos elementos. Es decir, si y solo si todo elemento de A está también contenido en B y todo elemento de B está contenido en A. En símbolos:
Subconjuntos y Superconjuntos [editar]
Diagrama de Venn que muestra Un conjunto se dice que es subconjunto de otro , si cada elemento de es también elemento de , es decir, cuando se verifique:
,
sea cual sea el elemento . En tal caso, se escribe .
Cabe señalar que, por definición, no se excluye la posibilidad de que si , se cumpla . Si tiene por lo menos un elemento que no pertenezca al conjunto , pero si todo elemento de es elemento de , entonces decimos que es un subconjunto propio de , lo que se representa por . En otras palabras, si y sólo si , y . Así, el conjunto vacío es subconjunto propio de todo conjunto (excepto de sí mismo), y todo conjunto A es subconjunto impropio de sí mismo.
Si es un subconjunto de , decimos también que es un superconjunto de , lo que se escribe . Así pues
,
y también que:
,
significando que es superconjunto propio de .
Por el principio de identidad, es siempre cierto , para todo elemento , por lo que todo conjunto es subconjunto (y también superconjunto) de sí mismo.
Vemos que es una relación de orden sobre un conjunto de conjuntos, pues
( es reflexiva)
( es antisimétrica)
( es transitiva)
Operaciones de conjuntos [editar]Sean y dos conjuntos.
Unión [editar]
Diagrama de Venn que ilustra Para cada par de conjuntos A y B existe un conjunto que se denota como el cual contiene todos los elementos de A y de B. De manera más general, para cada conjunto S existe otro conjunto denotado como de manera que sus elementos son todos los tales que . De esta manera es el caso especial donde .
Es claro que el hecho de que un elemento x pertenezca a es condición necesaria y suficiente para afirmar que x es un elemento de A o al menos de B. Es decir
Ejemplos: si tenemos los conjuntos
Entonces
Intersección [editar]
Diagrama de Venn que ilustra Los elementos comunes a y forman un conjunto denominado intersección de y , representado por . Es decir, es el conjunto que contiene a todos los elementos de A que al mismo tiempo están en B:
.
Si dos conjuntos y son tales que , entonces y se dice que son conjuntos disjuntos.
Es claro que el hecho de que es condición necesaria y suficiente para afirmar que y . Es decir
Ejemplos: si tenemos los conjuntos
Entonces:
Diferencia [editar]
Diagrama de Venn que muestra A − B
Diagrama de Venn que muestra B − ALos elementos de un conjunto que no se encuentran en otro conjunto , forman otro conjunto llamado diferencia de y , representado por . Es decir:
.
o dicho de otra manera:
Algunas personas prefieren denotar la diferencia de y como .
Una propiedad interesante de la diferencia es que
eso es porque
Ejemplos: Sin importar cual conjunto A elija usted, siempre se cumple
Complemento [editar]El complemento de un conjunto A, es el conjunto de los elementos que pertenecen a algún conjunto U pero no pertenecen a A, que lo representaremos por . Es decir
El conjunto complemento siempre lo es respecto al conjunto universal que estamos tratando, esto es, si hablamos de números enteros, y definimos el conjunto de los números pares, el conjunto complemento de los números pares, es el formado por los números no pares. Si estamos hablando de personas, y definimos el conjunto de las personas rubias, el conjunto complementario es el de las personas no rubias.
En vista de que y , entonces
,
de manera que
Pero también
de modo que
Diferencia simétrica [editar]Los elementos de dos conjuntos,A y B a excepción de aquellos que se encuentran en el área de intersección de dichos conjuntos se define la diferencia simétrica.
Álgebra de conjuntos [editar]Sean A, B, y C conjuntos cualesquiera y U un conjunto tal que , y entonces:
Elemento neutro de la unión
Elemento neutro de la intersección
Propiedad conmutativa de la intersección
Propiedad conmutativa de la unión
Propiedad de Involución.
Propiedad asociativa de la intersección
Propiedad asociativa de la unión
Propiedad distributiva de la intersección
Propiedad distributiva de la unión
Producto cartesiano de conjuntos o producto cruz [editar]Artículo principal: Producto cartesiano
Un par ordenado de números es tal si los pares y son uno mismo si y sólo si .
Dados dos conjuntos y , definimos al conjunto producto ( o producto cartesiano) de y (en ese orden), representado por , como el conjunto
Ejemplo
Sean y . Así,
Ya que el producto cartesiano está formado de pares ordenados (donde el orden de los componentes importa), resulta
Cuantificadores [editar]Los cuantificadores sirven para indicar cuantos elementos de un conjunto dado cumplen con cierta propiedad. Tales cuantificadores son
El cuantificador universal, representado por . Este cuantificador se emplea para afirmar que todos los elementos de un conjunto cumplen con determinada propiedad. Se escribe
El cuantificador existencial se usa para indicar que al menos un elemento de un conjunto cumple con una propiedad. Se escribe
.
Se definen
Funciones [editar]Artículo principal: Función matemática
Sean y dos conjuntos. Un subconjunto , se dice aplicación o función de en , lo que se representa por
siempre que se verifique
Si , el elemento se dice imagen de por , y el elemento se llama antecedente de por .
Sea una función . Se emplea la notación para representar a la imagen de por , y por tanto .
Sean las funciones y . Se define
,
y se dice que es el producto de composición de las funciones y .
Vemos que
y
por lo que
comentario:
Véase también
PROBABILIDAD
La teoría de la probabilidad es la teoría matemática que modela los fenómenos aleatorios. Estos deben contraponerse a los fenómenos determinísticos, en los cuales el resultado de un experimento, realizado bajo condiciones determinadas, produce un resultado único o previsible: por ejemplo, el agua calentada a 100 grados centígrados, a presión normal, se transforma en vapor. Un fenómeno aleatorio es aquel que, a pesar de realizarse el experimento bajo las mismas condiciones determinadas, tiene como resultados posibles un conjunto de alternativas, como el lanzamiento de un dado o de una moneda.
Los procesos reales que se modelizan como procesos aleatorios pueden no serlo realmente; cómo tirar una moneda o un dado no son procesos aleatorios en sentido estricto, ya que no se reproducen exactamente las mismas condiciones iniciales que lo determinan, sino sólo unas pocas. En los procesos reales que se modelizan mediante distribuciones de probabilidad corresponden a modelos complejos donde no se conocen a priori todos los parámetros que intervienen; ésta es una de las razones por las cuales la estadística, que busca determinar estos parámetros, no se reduce inmediatamente a la teoría de la probabilidad en sí.
En 1933, el matemático soviético Andréi Kolmogórov propuso un sistema de axiomas para la teoría de la probabilidad, basado en la teoría de conjuntos y en la teoría de la medida, desarrollada pocos años antes por Lebesgue, Borel y Frechet entre otros.
Esta aproximación axiomática que generaliza el marco clásico de la probabilidad, la cual obedece a la regla de cálculo de casos favorables sobre casos posibles, permitió la rigorización de muchos argumentos ya utilizados, así como el estudio de problemas fuera de los marcos clásicos. Actualmente, la teoría de la probabilidad encuentra aplicación en las más variadas ramas del conocimiento, como puede ser la física (donde corresponde mencionar el desarrollo de las difusiones y el movimiento Browniano), o las finanzas (donde destaca el modelo de Black y Scholes para la valuación de acciones).
Contenido [ocultar]
1 Definición clásica de probabilidad
2 Definición según la frecuencia relativa y definición axiomática
3 Probabilidad discreta
4 Probabilidad continua
4.1 Función de densidad
5 Probabilidad condicional
6 Véase también
7 Bibliografía
Definición clásica de probabilidad [editar]La probabilidad es la característica de un evento, que existen razones para creer que este se realizará. Los eventos tienden a ser una frecuencia relativa del número de veces que se realiza el experimento.
La probabilidad p de que suceda un evento S de un total de n casos posibles igualmente probables es igual a la razón entre el número de ocurrencias h de dicho evento (casos favorables) y el número total de casos posibles n.
La probabilidad es un número (valor) que varia entre 0 y 1. Cuando el evento es imposible se dice que su probabilidad es 0 y el evento es cierto cuando siempre tiene que ocurrir y su probabilidad es 1. La probabilidad de no ocurrencia de un evento está dada por que donde:
Simbólicamente el espacio de resultados, que normalmente se denota por Ω, es el espacio que consiste en todos los resultados que son posibles. Los resultados, que se denota por ω1,ω2, etcétera, son elementos del espacio Ω.
Definición según la frecuencia relativa y definición axiomática [editar]Según Spiegel (1) la definición clásica de la probabilidad se define con base a sí misma (igualmente factible es sinónimo de igualmente probable) se define la probabilidad estimada o empírica basada en la frecuencia relativa de aparición de un suceso S cuando Ω es muy grande. La probabilidad de un suceso es una medida que se escribe como
,
y mide con qué frecuencia ocurre algún suceso si se hace algún experimento indefinidamente.
La definición anterior es complicada de representar matemáticamente ya que Ω debiera ser infinito. Otra manera de definir la probabilidad es de forma axiomática esto estableciendo las relaciones o propiedades que existen entre los conceptos y operaciones que la componen.
Véase también: Axiomas de probabilidad
Probabilidad discreta [editar]Este tipo de probabilidad, es aquel que puede tomar sólo ciertos valores diferentes que son el resultado de la cuenta de alguna característica de interés.
Estos Valores pueden ser de varios tipos ya sean Finitos o Infinitos, Numerables o innumerables
EJEMPLO 1: sea X el número de caras obtenidas al lanzar 3 veces una moneda. Aquí los valores de X son x = 0, 1, 2, 3
Como se muestra en el ejemplo 1 estos valores son Numerables, y Finitos, ya que se nos da un numero de especifico de casos y solo nos pueden dar un numero especifico de resultados.
Probabilidad continua [editar]Una variable aleatoria es una función
que da un valor numérico a cada suceso en Ω.
Función de densidad [editar]Artículo principal: Función de densidad
La función de densidad, o densidad de probabilidad de una variable aleatoria, es una función a partir de la cual se obtiene la probabilidad de cada valor que toma la variable. Su integral en el caso de variables aleatorias continuas es la distribución de probabilidad. En el caso de variables aleatorias discretas la distribución de probabilidad se obtiene a través del sumatorio de la función de densidad.
Probabilidad condicional [editar]Se llama probabilidad condicional a la probabilidad de que un suceso se cumpla habiéndose cumplido ya otro. Se nota "probabilidad de A sabiendo que B se ha cumplido" de la siguiente manera:
pB(A) ó p(A\B)
Dicha probabilidad se calculará de la siguiente forma:
Los procesos reales que se modelizan como procesos aleatorios pueden no serlo realmente; cómo tirar una moneda o un dado no son procesos aleatorios en sentido estricto, ya que no se reproducen exactamente las mismas condiciones iniciales que lo determinan, sino sólo unas pocas. En los procesos reales que se modelizan mediante distribuciones de probabilidad corresponden a modelos complejos donde no se conocen a priori todos los parámetros que intervienen; ésta es una de las razones por las cuales la estadística, que busca determinar estos parámetros, no se reduce inmediatamente a la teoría de la probabilidad en sí.
En 1933, el matemático soviético Andréi Kolmogórov propuso un sistema de axiomas para la teoría de la probabilidad, basado en la teoría de conjuntos y en la teoría de la medida, desarrollada pocos años antes por Lebesgue, Borel y Frechet entre otros.
Esta aproximación axiomática que generaliza el marco clásico de la probabilidad, la cual obedece a la regla de cálculo de casos favorables sobre casos posibles, permitió la rigorización de muchos argumentos ya utilizados, así como el estudio de problemas fuera de los marcos clásicos. Actualmente, la teoría de la probabilidad encuentra aplicación en las más variadas ramas del conocimiento, como puede ser la física (donde corresponde mencionar el desarrollo de las difusiones y el movimiento Browniano), o las finanzas (donde destaca el modelo de Black y Scholes para la valuación de acciones).
Contenido [ocultar]
1 Definición clásica de probabilidad
2 Definición según la frecuencia relativa y definición axiomática
3 Probabilidad discreta
4 Probabilidad continua
4.1 Función de densidad
5 Probabilidad condicional
6 Véase también
7 Bibliografía
Definición clásica de probabilidad [editar]La probabilidad es la característica de un evento, que existen razones para creer que este se realizará. Los eventos tienden a ser una frecuencia relativa del número de veces que se realiza el experimento.
La probabilidad p de que suceda un evento S de un total de n casos posibles igualmente probables es igual a la razón entre el número de ocurrencias h de dicho evento (casos favorables) y el número total de casos posibles n.
La probabilidad es un número (valor) que varia entre 0 y 1. Cuando el evento es imposible se dice que su probabilidad es 0 y el evento es cierto cuando siempre tiene que ocurrir y su probabilidad es 1. La probabilidad de no ocurrencia de un evento está dada por que donde:
Simbólicamente el espacio de resultados, que normalmente se denota por Ω, es el espacio que consiste en todos los resultados que son posibles. Los resultados, que se denota por ω1,ω2, etcétera, son elementos del espacio Ω.
Definición según la frecuencia relativa y definición axiomática [editar]Según Spiegel (1) la definición clásica de la probabilidad se define con base a sí misma (igualmente factible es sinónimo de igualmente probable) se define la probabilidad estimada o empírica basada en la frecuencia relativa de aparición de un suceso S cuando Ω es muy grande. La probabilidad de un suceso es una medida que se escribe como
,
y mide con qué frecuencia ocurre algún suceso si se hace algún experimento indefinidamente.
La definición anterior es complicada de representar matemáticamente ya que Ω debiera ser infinito. Otra manera de definir la probabilidad es de forma axiomática esto estableciendo las relaciones o propiedades que existen entre los conceptos y operaciones que la componen.
Véase también: Axiomas de probabilidad
Probabilidad discreta [editar]Este tipo de probabilidad, es aquel que puede tomar sólo ciertos valores diferentes que son el resultado de la cuenta de alguna característica de interés.
Estos Valores pueden ser de varios tipos ya sean Finitos o Infinitos, Numerables o innumerables
EJEMPLO 1: sea X el número de caras obtenidas al lanzar 3 veces una moneda. Aquí los valores de X son x = 0, 1, 2, 3
Como se muestra en el ejemplo 1 estos valores son Numerables, y Finitos, ya que se nos da un numero de especifico de casos y solo nos pueden dar un numero especifico de resultados.
Probabilidad continua [editar]Una variable aleatoria es una función
que da un valor numérico a cada suceso en Ω.
Función de densidad [editar]Artículo principal: Función de densidad
La función de densidad, o densidad de probabilidad de una variable aleatoria, es una función a partir de la cual se obtiene la probabilidad de cada valor que toma la variable. Su integral en el caso de variables aleatorias continuas es la distribución de probabilidad. En el caso de variables aleatorias discretas la distribución de probabilidad se obtiene a través del sumatorio de la función de densidad.
Probabilidad condicional [editar]Se llama probabilidad condicional a la probabilidad de que un suceso se cumpla habiéndose cumplido ya otro. Se nota "probabilidad de A sabiendo que B se ha cumplido" de la siguiente manera:
pB(A) ó p(A\B)
Dicha probabilidad se calculará de la siguiente forma:
COMENTARIO
PARA MI LA TEORIA DE CONJUNTOS ES DE SUMA IMPORTANCIA YA QUE POR MEDIO DE ESTOS TEMAS EN EL CURSO DE ESTADISTICA YA QUE ESTE CURSO ES UN RAMO CIENTIFICO Y ES POR ESO DE QUE LOS CONJUNTOS JUEGAN UN PAPEL IMPORTANTE EN LA VIDA DEL ESTUDIANTADO ASI MISMO ESTA TEORIA GENERA LO QUE ES LOS SUBCONJUNTOS DE UN CONJUNTO DADO.
viernes, 25 de julio de 2008
METODO DE MINIMOS CUADRADOS
Métodos de mínimos cuadrados.
El procedimiento mas objetivo para ajustar una recta a un conjunto de datos presentados en
un diagrama de dispersión se conoce como "el método de los mínimos cuadrados". La recta
resultante presenta dos características importantes:
1. Es nula la suma de las desviaciones verticales de los puntos a partir de la recta de ajuste
∑ (Yー - Y) = 0.
2. Es mínima la suma de los cuadrados de dichas desviaciones. Ninguna otra recta daría
una suma menor de las desviaciones elevadas al cuadrado ∑ (Yー - Y)² → 0
(mínima).
El procedimiento consiste entonces en minimizar los residuos al cuadrado Ci²
Re emplazando nos queda
La obtención de los valores de a y b que minimizan esta función es un problema que se puede resolver recurriendo a la derivación parcial de la función en términos de a y b: llamemos G a la función que se va a minimizar:
Tomemos las derivadas parciales de G respecto de a y b que son las incógnitas y las igualamos a cero; de esta forma se obtienen dos ecuaciones llamadas ecuaciones normales del modelo que pueden ser resueltas por cualquier método ya sea igualación o matrices para obtener los valores de a y b.
Derivamos parcialmente la ecuación respecto de a
Primera ecuación normal
Derivamos parcialmente la ecuación respecto de b
Segunda ecuación normal
Los valores de a y b se obtienen resolviendo el sistema de ecuaciones resultante. Veamos el siguiente ejemplo:
En un estudio económico se desea saber la relación entre el nivel de instrucción de las personas y el ingreso.
EJEMPLO 1
Se toma una muestra aleatoria de 8 ciudades de una región geográfica de 13 departamentos y se determina por los datos del censo el porcentaje de graduados en educación superior y la mediana del ingreso de cada ciudad, los resultados son los siguientes:
CIUDAD : 1 2 3 4 5 6 7 8
% de (X)
Graduados : 7.2 6.7 17.0 12.5 6.3 23.9 6.0 10.2
Ingreso (Y)
Mediana : 4.2 4.9 7.0 6.2 3.8 7.6 4.4 5.4 (0000)
Tenemos las ecuaciones normales
∑y = na + b∑x
∑xy = a∑x + b∑x²
Debemos encontrar los términos de las ecuaciones
∑y, ∑x, ∑xy, ∑ x² Por tanto procedemos de la siguiente forma:
Y
X
XY
X²
4.2
7.2
30.24
51.84
4.9
6.7
32.83
44.89
7.0
17.0
119.00
289.00
6.2
12.5
77.50
156.25
3.8
6.3
23.94
39.69
7.6
23.9
181.64
571.21
4.4
6.0
26.40
36.00
5.4
10.2
55.08
104.04
43.5
89.8
546.63
1292.92
Sustituyendo en las ecuaciones los resultados obtenidos tenemos: 43.50 = 8a + 89.8b
546.63 = 89.8a + 1292.92b
multiplicamos la primera ecuación por (-89.8) y la segunda por (8) así:
43.50 = 8a + 89.8b (-89.8) 546.63 = 89.8a + 1292.92b (8)
-3906.30 = -718.4a - 8064.04b 4373.04 = 718.4a + 10343.36b
466.74 = -0- 2279.32b
Este valor de b lo reemplazamos en cualquiera de las ecuaciones para obtener a así:
Reemplazando b = 0.20477 en la primera ecuación normal
43.5 = 8a + 89.8 (0.20477) 43.5 = 8a + 18.3880 43.5 - 18.3880 = 8a 25.1120 = 8a
Tenemos entonces que los coeficientes de regresión son : a = 3.139 y b = 0.20477. Por tanto la ecuación de regresión nos queda:
Significa entonces que por cada incremento en una unidad en X el valor de se aumenta en 0.20477
Esta ecuación permite estimar el valor de para cualquier valor de X, por ejemplo: Una ciudad que tiene un porcentaje de graduados a nivel superior del 28% la mediana de ingreso para la ciudad será:
Los valores a y b también se pueden obtener de la siguiente forma: partiendo de las ecuaciones normales tenemos:
Si dividimos todos los términos de la ecuación (1) entre n nos queda:
Tenemos entonces que el primer termino es el segundo termino es la incógnita a y el tercer termino es la incógnita b multiplicada por por tanto nos queda:
entonces
Reemplazando a en la ecuación (2) tenemos
a = 5.4375 – 0.20477 (11.2250) = 5.4375 – 2.2985 = 3.139
Se debe tener presente la diferencia entre el valor de obtenido con la ecuación de regresión y el valor de Y observado. Mientras es una estimación y su bondad en la estimación depende de lo estrecha que sea la relación entre las dos variables que se estudian; Yー es el valor efectivo, verdadero obtenido mediante la observación del investigador. En el ejemplo Yー es el valor mediano del ingreso que obtuvo el investigador
utilizando todos los ingresos observados en cada ciudad y es el valor estimado con base en el modelo lineal utilizado para obtener la ecuación de regresión
Los valores estimados y observados pueden no ser iguales por ejemplo la primera ciudad tiene un ingreso mediano observado de Yー = 4.2 al reemplazar en la ecuación el porcentaje
de graduados obtenemos un estimado de
Gráficamente lo anterior se puede mostrar así:
Claramente se observa en la gráfica que hay una diferencia entre el valor efectivo de Yー y el valor estimado; esta diferencia se conoce como error en la estimación, este error se puede medir. A continuación se verá el procedimiento.
Error estándar en la estimación
El error estándar de la estimación designado por sYX mide la disparidad "promedio" entre
los valores observados y los valores estimados de . Se utiliza la siguiente formula.
Debemos entonces calcular los valores de para cada ciudad sustituyendo en la ecuación los valores de los porcentajes de graduados de cada ciudad estudiada.
Y
X
4.2
7.2
4.6
-0.4
0.16
4.9
6.7
4.5
0.4
0.16
7.0
17.0
6.6
0.4
0.16
6.2
12.5
5.7
0.5
0.25
3.8
6.3
4.4
-0.6
0.36
7.6
23.9
8.0
-0.4
0.16
4.4
6.0
4.4
0.0
0.00
5.4
10.2
5.2
0.2
0.04
1.29
Syx = 0.46 (decenas de miles $)
Como esta medida trata de resumir la disparidad entre lo observado y lo estimado, es decir, trata de medir la diferencia promedio entre lo observado y lo estimado ó esperado de acuerdo al modelo, puede considerarse como un indicador del grado de precisión con que la ecuación de regresión, describe la relación entre las dos variables. Este error estándar se ve afectado por las unidades y sus cambios ya que es una medida absoluta, pues, se da en la misma unidad de medida que esta dada la variable Y; en el ejemplo 0.46 serán decenas de miles de pesos, razón por la cual no es posible comparar con las relaciones de variables dadas en distinta unidad de medida. Es necesario entonces calcular una medida que interprete o mida mejor el grado de relación entre las variables.
Coeficiente de determinación.
El cambio de la variable Y generalmente depende de muchos factores, en ocasiones, difíciles de identificar; con el modelo lineal simple, sólo tenemos presente uno. Por ejemplo, en nuestro caso la mediana del ingreso depende no sólo del porcentaje de graduados en el nivel superior, que es, el factor que tenemos presente, pueden entrar a jugar factores tales como, la distribución de la edad en la población, la distribución por sexo en la población, la industrialización de la ciudad, el numero de universidades y muchos otros.
El coeficiente de determinación mide o interpreta la cantidad relativa de la variación que ha sido explicada por la recta de regresión, es decir, la proporción de cambio en Y explicado por un cambio en la variable X ( X es el factor que se utiliza para calcular la recta de ajuste o ecuación de regresión, en el ejemplo es el porcentaje de graduados en el nivel superior en cada ciudad).
Para el ejemplo el Coeficiente de determinación va a medir la proporción del cambio en el ingreso mediano de cada ciudad, debido o explicado por un cambio en el porcentaje de graduados en el nivel superior.
Veamos algunos componentes de la variabilidad en el análisis de regresión:
La diferencia entre cada valor de Yー observado y media se denomina variación de Y.
La diferencia entre estimado y media , es la variación tenida en cuenta por la ecuación de regresión, razón por la cual se denomina variación explicada de Y.
La diferencia entre Yー observado y estimado, son variaciones consideradas debidas a factores diferentes al tenido presente por la ecuación de regresión por eso se llama: variación no explicada de Y.
La diferencia entre Yー observado y estimado, son variaciones consideradas debidas a factores diferentes al tenido presente por la ecuación de regresión por eso se llama: variación no explicada de Y.
La sumatoria de las diferencias en cada una de las formas de variación la podemos representar así:
Gráficamente esta relación se puede representar así:
Se dijo anteriormente, que el coeficiente de determinación es la proporción de cambio explicado en Y, por cambio en X, es decir, la proporción que representa la variación explicada de la variación total. Recuerde una proporción es la relación de una parte con el total, por tanto, el coeficiente de determinación será:
En otras palabras el coeficiente de determinación es la relación entre la variación explicada y la variación total. Su valor siempre estará
El procedimiento mas objetivo para ajustar una recta a un conjunto de datos presentados en
un diagrama de dispersión se conoce como "el método de los mínimos cuadrados". La recta
resultante presenta dos características importantes:
1. Es nula la suma de las desviaciones verticales de los puntos a partir de la recta de ajuste
∑ (Yー - Y) = 0.
2. Es mínima la suma de los cuadrados de dichas desviaciones. Ninguna otra recta daría
una suma menor de las desviaciones elevadas al cuadrado ∑ (Yー - Y)² → 0
(mínima).
El procedimiento consiste entonces en minimizar los residuos al cuadrado Ci²
Re emplazando nos queda
La obtención de los valores de a y b que minimizan esta función es un problema que se puede resolver recurriendo a la derivación parcial de la función en términos de a y b: llamemos G a la función que se va a minimizar:
Tomemos las derivadas parciales de G respecto de a y b que son las incógnitas y las igualamos a cero; de esta forma se obtienen dos ecuaciones llamadas ecuaciones normales del modelo que pueden ser resueltas por cualquier método ya sea igualación o matrices para obtener los valores de a y b.
Derivamos parcialmente la ecuación respecto de a
Primera ecuación normal
Derivamos parcialmente la ecuación respecto de b
Segunda ecuación normal
Los valores de a y b se obtienen resolviendo el sistema de ecuaciones resultante. Veamos el siguiente ejemplo:
En un estudio económico se desea saber la relación entre el nivel de instrucción de las personas y el ingreso.
EJEMPLO 1
Se toma una muestra aleatoria de 8 ciudades de una región geográfica de 13 departamentos y se determina por los datos del censo el porcentaje de graduados en educación superior y la mediana del ingreso de cada ciudad, los resultados son los siguientes:
CIUDAD : 1 2 3 4 5 6 7 8
% de (X)
Graduados : 7.2 6.7 17.0 12.5 6.3 23.9 6.0 10.2
Ingreso (Y)
Mediana : 4.2 4.9 7.0 6.2 3.8 7.6 4.4 5.4 (0000)
Tenemos las ecuaciones normales
∑y = na + b∑x
∑xy = a∑x + b∑x²
Debemos encontrar los términos de las ecuaciones
∑y, ∑x, ∑xy, ∑ x² Por tanto procedemos de la siguiente forma:
Y
X
XY
X²
4.2
7.2
30.24
51.84
4.9
6.7
32.83
44.89
7.0
17.0
119.00
289.00
6.2
12.5
77.50
156.25
3.8
6.3
23.94
39.69
7.6
23.9
181.64
571.21
4.4
6.0
26.40
36.00
5.4
10.2
55.08
104.04
43.5
89.8
546.63
1292.92
Sustituyendo en las ecuaciones los resultados obtenidos tenemos: 43.50 = 8a + 89.8b
546.63 = 89.8a + 1292.92b
multiplicamos la primera ecuación por (-89.8) y la segunda por (8) así:
43.50 = 8a + 89.8b (-89.8) 546.63 = 89.8a + 1292.92b (8)
-3906.30 = -718.4a - 8064.04b 4373.04 = 718.4a + 10343.36b
466.74 = -0- 2279.32b
Este valor de b lo reemplazamos en cualquiera de las ecuaciones para obtener a así:
Reemplazando b = 0.20477 en la primera ecuación normal
43.5 = 8a + 89.8 (0.20477) 43.5 = 8a + 18.3880 43.5 - 18.3880 = 8a 25.1120 = 8a
Tenemos entonces que los coeficientes de regresión son : a = 3.139 y b = 0.20477. Por tanto la ecuación de regresión nos queda:
Significa entonces que por cada incremento en una unidad en X el valor de se aumenta en 0.20477
Esta ecuación permite estimar el valor de para cualquier valor de X, por ejemplo: Una ciudad que tiene un porcentaje de graduados a nivel superior del 28% la mediana de ingreso para la ciudad será:
Los valores a y b también se pueden obtener de la siguiente forma: partiendo de las ecuaciones normales tenemos:
Si dividimos todos los términos de la ecuación (1) entre n nos queda:
Tenemos entonces que el primer termino es el segundo termino es la incógnita a y el tercer termino es la incógnita b multiplicada por por tanto nos queda:
entonces
Reemplazando a en la ecuación (2) tenemos
a = 5.4375 – 0.20477 (11.2250) = 5.4375 – 2.2985 = 3.139
Se debe tener presente la diferencia entre el valor de obtenido con la ecuación de regresión y el valor de Y observado. Mientras es una estimación y su bondad en la estimación depende de lo estrecha que sea la relación entre las dos variables que se estudian; Yー es el valor efectivo, verdadero obtenido mediante la observación del investigador. En el ejemplo Yー es el valor mediano del ingreso que obtuvo el investigador
utilizando todos los ingresos observados en cada ciudad y es el valor estimado con base en el modelo lineal utilizado para obtener la ecuación de regresión
Los valores estimados y observados pueden no ser iguales por ejemplo la primera ciudad tiene un ingreso mediano observado de Yー = 4.2 al reemplazar en la ecuación el porcentaje
de graduados obtenemos un estimado de
Gráficamente lo anterior se puede mostrar así:
Claramente se observa en la gráfica que hay una diferencia entre el valor efectivo de Yー y el valor estimado; esta diferencia se conoce como error en la estimación, este error se puede medir. A continuación se verá el procedimiento.
Error estándar en la estimación
El error estándar de la estimación designado por sYX mide la disparidad "promedio" entre
los valores observados y los valores estimados de . Se utiliza la siguiente formula.
Debemos entonces calcular los valores de para cada ciudad sustituyendo en la ecuación los valores de los porcentajes de graduados de cada ciudad estudiada.
Y
X
4.2
7.2
4.6
-0.4
0.16
4.9
6.7
4.5
0.4
0.16
7.0
17.0
6.6
0.4
0.16
6.2
12.5
5.7
0.5
0.25
3.8
6.3
4.4
-0.6
0.36
7.6
23.9
8.0
-0.4
0.16
4.4
6.0
4.4
0.0
0.00
5.4
10.2
5.2
0.2
0.04
1.29
Syx = 0.46 (decenas de miles $)
Como esta medida trata de resumir la disparidad entre lo observado y lo estimado, es decir, trata de medir la diferencia promedio entre lo observado y lo estimado ó esperado de acuerdo al modelo, puede considerarse como un indicador del grado de precisión con que la ecuación de regresión, describe la relación entre las dos variables. Este error estándar se ve afectado por las unidades y sus cambios ya que es una medida absoluta, pues, se da en la misma unidad de medida que esta dada la variable Y; en el ejemplo 0.46 serán decenas de miles de pesos, razón por la cual no es posible comparar con las relaciones de variables dadas en distinta unidad de medida. Es necesario entonces calcular una medida que interprete o mida mejor el grado de relación entre las variables.
Coeficiente de determinación.
El cambio de la variable Y generalmente depende de muchos factores, en ocasiones, difíciles de identificar; con el modelo lineal simple, sólo tenemos presente uno. Por ejemplo, en nuestro caso la mediana del ingreso depende no sólo del porcentaje de graduados en el nivel superior, que es, el factor que tenemos presente, pueden entrar a jugar factores tales como, la distribución de la edad en la población, la distribución por sexo en la población, la industrialización de la ciudad, el numero de universidades y muchos otros.
El coeficiente de determinación mide o interpreta la cantidad relativa de la variación que ha sido explicada por la recta de regresión, es decir, la proporción de cambio en Y explicado por un cambio en la variable X ( X es el factor que se utiliza para calcular la recta de ajuste o ecuación de regresión, en el ejemplo es el porcentaje de graduados en el nivel superior en cada ciudad).
Para el ejemplo el Coeficiente de determinación va a medir la proporción del cambio en el ingreso mediano de cada ciudad, debido o explicado por un cambio en el porcentaje de graduados en el nivel superior.
Veamos algunos componentes de la variabilidad en el análisis de regresión:
La diferencia entre cada valor de Yー observado y media se denomina variación de Y.
La diferencia entre estimado y media , es la variación tenida en cuenta por la ecuación de regresión, razón por la cual se denomina variación explicada de Y.
La diferencia entre Yー observado y estimado, son variaciones consideradas debidas a factores diferentes al tenido presente por la ecuación de regresión por eso se llama: variación no explicada de Y.
La diferencia entre Yー observado y estimado, son variaciones consideradas debidas a factores diferentes al tenido presente por la ecuación de regresión por eso se llama: variación no explicada de Y.
La sumatoria de las diferencias en cada una de las formas de variación la podemos representar así:
Gráficamente esta relación se puede representar así:
Se dijo anteriormente, que el coeficiente de determinación es la proporción de cambio explicado en Y, por cambio en X, es decir, la proporción que representa la variación explicada de la variación total. Recuerde una proporción es la relación de una parte con el total, por tanto, el coeficiente de determinación será:
En otras palabras el coeficiente de determinación es la relación entre la variación explicada y la variación total. Su valor siempre estará
METODO DE MINIMOS CUADRADOS
Mínimos cuadrados es una técnica de optimización matemática que, dada una serie de mediciones, intenta encontrar una función que se aproxime a los datos (un "mejor ajuste"). Intenta minimizar la suma de cuadrados de las diferencias ordenadas (llamadas residuos) entre los puntos generados por la función y los correspondientes en los datos. Específicamente, se llama mínimos cuadrados promedio (LMS) cuando el número de datos medidos es 1 y se usa el método de descenso por gradiente para minimizar el residuo cuadrado. Se sabe que LMS minimiza el residuo cuadrado esperado, con el mínimo de operaciones (por iteración). Pero requiere un gran número de iteraciones para converger.
Un requisito implícito para que funcione el método de mínimos cuadrados es que los errores de cada medida estén distribuidos de forma aleatoria. El teorema de Gauss-Markov prueba que los estimadores mínimos cuadráticos carecen de sesgo y que el muestreo de datos no tiene que ajustarse, por ejemplo, a una distribución normal. También es importante que los datos recogidos estén bien escogidos, para que permitan visibilidad en las variables que han de ser resueltas (para dar más peso a un dato en particular, véase mínimos cuadrados ponderados).
La técnica de mínimos cuadrados se usa comúnmente en el ajuste de curvas. Muchos otros problemas de optimización pueden expresarse también en forma de mínimos cuadrados, minimizando la energía o maximizando la entropía
Tabla de contenidos[ocultar]
1 Historia
2 Formulación del problema
3 Solución del problema de los mínimos cuadrados
4 Deducción geométrica del problema discreto
5 Mínimos cuadrados y análisis de regresión
6 Referencias
7 Véase también
8 Enlaces externos
//
Historia [editar]
Carl Friedrich Gauss
El día de Año Nuevo de 1801, el astrónomo italiano Giuseppe Piazzi descubrió el asteroide Ceres. Fue capaz de seguir su órbita durante 40 días. Durante el curso de ese año, muchos científicos intentaron estimar su trayectoria con base en las observaciones de Piazzi (resolver las ecuaciones no lineales de Kepler de movimiento es muy difícil). La mayoría de evaluaciones fueron inútiles; el único cálculo suficientemente preciso para permitir a Zach, astrónomo alemán, reencontrar a Ceres al final del año fue el de un Carl Friedrich Gauss de 24 años (los fundamentos de su enfoque ya los había plantado en 1795, cuando aún tenía 18 años). Pero su método de mínimos cuadrados no se publicó hasta 1809, apareciendo en el segundo volumen de su trabajo sobre mecánica celeste, Theoria Motus Corporum Coelestium in sctionibus conicis solem ambientium. El francés Adrien-Marie Legendre desarrolló el mismo método de forma independiente en 1805.
En 1829 Gauss fue capaz de establecer la razón del éxito maravilloso de este procedimiento: simplemente, el método de mínimos cuadrados es óptimo en muchos aspectos. El argumento concreto se conoce como teorema de Gauss-Markov.
Formulación del problema [editar]
Supóngase el conjunto de puntos (xk,yk), siendo . Sea una base de m funciones linealmente independientes fj(x), con . Queremos encontrar una función combinación lineal de las funciones base tal que , esto es:
Se trata de hallar los m coeficientes cj que hagan que la función aproximante f(x) sea la mejor aproximación a los puntos (xk,yk). El criterio de mejor aproximación puede variar, pero en general se basa en aquél que dé un menor error en la aproximación. El error en un punto (xk,yk) se podría definir como:
ek = yk − f(xk)
En este caso se trata de medir y minimizar el error en el conjunto de la aproximación. Dicho error podrá ser
Error Máximo:
Error Medio:
Error Cuadrático Medio:
La aproximación mínimo cuadrada se basa en la minimización del error cuadrático medio, o, equivalentemente en la minimización del radicando del error, el llamado error cuadrático, definido como:
Para llegar a este objetivo, suponemos que la función f es de una forma particular que contenga algunos parámetros que necesitamos determinar. Por ejemplo, supongamos que es cuadrática, lo que quiere decir que , donde no conocemos aún , y . Ahora buscamos los valores de , y que minimicen la suma de los cuadrados de los residuos (S):
Esto explica el nombre de mínimos cuadrados. A las funciones que multiplican a los coeficientes buscados, esto es, a x2, x y 1, se les conoce con el nombre de funciones base de la aproximación. Dichas funciones base pueden ser cualesquiera funciones, y para ese caso se deduce a continuación la fórmula general en el caso de que la aproximación sea discreta y lineal.
La aproximación de mínimos cuadrados es la mejor aproximación al conjunto de puntos (xk,yk), según el criterio del error mínimo cuadrático. Es posible generar otro tipo de aproximaciones si se toman los errores máximo o medio, pero la dificultad que entraña operar con ellos debido al valor absoluto de su expresión hace que apenas se usen.
Solución del problema de los mínimos cuadrados [editar]
La aproximación mínimo cuadrada tiene solución general para el caso de un problema de aproximación lineal en sus coeficientes cj cualesquiera sean las funciones base fj(x) antes expuestas. Por lineal se entiende f(x) es una combinación lineal de dichas funciones base. Para hallar la expresión de la fórmula general, es posible o bien minimizar el error cuadrático arriba expuesto, para lo cual se haría uso del cálculo multivariable (se trataría de un problema de optimización en cj), o alternativamente hacer uso del álgebra lineal en la llamada deducción geométrica. Para los Modelos estáticos uniecuacionales, el método de mínimos cuadrados no ha sido superado, a pesar de diversos intentos para ello, desde principios del Siglo XIX.
Deducción geométrica del problema discreto [editar]
La mejor aproximación deberá tender a interpolar la función de la que proviene el conjunto de pares (xk,yk), esto es, deberá tender a pasar exactamente por todos los puntos. Eso supone que se debería cumplir que:
f(xk) = yk, con k=1,2,...,n
Sustituyendo f(x) por su expresión:
Esto es, se tiene que verificar exactamente un sistema de n ecuaciones y m incógnitas, pero como en general n>m, dicho sistema está sobredeterminado, no tiene solución general. De ahí surge la necesidad de aproximarlo.
Dicho sistema podría expresarse en forma matricial como:
Esto es: Ac = b
La aproximación trata de hallar el vector c aproximante que mejor aproxime el sistema Ac = b.
Con dicho vector c aproximante, es posible definir el vector residuo como:
r = b − Ac
De manera que el mínimo error cuadrático supone minimizar el residuo, definiendo su tamaño en base a la norma euclídea o usual del residuo, que equivale al error cuadrático:
siendo (r,r)2 el producto interior o escalar del vector residuo sobre sí mismo.
Si atendemos al sistema Ac = b, entonces se ve claramente que al multiplicar A y c, lo que se realiza es una combinación lineal de las columnas de A:
El problema de aproximación será hallar aquella combinación lineal de columnas de A lo más cercana posible al vector b. Se comprueba que el conjunto de las columnas de A engendran un espacio vectorial del que son base, esto es, que forman un Span lineal: span(A1,A2,...,Am), al que el vector b no tiene porqué pertenecer (si lo hiciera, el sistema Ac=b tendría solución).
Entonces, de los infinitos vectores del span(A1,A2,...,Am) que son combinación lineal de los vectores de la base, se tratará de hallar el más cercano al vector b.
De entre todos ellos, el que cumple esto es la proyección ortogonal del b sobre span(A1,A2,...,Am), y que por tanto hace que el tamaño del vector r, que será el vector que una los extremos de los vectores b y proyección ortogonal de b sobre el span, sea mínimo, esto es, que minimiza su norma euclídea.
Es inmediato ver que si el residuo une b con su proyección ortogonal, entonces es a su vez ortogonal al span(A1,A2,...,Am), y a cada uno de los vectores de la base, esto es, ortogonal a cada columna de A.
La condición de minimización del residuo será:
Esto solo es cierto si:
A su vez, cada una de las m condiciones de perpendicularidad se puede agrupar en una sola:
Atr = 0
Sustituyendo el residuo por su expresión:
Por tanto, la mejor aproximación mínimo cuadrada lineal para un conjunto de puntos discretos, sean cuales sean las funciones base, se obtiene al resolver el sistema cuadrado:
AtAc = Atb.
A esta ecuación se le llama ecuación normal de Gauss, y es válida para cualquier conjunto de funciones base. Si estas son la unidad y la función x, entonces la aproximación se llama regresión lineal.
En el ejemplo anterior, f es lineal para los parámetros a, b y c. El problema se simplifica considerablemente en este caso y esencialmente se reduce a un sistema lineal de ecuaciones. Esto se explica en el artículo de los mínimos cuadrados lineales.
El problema es más complejo si f no es lineal para los parámetros a ser determinados. Entonces necesitamos resolver un problema de optimización general (sin restricciones). Se puede usar cualquier algoritmo para tal problema, como el método de Newton y el descenso por gradiente. Otra posibilidad es aplicar un algoritmo desarrollado especialmente para tratar con los problemas de mínimos cuadrados, como por ejemplo el algoritmo de Gauss-Newton o el algoritmo de Levenberg-Marquardt.
Mínimos cuadrados y análisis de regresión [editar]
En el análisis de regresión, se sustituye la relación
por
siendo el término de perturbación ε una variable aleatoria con media cero. Obśervese que estamos asumiendo que los valores x son exactos, y que todos los errores están en los valores y. De nuevo, distinguimos entre regresión lineal, en cuyo caso la función f es lineal para los parámetros a ser determinados (ej., f(x) = ax2 + bx + c), y regresión no lineal. Como antes, la regresión lineal es mucho más sencilla que la no lineal. (Es tentador pensar que la razón del nombre regresión lineal es que la gráfica de la función f(x) = ax + b es una línea. Ajustar una curva f(x) = ax2 + bx + c, estimando a, b y c por mínimos cuadrados es un ejemplo de regresión lineal porque el vector de estimadores mínimos cuadráticos de a, b y c es una transformación lineal del vector cuyos componentes son f(xi) + εi).
Los parámetros (a, b y c en el ejemplo anterior) se estiman con frecuencia mediante mínimos cuadrados: se toman aquellos valores que minimicen la suma S. El teorema de Gauss-Markov establece que los estimadores mínimos cuadráticos son óptimos en el sentido de que son los estimadores lineales insesgados de menor varianza, y por tanto de menor error cuadrático medio, si tomamos f(x) = ax + b estando a y b por determinar y con los términos de perturbación ε independientes y distribuidos idénticamente (véase el artículo si desea una explicación más detallada y con condiciones menos restrictivas sobre los términos de perturbación).
La estimación de mínimos cuadrados para modelos lineales es notoria por su falta de robustez frente a valores atípicos (outliers). Si la distribución de los atípicos es asimétrica, los estimadores pueden estar sesgados. En presencia de cualquier valor atípico, los estimadores mínimos cuadráticos son ineficientes y pueden serlo en extremo. Si aparecen valores atípicos en los datos, son más apropiados los métodos de regresión robusta.
Un requisito implícito para que funcione el método de mínimos cuadrados es que los errores de cada medida estén distribuidos de forma aleatoria. El teorema de Gauss-Markov prueba que los estimadores mínimos cuadráticos carecen de sesgo y que el muestreo de datos no tiene que ajustarse, por ejemplo, a una distribución normal. También es importante que los datos recogidos estén bien escogidos, para que permitan visibilidad en las variables que han de ser resueltas (para dar más peso a un dato en particular, véase mínimos cuadrados ponderados).
La técnica de mínimos cuadrados se usa comúnmente en el ajuste de curvas. Muchos otros problemas de optimización pueden expresarse también en forma de mínimos cuadrados, minimizando la energía o maximizando la entropía
Tabla de contenidos[ocultar]
1 Historia
2 Formulación del problema
3 Solución del problema de los mínimos cuadrados
4 Deducción geométrica del problema discreto
5 Mínimos cuadrados y análisis de regresión
6 Referencias
7 Véase también
8 Enlaces externos
//
Historia [editar]
Carl Friedrich Gauss
El día de Año Nuevo de 1801, el astrónomo italiano Giuseppe Piazzi descubrió el asteroide Ceres. Fue capaz de seguir su órbita durante 40 días. Durante el curso de ese año, muchos científicos intentaron estimar su trayectoria con base en las observaciones de Piazzi (resolver las ecuaciones no lineales de Kepler de movimiento es muy difícil). La mayoría de evaluaciones fueron inútiles; el único cálculo suficientemente preciso para permitir a Zach, astrónomo alemán, reencontrar a Ceres al final del año fue el de un Carl Friedrich Gauss de 24 años (los fundamentos de su enfoque ya los había plantado en 1795, cuando aún tenía 18 años). Pero su método de mínimos cuadrados no se publicó hasta 1809, apareciendo en el segundo volumen de su trabajo sobre mecánica celeste, Theoria Motus Corporum Coelestium in sctionibus conicis solem ambientium. El francés Adrien-Marie Legendre desarrolló el mismo método de forma independiente en 1805.
En 1829 Gauss fue capaz de establecer la razón del éxito maravilloso de este procedimiento: simplemente, el método de mínimos cuadrados es óptimo en muchos aspectos. El argumento concreto se conoce como teorema de Gauss-Markov.
Formulación del problema [editar]
Supóngase el conjunto de puntos (xk,yk), siendo . Sea una base de m funciones linealmente independientes fj(x), con . Queremos encontrar una función combinación lineal de las funciones base tal que , esto es:
Se trata de hallar los m coeficientes cj que hagan que la función aproximante f(x) sea la mejor aproximación a los puntos (xk,yk). El criterio de mejor aproximación puede variar, pero en general se basa en aquél que dé un menor error en la aproximación. El error en un punto (xk,yk) se podría definir como:
ek = yk − f(xk)
En este caso se trata de medir y minimizar el error en el conjunto de la aproximación. Dicho error podrá ser
Error Máximo:
Error Medio:
Error Cuadrático Medio:
La aproximación mínimo cuadrada se basa en la minimización del error cuadrático medio, o, equivalentemente en la minimización del radicando del error, el llamado error cuadrático, definido como:
Para llegar a este objetivo, suponemos que la función f es de una forma particular que contenga algunos parámetros que necesitamos determinar. Por ejemplo, supongamos que es cuadrática, lo que quiere decir que , donde no conocemos aún , y . Ahora buscamos los valores de , y que minimicen la suma de los cuadrados de los residuos (S):
Esto explica el nombre de mínimos cuadrados. A las funciones que multiplican a los coeficientes buscados, esto es, a x2, x y 1, se les conoce con el nombre de funciones base de la aproximación. Dichas funciones base pueden ser cualesquiera funciones, y para ese caso se deduce a continuación la fórmula general en el caso de que la aproximación sea discreta y lineal.
La aproximación de mínimos cuadrados es la mejor aproximación al conjunto de puntos (xk,yk), según el criterio del error mínimo cuadrático. Es posible generar otro tipo de aproximaciones si se toman los errores máximo o medio, pero la dificultad que entraña operar con ellos debido al valor absoluto de su expresión hace que apenas se usen.
Solución del problema de los mínimos cuadrados [editar]
La aproximación mínimo cuadrada tiene solución general para el caso de un problema de aproximación lineal en sus coeficientes cj cualesquiera sean las funciones base fj(x) antes expuestas. Por lineal se entiende f(x) es una combinación lineal de dichas funciones base. Para hallar la expresión de la fórmula general, es posible o bien minimizar el error cuadrático arriba expuesto, para lo cual se haría uso del cálculo multivariable (se trataría de un problema de optimización en cj), o alternativamente hacer uso del álgebra lineal en la llamada deducción geométrica. Para los Modelos estáticos uniecuacionales, el método de mínimos cuadrados no ha sido superado, a pesar de diversos intentos para ello, desde principios del Siglo XIX.
Deducción geométrica del problema discreto [editar]
La mejor aproximación deberá tender a interpolar la función de la que proviene el conjunto de pares (xk,yk), esto es, deberá tender a pasar exactamente por todos los puntos. Eso supone que se debería cumplir que:
f(xk) = yk, con k=1,2,...,n
Sustituyendo f(x) por su expresión:
Esto es, se tiene que verificar exactamente un sistema de n ecuaciones y m incógnitas, pero como en general n>m, dicho sistema está sobredeterminado, no tiene solución general. De ahí surge la necesidad de aproximarlo.
Dicho sistema podría expresarse en forma matricial como:
Esto es: Ac = b
La aproximación trata de hallar el vector c aproximante que mejor aproxime el sistema Ac = b.
Con dicho vector c aproximante, es posible definir el vector residuo como:
r = b − Ac
De manera que el mínimo error cuadrático supone minimizar el residuo, definiendo su tamaño en base a la norma euclídea o usual del residuo, que equivale al error cuadrático:
siendo (r,r)2 el producto interior o escalar del vector residuo sobre sí mismo.
Si atendemos al sistema Ac = b, entonces se ve claramente que al multiplicar A y c, lo que se realiza es una combinación lineal de las columnas de A:
El problema de aproximación será hallar aquella combinación lineal de columnas de A lo más cercana posible al vector b. Se comprueba que el conjunto de las columnas de A engendran un espacio vectorial del que son base, esto es, que forman un Span lineal: span(A1,A2,...,Am), al que el vector b no tiene porqué pertenecer (si lo hiciera, el sistema Ac=b tendría solución).
Entonces, de los infinitos vectores del span(A1,A2,...,Am) que son combinación lineal de los vectores de la base, se tratará de hallar el más cercano al vector b.
De entre todos ellos, el que cumple esto es la proyección ortogonal del b sobre span(A1,A2,...,Am), y que por tanto hace que el tamaño del vector r, que será el vector que una los extremos de los vectores b y proyección ortogonal de b sobre el span, sea mínimo, esto es, que minimiza su norma euclídea.
Es inmediato ver que si el residuo une b con su proyección ortogonal, entonces es a su vez ortogonal al span(A1,A2,...,Am), y a cada uno de los vectores de la base, esto es, ortogonal a cada columna de A.
La condición de minimización del residuo será:
Esto solo es cierto si:
A su vez, cada una de las m condiciones de perpendicularidad se puede agrupar en una sola:
Atr = 0
Sustituyendo el residuo por su expresión:
Por tanto, la mejor aproximación mínimo cuadrada lineal para un conjunto de puntos discretos, sean cuales sean las funciones base, se obtiene al resolver el sistema cuadrado:
AtAc = Atb.
A esta ecuación se le llama ecuación normal de Gauss, y es válida para cualquier conjunto de funciones base. Si estas son la unidad y la función x, entonces la aproximación se llama regresión lineal.
En el ejemplo anterior, f es lineal para los parámetros a, b y c. El problema se simplifica considerablemente en este caso y esencialmente se reduce a un sistema lineal de ecuaciones. Esto se explica en el artículo de los mínimos cuadrados lineales.
El problema es más complejo si f no es lineal para los parámetros a ser determinados. Entonces necesitamos resolver un problema de optimización general (sin restricciones). Se puede usar cualquier algoritmo para tal problema, como el método de Newton y el descenso por gradiente. Otra posibilidad es aplicar un algoritmo desarrollado especialmente para tratar con los problemas de mínimos cuadrados, como por ejemplo el algoritmo de Gauss-Newton o el algoritmo de Levenberg-Marquardt.
Mínimos cuadrados y análisis de regresión [editar]
En el análisis de regresión, se sustituye la relación
por
siendo el término de perturbación ε una variable aleatoria con media cero. Obśervese que estamos asumiendo que los valores x son exactos, y que todos los errores están en los valores y. De nuevo, distinguimos entre regresión lineal, en cuyo caso la función f es lineal para los parámetros a ser determinados (ej., f(x) = ax2 + bx + c), y regresión no lineal. Como antes, la regresión lineal es mucho más sencilla que la no lineal. (Es tentador pensar que la razón del nombre regresión lineal es que la gráfica de la función f(x) = ax + b es una línea. Ajustar una curva f(x) = ax2 + bx + c, estimando a, b y c por mínimos cuadrados es un ejemplo de regresión lineal porque el vector de estimadores mínimos cuadráticos de a, b y c es una transformación lineal del vector cuyos componentes son f(xi) + εi).
Los parámetros (a, b y c en el ejemplo anterior) se estiman con frecuencia mediante mínimos cuadrados: se toman aquellos valores que minimicen la suma S. El teorema de Gauss-Markov establece que los estimadores mínimos cuadráticos son óptimos en el sentido de que son los estimadores lineales insesgados de menor varianza, y por tanto de menor error cuadrático medio, si tomamos f(x) = ax + b estando a y b por determinar y con los términos de perturbación ε independientes y distribuidos idénticamente (véase el artículo si desea una explicación más detallada y con condiciones menos restrictivas sobre los términos de perturbación).
La estimación de mínimos cuadrados para modelos lineales es notoria por su falta de robustez frente a valores atípicos (outliers). Si la distribución de los atípicos es asimétrica, los estimadores pueden estar sesgados. En presencia de cualquier valor atípico, los estimadores mínimos cuadráticos son ineficientes y pueden serlo en extremo. Si aparecen valores atípicos en los datos, son más apropiados los métodos de regresión robusta.
CORRELACION
Correlación.
Recordemos que para el caso de una variable, la varianza era un parámetro que nos mostraba cuanta variación existía entre la media un conjunto de datos. En el mismo tenor, estamos en determinar la dependencia entre dos variables por lo que una primera propuesta es construir una medida que nos permita en forma análoga tratar la “variación”.
Se define la covarianza como la variación que existe entre los datos de dos variables, expresada como:
donde son las variables para n datos que intervienen en el estudio.
En realidad la correlación es una medida sobre el grado de relación entre dos variables, sin importar cual es la causa y cual es el efecto. La dependencia de la que se habla en este sentido es la dependencia entre la varianza de las variables.
Como hemos visto el manejo de unidades adimensionales nos permiten tener un coeficiente sobre el que de forma cómoda se pueda trabajar, por lo que podemos dividir entre el producto de las desviaciones de las variables, es decir:
los valores para este coeficiente están comprendidos entre -1 y 1.
Se tiene los siguientes criterios para r
entre mas se aproxima a los valores 1 y -1 la aproximación a una correlación se considera buena. Cuando mas se aleja de 1 o de -1 y se acerca a cero se tiene menos confianza en la dependencia lineal por lo que una aproximación lineal será lo menos apropiado, sin embargo no significa que no existe dependencia, lo único que podemos decir es que la dependencia no es lineal. Un valor positivo para r indica que a medida que una variable crece la otra también lo hace, por el contrario si su valor es negativo, lo que podemos decir es que a medida que una variable crece la otra decrece.
Datos influyentes
Ejemplos de correlación
Una vez que se determina que existe dependencia lineal un aspecto sumamente relevante es el investigar las características del modelo matemático que relaciona una variable con otra, así de esta forma podemos decir, una variable puede clasificarse como
determinístico y probabilistico. El modelo determinístico, que no será abordado en este curso, esta ligado a la ecuación que regula de forma determinante el comportamiento de un fenómeno, así por ejemplo podemos determinar a partir de la obtención de una ecuación sobre el potencial de frenado en un material, que ante cambios de la longitud de onda la relación es lineal no permitirá predecir cuales serán sus valores. Ecuaciones que permiten ver como es la oposición a la corriente eléctrica, o resistencia eléctrica, al aumentar la temperatura de un metal, entre otros, es un claro indicio de una ecuación que es determinística, en ella se podrá describir como cambiara la resistencia eléctrica del material en cuestión ante el aumento de una temperatura en el material. Por otro lado, los fenómenos probabilísticos están sujetos a la modelos que aunque puedan ser descritos por una ecuación no implica que todos los valores que intervienen en el estudio puedan ser localizados en el gráfico que los representan, y por supuesto un dato mas no es garantía que sea localizado en la ecuación.
A continuación será presentado un método para localizar en un fenómeno probabilístico la mejor línea recta que describa un fenómeno. Aunque el método de mínimos cuadrados permite encontrar la mejor ecuación para un conjunto de datos obtenidos de una muestra que puede ser aleatoria el método también permite obtener la ecuación para un fenómeno determinístico, y que por supuesto, en último caso el conjunto de puntos se ubicaran sobre la ecuación.
Línea de Regresión
Método de Mínimos Cuadrados
Recordemos que para el caso de una variable, la varianza era un parámetro que nos mostraba cuanta variación existía entre la media un conjunto de datos. En el mismo tenor, estamos en determinar la dependencia entre dos variables por lo que una primera propuesta es construir una medida que nos permita en forma análoga tratar la “variación”.
Se define la covarianza como la variación que existe entre los datos de dos variables, expresada como:
donde son las variables para n datos que intervienen en el estudio.
En realidad la correlación es una medida sobre el grado de relación entre dos variables, sin importar cual es la causa y cual es el efecto. La dependencia de la que se habla en este sentido es la dependencia entre la varianza de las variables.
Como hemos visto el manejo de unidades adimensionales nos permiten tener un coeficiente sobre el que de forma cómoda se pueda trabajar, por lo que podemos dividir entre el producto de las desviaciones de las variables, es decir:
los valores para este coeficiente están comprendidos entre -1 y 1.
Se tiene los siguientes criterios para r
entre mas se aproxima a los valores 1 y -1 la aproximación a una correlación se considera buena. Cuando mas se aleja de 1 o de -1 y se acerca a cero se tiene menos confianza en la dependencia lineal por lo que una aproximación lineal será lo menos apropiado, sin embargo no significa que no existe dependencia, lo único que podemos decir es que la dependencia no es lineal. Un valor positivo para r indica que a medida que una variable crece la otra también lo hace, por el contrario si su valor es negativo, lo que podemos decir es que a medida que una variable crece la otra decrece.
Datos influyentes
Ejemplos de correlación
Una vez que se determina que existe dependencia lineal un aspecto sumamente relevante es el investigar las características del modelo matemático que relaciona una variable con otra, así de esta forma podemos decir, una variable puede clasificarse como
determinístico y probabilistico. El modelo determinístico, que no será abordado en este curso, esta ligado a la ecuación que regula de forma determinante el comportamiento de un fenómeno, así por ejemplo podemos determinar a partir de la obtención de una ecuación sobre el potencial de frenado en un material, que ante cambios de la longitud de onda la relación es lineal no permitirá predecir cuales serán sus valores. Ecuaciones que permiten ver como es la oposición a la corriente eléctrica, o resistencia eléctrica, al aumentar la temperatura de un metal, entre otros, es un claro indicio de una ecuación que es determinística, en ella se podrá describir como cambiara la resistencia eléctrica del material en cuestión ante el aumento de una temperatura en el material. Por otro lado, los fenómenos probabilísticos están sujetos a la modelos que aunque puedan ser descritos por una ecuación no implica que todos los valores que intervienen en el estudio puedan ser localizados en el gráfico que los representan, y por supuesto un dato mas no es garantía que sea localizado en la ecuación.
A continuación será presentado un método para localizar en un fenómeno probabilístico la mejor línea recta que describa un fenómeno. Aunque el método de mínimos cuadrados permite encontrar la mejor ecuación para un conjunto de datos obtenidos de una muestra que puede ser aleatoria el método también permite obtener la ecuación para un fenómeno determinístico, y que por supuesto, en último caso el conjunto de puntos se ubicaran sobre la ecuación.
Línea de Regresión
Método de Mínimos Cuadrados
REGRESION
En estadística la regresión lineal o ajuste lineal es un método matemático que modeliza la relación entre una variable dependiente Y, las variables independientes Xi y un término aleatorio ε. Este modelo puede ser expresado como:
donde β0 es la intersección o término "constante", las βi son los parámetros respectivos a cada variable independiente, y p es el número de parámetros independientes a tener en cuenta en la regresión. La regresión lineal puede ser contrastada con la regresión no lineal.
Tabla de contenidos[ocultar]
1 Historia
1.1 Etimología
2 El modelo de regresión lineal
3 Supuestos del modelo de regresión lineal
4 Tipos de modelos de regresión lineal
4.1 Regresión lineal simple
4.1.1 Análisis
4.2 Regresión lineal múltiple
5 Rectas de regresión
6 Aplicaciones de la regresión lineal
6.1 Líneas de tendencia
6.2 Medicina
7 Véase también
8 Referencias
8.1 Fuentes adicionales
9 Enlaces externos
//
Historia [editar]
La primer forma de regresiones lineales documentada fue el método de los mínimos cuadrados, el cual fue publicado por Legendre en 1805,[1] y por Gauss en 1809.[2] El término "mínimos cuadrados" proviene de la descripción dada por Legendre "moindres carrés". Sin embargo Gauss aseguró que conocía dicho método desde 1795.
Tanto Legendre como Gauss aplicaron el método para determinar, a partir de observaciones astronómicas, las órbitas de cuerpos alrededor del sol. En 1821, Gauss publicó un trabajo en dónde desarrollaba de manera más profunda el método de los mínimos cuadrados,[3] y en dónde se incluía una versión del teorema de Gauss-Markov.
Etimología [editar]
El término regresión se utilizó por primera vez en el estudio de variables antropométricas: al comparar la estatura de padres e hijos, resultó que los hijos cuyos padres tenían una estatura muy superior al valor medio tendían a igualarse a éste, mientras que aquellos cuyos padres eran muy bajos tendían a reducir su diferencia respecto a la estatura media; es decir, "regresaban" al promedio.[4] La constatación empírica de esta propiedad se vio reforzada más tarde con la justificación teórica de ese fenómeno.
El término lineal se emplea para distinguirlo del resto de técnicas de regresión, que emplean modelos basados en cualquier clase de función matemática. Los modelos lineales son una explicación simplificada de la realidad, mucho más ágil y con un soporte teórico por parte de la matemática y la estadística mucho más extenso.
El modelo de regresión lineal [editar]
El modelo lineal relaciona la variable dependiente Y con K variables explicativas Xk (k = 1,...K), o cualquier transformación de éstas, que generan un hiperplano de parámetros βk desconocidos:
(2)
donde es la perturbación aleatoria que recoge todos aquellos factores de la realidad no controlables u observables y que por tanto se asocian con el azar, y es la que confiere al modelo su carácter estocástico. En el caso más sencillo de dos variables explicativas, el hiperplano es una recta:
(3)
El problema de la regresión consiste en elegir unos valores determinados para los parámetros desconocidos βk, de modo que la ecuación quede completamente especificada. Para ello se necesita un conjunto de observaciones. En una observación cualquiera i-ésima (i= 1,... I) se registra el comportamiento simultáneo de la variable dependiente y las variables explicativas (las perturbaciones aleatorias se suponen no observables).
(4)
Los valores escogidos como estimadores de los parámetros, , son los coeficientes de regresión, sin que se pueda garantizar que coinciden con parámetros reales del proceso generador. Por tanto, en
(5)
Los valores son por su parte estimaciones de la perturbación aleatoria o errores.
Supuestos del modelo de regresión lineal [editar]
Para poder crear un modelo de regresión lineal, es necesario que se cumpla con los siguientes supuestos:[5]
La relación entre las variables es lineal.
Los errores son independientes.
Los errores tienen varianza constante.
Los errores tienen una esperanza matemática igual a cero.
El error total es la suma de todos los errores.
Tipos de modelos de regresión lineal [editar]
Existen diferentes tipos de regresión lineal que se clasifican de acuerdo a sus parámetros:
Regresión lineal simple [editar]
Sólo se maneja una variable independiente, por lo que sólo cuenta con dos parámetros. Son de la forma:[6]
(6)
donde es el error asociado a la medición del valor Xi y siguen los supuestos de modo que (media cero, varianza constante e igual a un σ y con ).
Análisis [editar]
Dado el modelo de regresión simple, si se calcula la esperanza (valor esperado) del valor Y, se obtiene:[7]
(7)
(8)
Calculando y . Para esto se buscan dichos parámetros que minimicen
Derivando respecto a β0 y β1 e igualando a cero, se obtiene:[7]
(9)
(10)
Obteniendo dos ecuaciones denominadas ecuaciones normales que generan la siguiente solución para ambos parámetros:[6]
(11)
(12)
Regresión lineal múltiple [editar]
Maneja varias variables independientes. Cuenta con varios parámetros. Se expresan de la forma:[8]
(13)
donde es el error asociado a la medición i del valor Xip y siguen los supuestos de modo que (media cero, varianza constante e igual a un σ y con ).
Rectas de regresión [editar]
Las rectas de regresión son las rectas que mejor se ajustan a la nube de puntos (o también llamado diagrama de dispersión) generada por una distribución binomial. Matemáticamente, son posibles dos rectas de máximo ajuste:[9]
La recta de regresión de Y sobre X:
(14)
La recta de regresión de X sobre Y:
(15)
La correlación ("r") de las rectas determinará la calidad del ajuste. Si r es cercano o igual a 1, el ajuste será bueno; si r es cercano o igual a 0, se tratará de un ajuste malo. Ambas rectas de regresión se intersectan en un punto llamado centro de gravedad de la distribución.
Aplicaciones de la regresión lineal [editar]
Líneas de tendencia [editar]
Véase también: Tendencia
Una línea de tendencia representa una tendencia en una serie de datos obtenidos a través de un largo periodo de tiempo. Este tipo de líneas puede decirnos si un conjunto de datos en particular (como por ejemplo, el PBI, el precio del petróleo o el valor de las acciones) han aumentado o decrementado en un determinado periodo de tiempo.[10] Se puede dibujar una línea de tendencia a simple vista fácilmente a partir de un grupo de puntos, pero su posición y pendiente se calcula de manera más precisa utilizando técnicas estadísticas como las regresiones lineales. Las líneas de tendencia son generalmente líneas rectas, aunque algunas variaciones utilizan polinomios de mayor grado dependiendo de la curvatura deseada en la línea.
Medicina [editar]
En medicina, las primeras evidencias relacionando la mortalidad con el fumar tabaco[11] vinieron de estudios que utilizaban la regresión lineal. Los investigadores incluyen una gran cantidad de variables en su análisis de regresión en un esfuerzo por eliminar factores que pudieran producir correlaciones espurias. En el caso del tabaquismo, los investigadores incluyeron el estado socio-económico para asegurarse que los efectos de mortalidad por tabaquismo no sean un efecto de su educación o posición económica. No obstante, es imposible incluir todas las variables posibles en un estudio de regresión.[12] [13] En el ejemplo del tabaquismo, un hipotético gen podría aumentar la mortalidad y aumentar la propensión a adquirir enfermedades relacionadas con el consumo de tabaco. Por esta razón, en la actualidad las pruebas controladas aleatorias son consideradas mucho más confiables que los análisis de regresión
donde β0 es la intersección o término "constante", las βi son los parámetros respectivos a cada variable independiente, y p es el número de parámetros independientes a tener en cuenta en la regresión. La regresión lineal puede ser contrastada con la regresión no lineal.
Tabla de contenidos[ocultar]
1 Historia
1.1 Etimología
2 El modelo de regresión lineal
3 Supuestos del modelo de regresión lineal
4 Tipos de modelos de regresión lineal
4.1 Regresión lineal simple
4.1.1 Análisis
4.2 Regresión lineal múltiple
5 Rectas de regresión
6 Aplicaciones de la regresión lineal
6.1 Líneas de tendencia
6.2 Medicina
7 Véase también
8 Referencias
8.1 Fuentes adicionales
9 Enlaces externos
//
Historia [editar]
La primer forma de regresiones lineales documentada fue el método de los mínimos cuadrados, el cual fue publicado por Legendre en 1805,[1] y por Gauss en 1809.[2] El término "mínimos cuadrados" proviene de la descripción dada por Legendre "moindres carrés". Sin embargo Gauss aseguró que conocía dicho método desde 1795.
Tanto Legendre como Gauss aplicaron el método para determinar, a partir de observaciones astronómicas, las órbitas de cuerpos alrededor del sol. En 1821, Gauss publicó un trabajo en dónde desarrollaba de manera más profunda el método de los mínimos cuadrados,[3] y en dónde se incluía una versión del teorema de Gauss-Markov.
Etimología [editar]
El término regresión se utilizó por primera vez en el estudio de variables antropométricas: al comparar la estatura de padres e hijos, resultó que los hijos cuyos padres tenían una estatura muy superior al valor medio tendían a igualarse a éste, mientras que aquellos cuyos padres eran muy bajos tendían a reducir su diferencia respecto a la estatura media; es decir, "regresaban" al promedio.[4] La constatación empírica de esta propiedad se vio reforzada más tarde con la justificación teórica de ese fenómeno.
El término lineal se emplea para distinguirlo del resto de técnicas de regresión, que emplean modelos basados en cualquier clase de función matemática. Los modelos lineales son una explicación simplificada de la realidad, mucho más ágil y con un soporte teórico por parte de la matemática y la estadística mucho más extenso.
El modelo de regresión lineal [editar]
El modelo lineal relaciona la variable dependiente Y con K variables explicativas Xk (k = 1,...K), o cualquier transformación de éstas, que generan un hiperplano de parámetros βk desconocidos:
(2)
donde es la perturbación aleatoria que recoge todos aquellos factores de la realidad no controlables u observables y que por tanto se asocian con el azar, y es la que confiere al modelo su carácter estocástico. En el caso más sencillo de dos variables explicativas, el hiperplano es una recta:
(3)
El problema de la regresión consiste en elegir unos valores determinados para los parámetros desconocidos βk, de modo que la ecuación quede completamente especificada. Para ello se necesita un conjunto de observaciones. En una observación cualquiera i-ésima (i= 1,... I) se registra el comportamiento simultáneo de la variable dependiente y las variables explicativas (las perturbaciones aleatorias se suponen no observables).
(4)
Los valores escogidos como estimadores de los parámetros, , son los coeficientes de regresión, sin que se pueda garantizar que coinciden con parámetros reales del proceso generador. Por tanto, en
(5)
Los valores son por su parte estimaciones de la perturbación aleatoria o errores.
Supuestos del modelo de regresión lineal [editar]
Para poder crear un modelo de regresión lineal, es necesario que se cumpla con los siguientes supuestos:[5]
La relación entre las variables es lineal.
Los errores son independientes.
Los errores tienen varianza constante.
Los errores tienen una esperanza matemática igual a cero.
El error total es la suma de todos los errores.
Tipos de modelos de regresión lineal [editar]
Existen diferentes tipos de regresión lineal que se clasifican de acuerdo a sus parámetros:
Regresión lineal simple [editar]
Sólo se maneja una variable independiente, por lo que sólo cuenta con dos parámetros. Son de la forma:[6]
(6)
donde es el error asociado a la medición del valor Xi y siguen los supuestos de modo que (media cero, varianza constante e igual a un σ y con ).
Análisis [editar]
Dado el modelo de regresión simple, si se calcula la esperanza (valor esperado) del valor Y, se obtiene:[7]
(7)
(8)
Calculando y . Para esto se buscan dichos parámetros que minimicen
Derivando respecto a β0 y β1 e igualando a cero, se obtiene:[7]
(9)
(10)
Obteniendo dos ecuaciones denominadas ecuaciones normales que generan la siguiente solución para ambos parámetros:[6]
(11)
(12)
Regresión lineal múltiple [editar]
Maneja varias variables independientes. Cuenta con varios parámetros. Se expresan de la forma:[8]
(13)
donde es el error asociado a la medición i del valor Xip y siguen los supuestos de modo que (media cero, varianza constante e igual a un σ y con ).
Rectas de regresión [editar]
Las rectas de regresión son las rectas que mejor se ajustan a la nube de puntos (o también llamado diagrama de dispersión) generada por una distribución binomial. Matemáticamente, son posibles dos rectas de máximo ajuste:[9]
La recta de regresión de Y sobre X:
(14)
La recta de regresión de X sobre Y:
(15)
La correlación ("r") de las rectas determinará la calidad del ajuste. Si r es cercano o igual a 1, el ajuste será bueno; si r es cercano o igual a 0, se tratará de un ajuste malo. Ambas rectas de regresión se intersectan en un punto llamado centro de gravedad de la distribución.
Aplicaciones de la regresión lineal [editar]
Líneas de tendencia [editar]
Véase también: Tendencia
Una línea de tendencia representa una tendencia en una serie de datos obtenidos a través de un largo periodo de tiempo. Este tipo de líneas puede decirnos si un conjunto de datos en particular (como por ejemplo, el PBI, el precio del petróleo o el valor de las acciones) han aumentado o decrementado en un determinado periodo de tiempo.[10] Se puede dibujar una línea de tendencia a simple vista fácilmente a partir de un grupo de puntos, pero su posición y pendiente se calcula de manera más precisa utilizando técnicas estadísticas como las regresiones lineales. Las líneas de tendencia son generalmente líneas rectas, aunque algunas variaciones utilizan polinomios de mayor grado dependiendo de la curvatura deseada en la línea.
Medicina [editar]
En medicina, las primeras evidencias relacionando la mortalidad con el fumar tabaco[11] vinieron de estudios que utilizaban la regresión lineal. Los investigadores incluyen una gran cantidad de variables en su análisis de regresión en un esfuerzo por eliminar factores que pudieran producir correlaciones espurias. En el caso del tabaquismo, los investigadores incluyeron el estado socio-económico para asegurarse que los efectos de mortalidad por tabaquismo no sean un efecto de su educación o posición económica. No obstante, es imposible incluir todas las variables posibles en un estudio de regresión.[12] [13] En el ejemplo del tabaquismo, un hipotético gen podría aumentar la mortalidad y aumentar la propensión a adquirir enfermedades relacionadas con el consumo de tabaco. Por esta razón, en la actualidad las pruebas controladas aleatorias son consideradas mucho más confiables que los análisis de regresión
Suscribirse a:
Entradas (Atom)