lunes, 17 de septiembre de 2007

INTRODUCCION A LA PROBABILIDAD. DISTRIBUCIONES DE PROBABILIDAD.

UNIVERSIDAD LIBRE

FACULTAD DE INGENIERÍA
DEPARTAMENTO DE AMBIENTAL

Asignatura: ESTADISTICA DESCRIPTIVA (02231)
Grupo: 5A
Profesora: ALLA GUTIERREZ

Guía No. 3

TEMAS:
INTRODUCCION A PROBABILIDAD.
DISTRIBUCIONES DE PROBABILIDAD


Fecha: 2007/II


Objetivo:
Brindar a los estudiantes del curso los conocimientos fundamentales de las distintas ramas de la estadística, logrando introducir desde los conceptos básicos hasta los procedimientos de vanguardia con una visión practica que permita resolver problemas de las empresas en el ámbito de decisiones de riesgo, creando modelos estadísticos adecuados para una buena tomo de decisiones.


Introducción:

La estadística desempeña un importante papel en todas las áreas de investigación y la toma de decisiones de nivel empresarial. Proporciona herramientas que le permitan al ingeniero plantear modelos que faciliten la tarea de investigación y proyección de las actividades futuras.
Fortaleciendo las bases fundamentales de la Estadística con el uso de programas estadísticos y las hojas de cálculo, forma parte integral del proceso de aprendizaje, motivando a los estudiantes y elevando su nivel de conocimiento que lo llevara a ser un profesional eficiente.

Competencias a desarrollar: Interpretativa

Interpretar y describir las tendencias de datos y desarrollar la compresión de los conceptos básicos de probabilidad.
Facilitar la comprensión de los conceptos básicos de las distribuciones de probabilidad continuas y discretas.


Metodología:
Inducción: Resolver los ejercicios propuestos analizando resultados de acuerdo a las propiedades y conceptos básicos de la Probabilidad.
Profundización: Prácticas en la sala de computo utilizando Statgraphics o Excel.

Trabajo individual:
Realización de ejercicios propuestos como tarea.

Perfeccionamiento:
Realizar el análisis de los resultados y presentar conclusiones.
Trabajo en grupos.
Prácticas en Statgraphics o Excel.

Socialización:
Individual o en parejas.

Evaluación:

Presentación de tareas.


Bibliografía

1. CANAVOS, George Probabilidad y Estadística. Ed. McGRAW HILL.

2. MARTINEZ, Ciro Estadistica. Ed. ECOE.

3. MENDENHALL, William Estadística Matemática con aplicaciones. Ed. Iberoamérica.

4. MENDENHALL, William Introducción a la Probabilidad y Estadística. Ed. Thomson

5. SPIEGEL, Murray Estadística. Ed. McGRAW HILL.

6. WALPOLE, Ronald Probabilidad y Estadística para Ingenieros. Ed. PRENTICE HALL.



Ejercicios Propuestos:
INTRODUCCION A LA PROBABILIDAD
DISTRIBUCIONES DE LA PROBABILIDAD



I. INTRODUCCION A LA PROBABILIDAD.


EVENTOS.

1. Después de un extenso estudio, los archivos de una compañía de seguros revelan que la población de un país cualquiera puede clasificarse, según sus edades, como sigue: un 35% menores de 20 años; un 25% entre 21 y 35 años; un 20% entre 36 y 50 años; un 15% entre 51 y 65años; un 5% mayores de 65.
Suponga que se puede elegir un individuo de tal manera que cualquier habitante del país su­puesto tiene la misma posibilidad de ser elegido.
a) Cuál es la probabilidad de que el individuo sea mayor de 35 años?
b) Tenga edad entre 21 y 65 años?
*Rta: 0.40; 0.60

2. En un semáforo que tiene luz roja, los conductores de marcas de carros Mazda, Chevrolet, BMW están esperando el cambio del semáforo.
a) Cuál es la probabilidad de que el conductor del Mazda, sea el segundo que reacciona?
b) El segundo Ch, tercero BMW.
*Rta: 1/3; 1/6

3. Se inspeccionan los sistemas hidráulicos de aterrizaje que lle­gan a un taller de reparación de aviones, para encontrar defec­tos eventuales. Los registros indican que 8% tiene solamente defectos en los ejes; 6% sólo en los cojinetes y 2% en ejes y co­jinetes a la vez. Se selecciona al azar un sistema hidráulico. Cuál es la probabilidad de que el sistema tenga:

a) Un cojinete defectuoso?
b) Un eje o un cojinete defectuoso?
c) Exactamente uno de los dos tipos de defectos?
d) Ningún tipo de defecto?
*Rta: 0.08; 0.16; 0.14; 0.84



4. Una empresa dedicada a la búsqueda de petróleo, en 10% de sus perforaciones, encuentra petróleo. Si la compañía perfora dos pozos, los cuatro eventos posibles y tres de sus probabilidades son:

Evento la. Perforación 2a. Perforación Probabilidad
E1 Exito Exito .01
E2 Exito Fracaso ?
F3 Fracaso Éxito .09
E4 Fracaso Fracaso .81
a) Obtenga la probabilidad de que la compañía encuentra petróleo en la 1a. perforación y falle en la segunda?
b) Que encuentre petróleo en al menos una de las dos perfora­ciones?
*Rta: 0.09; 0.19
5. De los voluntarios que llegan a un banco de sangre, 1 de 3 tiene sangre tipo 0+, 1 de 15 tipo 0- , 1 de 3 tipo A+; y 1 de 16 tipo A-. Se selecciona al azar el nombre de un donante de los registros del banco. Cuál es la probabilidad de que la persona tenga:

a) Sangre tipo 0+?
b) Sangre tipo O?
c) Sangre tipo A ?
d) Sangre que no es del tipo A, ni 0?
*Rta: 1/3; 2/5; 19/48; 49/240

6. Los empleados de cierta compañía han elegido a cinco de ellos para representarlos en el consejo de productividad empresa - empleados. Las características de las cinco son:

1. H - 30 años
2. H - 32
3. M - 45
4. M - 20
5. H - 40

Este grupo desea elegir un vocero sacando su nombre de una caja. La pregunta es: Cuál es la pro­babilidad de que el vocero sea mujer o mayor de 35 años?
*Rta: 3/5

7. Un sistema contiene 2 componentes A y B. Se sabe que la probabilidad de que A funcione es 0,9 y la de B es 0.8, y de la proba­bilidad de ambos es 0.72. Determinar la probabilidad de que el sistema funcione.
*Rta: 0.98



8. Se plantea el diseño de un centro comercial que reunirá diversos establecimientos con diferentes necesidades de energía eléctrica y agua. El Ingeniero deberá diseñar tales servicios de modo que el material con que se cuenta no exceda en gran medida a la de­manda real y que tampoco resulten inadecuadas las capacidades. Existen cuatro clasificaciones: para energía eléctrica se tiene 10 y 20 unidades a saber, E10 y E20; y para agua 2 o 4 unidades, esto es A2 y A4. Han hecho los siguientes cálculos respecto a la probabilidad.

Evento P
E10 A2 0.1
E10 A4 0.2
E20 A2 0.2
E20 A4 0.5

Obtener la probabilidad de que:
a) La demanda de agua sea de 4 unidades?
b) La demanda de electricidad sea para 20 unidades?
c) La demanda de agua sea de 4 unidades o de que la energía sea de 20 unidades?
*Rta: 0.7; 0.7; 0.9

9. Tres equipos de radar, que trabajan independientemente, están disponibles para detectar cualquier avión que vuela sobre cierta área. Cada equipo tiene una probabilidad de 0.02 de no de­tectar un avión que vuele en el área.
a) Si un avión entre por casualidad al área, ¿ Cuál es la pro­babilidad de que no sea detectado?
b) Cuál es la probabilidad de que sea detectado por los tres equipos de radar?
*Rta: 0.000008; 0.941192

10. Un detector de mentiras muestra una lectura positiva ( es de­cir, indica una mentira ) en 10% de los casos cuando la persona dice la verdad y en 95% de los casos cuando la persona miente. Suponga que se sospecha de dos personas de haber cometido un delito, que fue ejecutado por una sola persona, y de hecho sólo una es la culpable.
Cuál es la probabilidad de que:
a) El detector muestre una lectura positiva para los dos sos­pechosos?
b) El detector muestre una lectura positiva para el sospechoso culpable y una lectura negativa para el inocente?
c) Esté completamente equivocado el detector , es decir, que indique una lectura positiva para el inocente y una lectura negativa para el culpable?
d) El detector de una lectura positiva para cualquiera de las dos o para ambos sospechosos?
*Rta: 0.095; 0.855; 0.005; 0.955


PROBABILIDAD CONDICIONAL.

11. El 18% de los alumnos de una Universidad fallaron en el examen Estadística, y el 20%
fallaron en su examen de Matemáticas. El 8% de los alumnos fallaron en ambas
asignaturas.
a) Cuál es la probabilidad de aprobar matemáticas, si falló en estadística?
b)Si un alumno perdió matemáticas, cuál es la probabilidad de aprobar estadística?
*Rta: 0.55; 0.60

12. El 27% de habitantes de un barrio tienen el vehículo propio y el 34% tienen la casa propia, el 17% tienen casa y vehículo.
a) Cuál es la probabilidad de tener vivienda, si se tiene el vehículo?
b) Si se tiene la vivienda, cuál es la probabilidad de tener vehículo propio?
*Rta: 0.629; 0.50

13. Con los datos del ejercicio 3, responde las siguientes preguntas:
a) Cuál es la probabilidad de que el avión tenga ejes defectuosos, si se sabe, que los cojinetes tienen estado acepta­ble?
b) Si se tienen ejes nuevos, cuál es la probabilidad de tener los cojinetes defectuosos?
*Rta: 0.063; 0.043

14. Un sistema S consta de los componentes A y B. Funciona 0.10 del tiempo; el componente A falla 0.60, en tanto que el B falla 0.75.
a) Cuál es la probabilidad si falló B, A sigue funcionando?
b) Cuál es la probabilidad de que falle B, si A funciona correctamente?
*Rta: 0.40; 0.75

15. Durante un accidente automovilístico se descubrió que 300 de 500 accidentes ocurren de noche, 52% guarda relación con la ingestión de bebidas alcohólicas y 37% tiene lugar de noche y se relaciona con la ingestión de bebidas alcohólicas:
a) Cuál es la probabilidad de que un accidente se relacione con el alcohol si ocurrió de noche?
b) Cuál es la probabilidad de que haya ocurrido de noche, si se relacionó con la ingestión de bebidas alcohólicas? *Rta: 0.616; 0.711

16. Cierta Compañía de Seguros halló que alrededor de dos de cada 1000 cheques son girados con fondos insuficientes y además que tales cheques son posfechados.. Además, dos de cada 100 cheques girados con fondos suficientes son posfechados. Si se recibe un cheque posfechado, cuál es la probabilidad que provenga de un cliente con fondos insuficientes?
*Rta: 0.0909

17. De veinte carros que llegaron a un taller mecánico 5 tienen problemas de
mala carburación, 8 tienen rotura de la correa del ventilador y 10 otro tipo de
problemas.
a) Cuál es la probabilidad de que un carro con problemas de carburación no tenga rotura de la correa del ventilador?
b) De que uno de los carros con rotura de la correa resulta también con problemas de carburación?
*Rta: 0.40; 0.375




ANALISIS COMBINATORIO.


18. Un examen consta de 4 preguntas y se deja libertad para contestarlas en el orden que se desee. De cuantas maneras se podrá contestar?
*Rta: 24

19. Si un estudiante tiene 9 libros y desea ordenar 5 de ellos sobre una repisa. De cuántas maneras distintas puede hacerlo?
*Rta: 15120

20. De cuántas maneras se puede formar con 9 personas una comisión de 5 miembros?
*Rta: 126

21. Cierta marca de automóviles tiene cinco modelos diferentes, con cuatro tipo de motores, con dos tipos de transmisiones y en ocho colores.
a) Cuántos coches tendría que adquirir un distribuidor si quiere incluir un automóvil por cada combinación modelo – motor - transmisión?


b) Cuántos coches tendría que tener en existencia un centro de distribución si almacenara los coches de todos los colores disponibles para cada combinación de (a)?
*Rta: 40; 320

22. En muchos estados las placas de los automóviles se identifican por tres letras y tres números, cuál es el número total si ninguna letra de placas posible puede usarse más de una ocasión en la misma placa?
*Rta: 15 600 000

23. Después de lanzar un dado y extraer al azar una letra del alfabeto, cuantos resultados posibles tendrá el espacio muestral?
*Rta: 150

24. Una aerolínea tiene 6 vuelos diarios de Nueva York a California y 7 vuelos de California a Hawai. Si los vuelos se hacen en días separados, cuántos diferentes arreglos de vuelos puede ofrecer la aerolínea de Nueva York a Hawai?
*Rta: 42

25. Una oficina dispone de 8 computadores de marca Sony, 3 Acer, 9 Panasonic. Si fallan 3 computadores al mes, determinar la pro­babilidad de que:

a) Los 3 Sean Sony?
b) Los tres sean Acer?
c) 2 sean Sony y 1 Acer?
d) Al menos uno sea Acer?
e) Sean uno de cada marca?
*Rta: 14/285; 1/1140; 7/95; 23/57; 18/95



TEOREMA DE BAYES


26. Tres compañías de servicios de mensajería anuncian que entregarán un paquete en cualquier parte del país a mas tardar en 24 horas. Las compañías A, B y C transportan 50, 40 y 10% del número total de paquetes. Si el 0.85%, 0.45% y el 2.5% de los paquetes se entregan con retraso por las compañías A, B y C respectivamente, cuáles son las probabilidades:
a) De que un paquete entregado con retardo haya sido llevado por la compañía A? B? C?
b) De que un paquete entregado a tiempo haya sido llevado por la compañía A? B? C?
*Rta: a) 0.4971; 0.2105; 0.2924 b) 0.5000; 0.4016; 0.0983


27.. Los cuatro ayudantes de una gasolinería deben limpiar el para brisas de los autos de los clientes, Juan quien atiende el 20% de todos los autos, no cumple su cometido una vez cada 20 autos; Tomás quien atiende el 60% de los autos, no limpia el parabrisas una vez nada 10 autos, Jorge atiende el 15% de ellos, no cumple su cometido una vez cada 10 autos y Pedro quien atiende el 5% de los autos, no limpia el parabrisas una vez cada 20 autos. Si un cliente se queja de que su parabrisas no fue lavado. ¿ Cuál es la probabilidad de que su auto lo haya atendido Juan?
*Rta: .114

28. Durante los últimos años se ha escrito mucho sobre la posible relación entre el fumar y el cáncer pulmonar. Supóngase que en un Centro Médico, de todos los fumadores de quienes se sospecha que tenían cáncer pulmonar, el 90% lo tenía, mientras que únicamente mente el 5% de los no fumadores lo padecía. Si la proporción de fumadores es de 0.45. ¿ Cuál es la probabilidad de que un paciente con cáncer pulmonar, seleccionado al azar, sea fumador?
*Rta: .9364

29. Una compañía estudia la comercialización de un nuevo producto y se decide asignar una posibilidad del 50% de que el producto sea superior al ofrecido por el competidor, 30% de que tenga la misma calidad y un 20% de que sea inferior. La probabilidad de que la encuesta alcance que éste es superior es de 0.7, de la misma calidad es 0,4, si es inferior es de 0.2. Dado el resultado de la encuesta. Cuál es la probabilidad corregida, de obtener un producto superior?
*Rta: .6863

30. El 40% de los artículos producidos por una compañía han tenido éxito en el
mercado y el 60% no lo han tenido. Se lleva a cabo una investigación de mercado y el
80% de los compradores de los artículos exitosos están satisfechos con su compra y el
30% de los clientes están satisfechos con la compra de la mercancía que no ha tenido
éxito en el mercado. Al gerente de mercadotecnia le gustaría conocer la probabilidad de
que el nuevo artículo tendrá éxito si el comprador estará satisfecho con la compra.
*Rta: 0.64

31. Una empresa que ensambla televisores compra un cierto chip en tres
distribuidoras: A, B y C un 30, 20 y 50% respectivamente. Se sabe que 3% de
los chips de la distribuidora A son defectuosos, 5% de la B y 4% de la C
también son defectuosos.
a) Si un chip seleccionado al azar resulto ser defectuoso, cuál es la probabilidad de que haya sido manufacturado por la distribuidora B?
b) Cuál es la probabilidad de que un chip resulto ser aceptable, si se compro en la distribuidora C?
*Rta: 0.2564; 0.4995



II. DISTRIBUCIONES DE LA PROBABILIDAD.

VARIABLES ALEATORIAS DISCRETAS
Y SUS DISTRIBUCIONES DE PROBABILIDAD


VALOR ESPERADO

32. Un inversionista se da cuenta de que tiene una probabilidad de 0.40 de obtener una utilidad de $25.000, y una probabilidad de 0.60 de perder $15.000 en una inversión. Encuentra su ganancia esperada y Desviación Estándar?
* Rta: 1.000

33. Un contratista hace las siguientes estimaciones:
Tiempo de Probabilidad
Terminación
10 días 0.30
15 días 0.20
22 días 0.50

Calcule el valor esperado para la terminación del proyecto. Halle desviación estándar.
*Rta: 17+/-5.29

34. Un proceso de fabricación que consiste de tres pasos requiere de un tiempo promedio de 15 minutos para la terminación del primer paso, 25 minutos para el segundo y 30 minutos para el tercero. Las desviaciones estándar respectivas son de tres, cuatro y cinco minutos. Encuentre la media y la varianza del tiempo total de terminación del proceso.
Rta: 70; 50

35. Una fábrica embarca su producto en dos camiones con dimensiones 8x10x30 y 8x10x40 pies, respectivamente. El 30% de sus embarques se hacen en el camión de 30 pies y el 70% en el camión de 40 pies. Encuentre la media por vehículo del volumen embarcado. (Se supone que los camiones siempre van llenos).
*Rta: 2960


36. Un vendedor está tratando de decidir si hacer una llamada a un cliente potencial en la periferia de su territorio de ventas. Estima que el costo de hacer la llamada será de $ 100. Las utilidades potenciales, excluido el costo de la llamada, se muestran en la tabla. Cuál es la utilidad neta esperada de hacer la llamada?
Rendimientos potenciales dela llamada:


Rendimiento Probabilidad
potencial
0 0.60
50 0.10
100 0.15
500 0.10
1000 0.05
*Rta: E(rendimientos): $120; E(rendimientos netos): $20


Distribución de Probabilidad
BINOMIAL.


37. Se sabe que en la manufactura de cierto artículo uno de cada 10 resulta defectuoso. Cuál es la probabilidad de que una mues­tra aleatoria de 4 artículos contenga:

a) Ninguno defectuoso?
b) Exactamente uno defectuoso?
c) Exactamente dos defectuosos?
d) No más de dos defectuosos?

Rta: .6561; .2916; .0486; .9963


38. Conforme a los registros universitarios, fracasa el 5% de los alumnos de cierto curso. Cuál es la probabilidad de que 6 estudiantes seleccionados al azar menos de 3 hayan fracasado?
Rta: .9977


39. Supóngase que un lote de 300 fusibles eléctricos contiene 5% de defectuosos. Determine la probabilidad de que se pueda en­contrar al menos un fusible defectuoso en una muestra de cinco fusibles.
Rta: .226

40. La experiencia ha demostrado que el 30% de todas las personas afectadas por cierta enfermedad, se recupera. Una compañía farmacéutica desarrolló una nueva vacuna. Se seleccionaron al azar 10 personas con la enfermedad en cuestión y se les administró la vacuna; poco después 9 se recuperaron. Supóngase que la vacuna es absolutamente ineficaz. Cuál es la probabilidad de que al menos 9 de 10 personas infectadas se recuperen?
Rta: .000144

41. Muchas compañías de energía eléctrica han empezado a promover el ahorro de energía al ofrecer descuentos a consumidores que mantienen su consumo de energía por debajo de ciertas normas de subsidio establecidas. Un reciente reporte informa que el 70% han reducido suficientemente el uso de energía eléctrica para poder disfrutar de los descuentos. Si se selecciona al azar cinco residentes, encuentre la probabilidad de que:
a) Los cinco clasifican para tarifas más favorables?
b) Al menos cuatro clasifican para tarifas más favorables?
Rta: .1681; .5282

42. Un examen de opción múltiple está compuesto de 15 preguntas, con cinco respuestas posibles, cada una; de las cuales solamente una es correcta. Supóngase que uno de los estudiantes que realizan el examen contesta las preguntas al azar. Cuál es la probabilidad de que conteste correctamente al menos 10 preguntas?
Rta: .000

43. Si la probabilidad de que se desplome una estructura después de 30 años de servicio es 0,01, obtenga la probabilidad de que de 10 estructuras de esa clase, las siguientes se derrumben después de 30 años de servicio.
a) Ninguna?
b) Una exactamente?
c) No más de una?
d) Más de una?
e) Por lo menos una?
* Rta: .9043; .0913; .9956; .0044; .0957

44. Una factoría observa que, en promedio el 20% de las tuercas producidas por una máquina son defectuosas. Si se toman 10 tuercas al azar, hallar la probabilidad de que:
a) Exactamente 2 sean defectuosas
b) Dos o más sean defectuosas
c) Más de 5 sean defectuosas.
*Rta: .3020; .6242; .00637

45. Las observaciones durante un largo periodo muestran que un vendedor determinado puede concluir una venta en una sola entre­vista con una probabilidad de 0.2. Supóngase que el vendedor entrevista a cuatro prospectos ( o compradores prospectivos). Cuál es la probabilidad de que:
a) Exactamente 2 prospectos compren el producto?
b) Al menos 2 prospectos compren el artículo?
c) Todos los prospectos compren el producto?
*Rta: .1536; .1808; .0016

46. Se inspeccionan los grandes lotes de productos que llegan a una planta a fin de encontrar artículos defectuosos. Se examinan 10 artículos y el lote será rechazado si se encuentran 2 o más artículos defectuosos. Si el lote contiene exactamente 5% de artículos defectuosos, cuál es la probabilidad de que el lote sea aceptado? Cuál es la probabilidad de que sea rechazado?
*Rta: .914; .086

47. De los 6.000 estudiantes matriculados en la Universidad, se sabe que 4800 de ellos se trasladan a la Universidad utilizando el transporte urbano. Si se selecciona una muestra de 8 estudiantes, cuál es la probabilidad de que:
a) No más de 2 utilicen dicho servicio?
b) Por lo menos 3 no lo utilizan?
c) Exactamente 2 no lo utilizan?
d) Exactamente 2 lo utilizan?
*Rta: .00123; .2039; .2912; .001146

48. Se forma una empresa de exploración petrolera con suficiente capital para financiar 10 exploraciones. La probabilidad de que una exploración en particular sea exitosa es de 0.1. Supóngase que las exploraciones son independientes. Encuentre la media y la varianza del número de exploraciones exitosas.
*Rta: 1.0; 0.9

49. Supóngase que la Empresa del ejercicio anterior tiene un costo fijo de 20.000 (dólares) para preparar el equipo antes de la pri­mera exploración.
Si cada exploración exitosa cuesta $30.000 y cada exploración fallida, $15.000, encuentre el costo total esperado de la em­presa para las 10 exploraciones.
*Rta: $ 185.000

50. Supóngase que la probabilidad de éxito es 0,10 y el número de observaciones es 100. Encuentre la media y la desviación estándar de la distribución probabilistica, tanto para el número como para el porcentaje de éxitos.
*Rta: 10; 3; 0.10; 0.03


Distribución de Probabilidad de
POISSON


51. Si el 1% de las bombillas fabricadas por una compañía son de­fectuosas, hallar la probabilidad de que en una muestra de 100 bombillas 3 sean defectuosas.
*Rta: .06131

52. Si la probabilidad de que una persona adquiera la enfermedad como consecuencia de una vacuna contra la misma es 0.0002; Cuál es la probabilidad de que adquieran exactamente 3 personas en una población de 10.000 vacunados? Menos de 3? más de 3?
*Rta: .1804, .6765, .1431

53. Se estima que cada una de 10.000 personas es alérgica a cierta sustancia utilizada en la fabricación de cosméticos. Cuál es la probabilidad de que en 20.000 usuarios, más de 5 personas sufran reacciones alérgicas, debido a su uso? (P más de 2)=?; P (al menos 1 ) =?; P (menos de 3) =?)
*Rta: .0166, .3233, .8647, .6765

54. Supóngase que en una Empresa aérea se ha enterado el superior de vuelos, que en promedio uno de cada 150 vuelos se retrasan más de una hora. Si se hacen 1500 vuelos en un mes, cuál es la probabilidad de que:
a) Exactamente 3 vuelos se retrasen mas de una hora?
b) Más de 3 vuelos se retrasen más de una hora?
c) Menos de 5 vuelos se retrasen más de una hora?
*Rta: .008085; .9889; .03108

55. Después de una prueba de laboratorio muy rigurosa con cierto componente eléctrico, el fabricante determina que en promedio sólo fallarán dos componentes antes de tener 1000 horas de operación. Un computador observa que son 5 los que fallan an­tes de las 1000 horas. Si el número de componentes que fallan es una variable aleatoria de Poisson. ¿ Existe suficiente evidencia para dudar de la conclusión del fabricante?
*Rta: .0361; .0527

56. Las lesiones laborales graves que ocurren en una planta side­rúrgica, tienen una media anual de 2.7. Dado que las condiciones de seguridad serían iguales en la planta durante el próximo año, cuál es la probabilidad de que el número de lesiones graves sea menor que dos?
*Rta: .249

57. Si la probabilidad de que una viga de concreto falle por com­presión es de 0.05, determine la probabilidad de que de una muestra de 50 vigas:
a) Por lo menos 3 fallen por compresión;
b) Ninguna viga falle por compresión.
*Rta: .4775; .082

58. En un almacén particular los clientes llegan al mostrador de caja, conforme una distribución de Poisson con un promedio de 7 por hora. En una hora dada, ¿ Cuál es la probabilidad de que:
a) No lleguen más de tres clientes ?
b) Lleguen al menos 2 clientes?
c) Lleguen exactamente cinco clientes?
Rta: .0818; 1-8e**-7; .1277

59. Una vendedora se da cuenta de que la probabilidad de venta en una entrevista única es aproximadamente 0.03, Cuál es la pro­babilidad de que ella haga al menos una venta al tener 100 compradores posibles?
*Rta: 1-.97 **100

60. Según la "U.S Fire Administration", 185 personas murieron en 12,438 incendios en hoteles y moteles en 1979, o sea aproximadamente 1.5 muertos por cada 100 incendios CU.s. New and report, agosto 3 de 1991).

a) Cuál es la probabilidad de que el Número de muertos exceda de 8, si en una región ocurrieron 200 incendios en hoteles y moteles? (El promedio de muertos para 200 incendios es igual a 2 (1.5)=3).
b) Al ocurrir 200 incendios en cierta región y al exceder el número de muertos de 8. ¿Sospecha Usted que la razón promedio de muertos en la región seria más alta que la media nacional? Explique.
*Rta: .004; si.



Distribución de Probabilidad
GEOMETRICA.


61. Los registros indican que una cierta vendedora tiene éxito en formalizar una venta en 30% de sus entrevistas. Supóngase que una venta en cualquier otro momento es independiente. Cuál es, la probabilidad de que esta vendedora tenga que tratar con 10 personas antes de hacer su primera venta?
*Rta: 0.012

62. Si la probabilidad de que falle un motor durante cualquier pe­ríodo de una hora es p = 0,02 y si Y es el número de períodos horarios hasta la primera falla, hallar la media y desviación estándar de Y.
*Rta: 50; 49.497

63. Se supone que el 30% de los aspirantes para cierto trabajo industrial tiene un entrenamiento avanzado en programación. Los aspirantes son entrevistados, uno tras otro y son seleccionados al azar del conjunto de aspirantes. Determine la probabilidad de que se encuentre el primer aspirante con un entrenamiento avanzado en programación en la quinta entre­vista. Cuál es el número esperado de aspirantes que hay que entrevistar para encontrar el primero con un entrenamiento avan­zado?
*Rta: 0.072; 3.333

64. Un explorador de petróleo perforará una serie de pozos en cierta área para encontrar un pozo productivo. La probabilidad de que tenga éxito en una prueba es 0.2.

a) Cuál es la probabilidad de que el primer pozo productivo sea el tercer pozo perforado?
b) Cuál es la probabilidad de que el explorador no vaya a en­contrar un pozo productivo, si solamente puede perforar a lo más 10 pozos?
*Rta: 0.128; 0.8**10

65. Cuantos pozos espera que tendría que perforar el explorador del ejercicio anterior, antes de encontrar un pozo productivo? Ex­prese su respuesta en forma intuitiva.
*Rta: E=5; E=4 antes

66. Se estima que el 60% de una población de consumidores prefiere una marca particular de pasta de dientes A. ¿ Cuál es la probabilidad, al entrevistar a un grupo de consumidores, de que se tenga que entrevistar exactamente 5 personas para encontrar el primer consumidor que prefiere la marca A? Al menos 5 personas?
*Rta: 0.01536; 0.0256


67. Una agencia de seguros encontró que 1 de 100 reclamaciones de los seguros de propiedades excede de 1 millón (de dólares) si Y el número de demandas archivadas antes de encontrar la primera demanda por más de $ 1 millón, halle la media y desviación estándar de Y.
*Rta: 9


Distribución de Probabilidad
HIPERGEOMETRICA.

68. Un furgón contiene 20 computadoras electrónicas grandes, 2 de las cuales
estaban defectuosas. Si se seleccionan al azar tres computadoras del furgón:
Cuál es la probabilidad de que 2 de ellas tengan desperfectos?
*Rta: 0.016

69.. Un producto industrial se embarca en lotes de 20. La prueba para determinar si un articulo es defectuoso es costosa y por lo tanto, se examina solamente una muestra de 5 artícu­los de cada lote y se rechaza el lote si se encuentra más de un artículo defectuoso.
a. Si un lote contiene cuatro defectuosos, cuál es la pro­babilidad de que sea rechazado?
b. Cuál es el número promedio esperado de defectuosos en la muestra de 5? Hallar los intervalos al 95%.
*Rta: 0.2487; 1; 0.632 , 1+.79498


70. Considérese un fabricante de automóviles que compra los motores a una compañía donde se fabrican bajo estrictas especificaciones. El fabricante recibe un lote de 40 motores. Su plan para aceptar el lote consiste en seleccionar 8 y someterlos a prueba. Si encuentra que ninguno de los motores presenta serios defectos, el fabricante acepta el lote; de otra for­ma lo rechaza. Si el lote contiene dos motores con serios defectos, Cuál es la probabilidad de que sea aceptado?
*Rta: 0.6359

71. Es una caja de 10 fusibles, 2 de ellos están defectuosos. Si se examina una muestra aleatoria de 4 fusibles, cuál es la probabilidad de encontrar:
a). Ninguno defectuoso?
b). Uno defectuoso?
c). Uno ó menos defectuosos?
*Rta: 0.333; 0.533; 0.866

72. Suponga que un radioreceptor contiene seis transistores, de los cuales dos
son defectuosos. Se quitan y prueban tres transistores al azar. Si Y el número
de defectuosos encon­trados, en donde Y = 0, 1 o 2. Encuentre la
probabilidad. Ha­llar la media y la varianza para una muestra aleatoria n= 5.
*Rta: 0.2; 0.6; 0.2



Distribución de Probabilidad
NORMAL


73. Hallar el área bajo curva normal:
a) entre Z = 0 y Z = 1.2
b) entre Z = - 0.68 y Z = 0
c) entre Z = - 0.46 y Z = 2.21
d) entre Z = 0.81 y Z = 1.94
e) a la izquierda de Z = - 0.6
f) a la izquierda de Z = 0.68
g) a la derecha de Z = - 1.28
h) a la derecha de Z = 1.04
i) a la derecha de Z = 1.04 y a la izquierda de Z = - 0.6
j) a la derecha de Z = - 2.28 y a la izquierda de Z = 1.96

74. Encontrar el valor de Z:
a) El área a la derecha de Z es igual a 0.2266
b) El área a la izquierda de Z es igual a 0.0314
c) El área entre - 0.23 y Z es igual a 0.5722
d) El área entre 1.15 y Z es igual a 0.0730
*Rta: 0.75; - 1.86; 2.08; 1.62

75 Ciertos estudios demuestran que el consumo de gasolina de los autos medianos
tiene una distribución normal con un consumo medio de 25.5 km/galón y con
una desviación estándar de 4.5 km/galón.
a) Que porcentaje de autos medianos consumen 30 ó más km/galón?
b) Si un fabricante desee producir un automovil que tenga un mejor
rendimiento que el 95% de los autos existentes, cuántos km por galón
debe recorrer este nuevo auto?
*Rta: 0.1587; 32.9 km/galón

76. Si X se encuentra distribuida normalmente con un promedio igual a 10 y una desviación estándar igual a 2, calcule la probabilidad:
a) X < 12
b) X > 11
c) X > 9
*Rta: 0.8413; 0.3085; 0.6915

77. La medición del diámetro interior de un tubo de fundición esta normalmente distribuida con una media de 5.01 cm y una desviación estándar de 0.03 cm. Los límites de especificación son: 5.00 + 0.05 cm y 5.00 – 0.05 cm.
a) Que porcentaje de tubos de fundación es inaceptable?
b) Que diámetro mínimo debe tener el tubo, si se encuentra en el 12% del límite inferior?
*Rta: 0.1148, 4.97 cm.

78. Si el promedio de permanencia de una cuenta de ahorros es de 18 meses y una desviación estándar de 6.45 meses:
a) Si un depositante abre una cuenta de ahorros en un banco, cuál es la probabilidad de que aún haya dinero en esa cuenta después de 22 meses?
b) Cuál es la probabilidad de que la cuenta se haya cerrado antes de los dos años?
c) Cuántos meses durarán el 90% de las cuentas?
*Rta: 0.2676; 0.8238, 26.25 meses.

79. La duración de una bombilla esta normalmente distribuida con un promedio de 1.860 horas y una desviación estándar de 68 horas. Estimar el porcentaje de bombillas que duren:
a) más de 2000 horas;
b) menos de 1750 horas.
c) Cuántas meses durarán 92% de las bombillas?
*Rta: 0.0197; 0.0526; 1955.88 meses.

80. Se observo durante un largo periodo que la cantidad semanal gastada en mantenimiento y en las reparaciones en cierta fabrica tiene una distribución normal con una media de $400 y desviación estándar de $20. Si el presupuesto para la próxima semana es de $450, ¿Cuál es la probabilidad de que los costos reales sean mayores que la cantidad presupuestada?
*Rta: 0.0062

81. Una empresa metalmecánica produce rodamientos con diámetros que tienen una distribución normal con una media de 3.0005 pulgadas y una desviación estándar de 0.0010 pulgadas. Las especificaciones requieren que los diámetros estén en el intervalo 3.000 + 0.0020 y 3.000 – 0.0020 pulgadas. Se rechazan los cojinetes que quedan fuera Del intervalo y deben volverse a maquinar. Con la maquinaria actual, ¿qué fracción de la producción total será aceptada? ¿Rechazada?
*Rta: 0.9270; 0.0730

82. Los alambres que se utilizan en cierta computadora deben tener una resistencia entre 0.12 y 0.14 ohms. Las resistencias reales de los alambres producidos por la compañía A tienen una media de 0.13 ohms y una desviación estándar de 0.005 ohms.
a) Cuál es la probabilidad de que un alambre seleccionado al azar satisfaga las especificaciones?
b) Cuál es la probabilidad de que los cuatro satisfagan las especificaciones?
*Rta: 0.9544; 83

83. Se supone que los resultados de un examen tienen una distribución normal con una media de 78 y una varianza de 36.
a) Cuál es la probabilidad de que una persona que presenta el examen obtenga calificaciones mayores que 72?
b) Suponga que a los estudiantes que se encuentran en el 10% de la parte superior de la distribución se les asigna una calificación A. ¿Cuál es la calificación mínima que debe obtener un estudiante para tener una calificación A?
c) Cuál debe ser la mínima calificación aprobatoria si el aprobador pretende que el 28.1% de los estudiantes apruebe?
d) Se sabe que la calificación de un estudiante es mayor que 72, ¿Cuál es la probabilidad de que su calificación sea mayor de 8.4?
*Rta: 0.8413; 85.68; 81.48; 0.1886


Práctica STATGRAPHICS: Distribuciones de probabilidad
Probability Distributions.
Seguir los pasos 1 – 5.
Paso 6: Describe ® Distribution ® Probability Distributions
Paso 7: Probability Distributions
O Normal
O Binomial
O Poisson
O Hipergeometric
O Geometric Enter
Paso 8: En la tabla con el boton der. del Mouse
¯
Analysis Options Enter
Paso 9: Normal Options
Mean: Std. Dev.:
ð ð
Paso 10: Resumen.














martes, 11 de septiembre de 2007

ESTADISTICA INFERENCIAL, VI semestre, GUIA No: 1. ANALISIS DE REGRESION Y CORRELACION LINEAL

UNIVERSIDAD LIBRE

FACULTAD DE INGENIERÍA
DEPARTAMENTO DE AMBIENTAL

Asignatura: ESTADISTICA INFERENCIAL (02232)
Grupo: 6A
Profesora: ALLA GUTIERREZ

Guía No. 1

TEMA: ANALISIS DE REGRESION Y CORRELACION LINEAL.

Fecha: 2008


Objetivo:
Brindar a los estudiantes del curso los conocimientos fundamentales de las distintas ramas de la estadística, logrando introducir desde los conceptos básicos hasta los procedimientos de vanguardia con una visión practica que permita resolver problemas de las empresas en el ámbito de decisiones de riesgo, creando modelos estadísticos adecuados para una buena toma de decisiones.


Introducción:
Si se dispone de dos series de datos emparejadas, con frecuencia se desea conocer si ambas variables están relacionadas o si son independientes. Por ejemplo, ¿en qué medida, un aumento de los gastos en publicidad hace aumentar las ventas de un determinado producto? ó ¿será que existe alguna relación entre la talla y el peso de una persona?

A continuación, representaremos la relación entre dos variables mediante una gráfica llamada diagrama de dispersión, luego, estableceremos un modelo matemático para estimar el valor de una variable basándonos en el valor de otra, en lo que llamaremos análisis de regresión y finalmente estudiaremos el grado de relación existente entre las variables en lo que llamaremos análisis de correlación.


Competencias a desarrollar: Interpretativa

Desarrollar una visión amplia sobre el campo de estudio de la estadística y sus aplicaciones.
Distinguir entre la estadística descriptiva e inferencia estadística.
Estudiar las fuentes de datos, tablas y graficas.
Interpretar y describir las tendencias de datos y desarrollar la compresión de los conceptos básicos de probabilidad.
Facilitar la comprensión de los conceptos básicos de las distribuciones de probabilidad continuas y discretas.





Metodología:
Inducción: Explicación magistral en clase de teorías y conceptos, discusión y puesta en práctica de los mismos, por medio de ejercicios en clase y para que el estudiante realice su cuenta.
Profundización: Determinar y aplicar el modelo de regresión lineal en la predicción de valores.
Aplicar la regresión lineal para el pronóstico en series de tiempo.
Usar Excel en el modelo de regresión y correlación lineal.
Prácticas en la sala de computo utilizando Statgraphics o Excel.





Trabajo individual:


Buscar información y/o datos reales (mínimo 10 datos) de una variable Indep. Y Depend.

¡Presentar la Fotocopia o el original del fuente de los datos!

Sin utilizar programas de computador:
a) Plantear el tema, problema y objetivo.
b) Organizar los datos en una tabla.
c) Calcular el valor estimado, coef. de regresión y correlación (Interpretar cada resultado obtenido).
d) Graficar.
e) Resumir y analizar los resultados obtenidos.









Realización de ejercicios propuestos como tarea.

Perfeccionamiento:
Realizar el análisis de los resultados y presentar conclusiones.
Trabajo en grupos.
Prácticas en Statgraphics o Excel.

Socialización:
Individual o en parejas.

Evaluación:

Presentación de tareas. Presentación de trabajo, evaluación de conceptos.


Bibliografía


ANDERSON, David. SWEENEY, Dennis. WILLIAMS, Thomas. Estadística para administración y economía. México: Thomson, séptima edición. 1999.
BERENSON Mark. LEVINE David. KREHBIEL Timothy. Estadística para administración. México: Prentice Hall, Segunda edición. 2000.
CHAO LINCOLN. Estadística para ciencias administrativas. Bogotá: Mc Graw Hill, tercera edición. 1993.
MARTINEZ Bencardino Ciro. Estadística y Muestreo. Bogotá: Ecoe ediciones, décima edición. 2000.

SPIEGEK, Murray R. Teoría y problemas de Estadística. Bogotá: Mc Graw Hill.

MASSON y LIND. Estadística para administración y economía. Alfaomega.

PORTUS, Lincoyan. Curso práctico de estadística. Ed. Mc Graw Hill.

FREUND, John. Estadística Elemental. Ed Prentice Hall.

WALPONE y MYERS. Probabilidad y estadística. Ed. Mc Graw Hill.





REGRESIÓN Y CORRELACIÓN LINEAL

Si se dispone de dos series de datos emparejadas, con frecuencia se desea conocer si ambas variables están relacionadas o si son independientes. Por ejemplo, ¿en qué medida, un aumento de los gastos en publicidad hace aumentar las ventas de un determinado producto? ó ¿será que existe alguna relación entre la talla y el peso de una persona?

A continuación, representaremos la relación entre dos variables mediante una gráfica llamada diagrama de dispersión, luego, estableceremos un modelo matemático para estimar el valor de una variable basándonos en el valor de otra, en lo que llamaremos análisis de regresión y finalmente estudiaremos el grado de relación existente entre las variables en lo que llamaremos análisis de correlación.

La relación existente entre dos variables puede ser lineal, cuadrática, exponencial, logarítmica, etc. En este documento vamos a centrarnos en la posible relación lineal entre dos variables.





DIAGRAMA DE DISPERSIÓN

En un plano cartesiano se representan tantos puntos como pares de observaciones se tengan, correspondiendo cada punto a un par de observaciones; a esta representación gráfica se le denomina indistintamente diagrama de esparcimiento o nube de puntos.



RECTA DE REGRESIÓN

Se llama así a la recta que atraviesa la nube de puntos y que mejor se ajusta a ellos. El modelo matemático que describe una relación lineal cuando se estima el valor de Y en función de x esta dada así, Y = a + bx ó Y= Bx + A. (Esta última notación es la empleada en las calculadoras CASIO)

Donde:

Y es la variable que se va a estimar en función de otra variable (x) que se supone conocida. Se le denomina también como variable dependiente, explicada o predictando.

x es la variable cuyo valor supuestamente se conoce, se le denomina variable independiente, predictor o explicativa.

b es la pendiente o sea la que determina el ángulo de inclinación de la recta. Denominada coeficiente angular, cuantificando la cantidad que aumenta o decrece Y por cada unidad que aumente o disminuya la variable independiente x.

El coeficiente angular puede representarse así:

b > 0
b < b =" 0">a , corresponde al coeficiente de posición. Es el valor donde la recta intercepta al eje Y. Puede ser mayor, menor o igual a 0.

Se debe encontrar la línea que represente al conjunto de puntos, para lograr esto se deben determinar los coeficientes de regresión muestrales (Coeficiente angular y de posición) que son estimadores de los parámetros o coeficientes de regresión poblacional. Los valores de b y c corresponden a aquellos que hacen que los Yi sean lo más cercanos posibles a los valores observados yi, para determinarlos lo más indicado es aplicar el método de los mínimos cuadrados.

CRITERIO DE LOS MÍNIMOS CUADRADOS:

En el método de los mínimos cuadrados se emplean los datos de la muestra para determinar los valores de b y c que minimizan la suma de los cuadrados de las desviaciones entre los valores observados de la variable dependiente yi, y los valores estimados de la variable dependiente, Yi. Este criterio se puede expresar así:

Mín S( yi – Yi)2
Siendo
yi = valor observado de la variable dependiente para la i-ésima observación.
Yi = valor estimado de la variable dependiente para la i-ésima observación.

Aplicando el cálculo diferencial se puede demostrar que los valores de b y c que minimizan la anterior expresión se pueden determinar con las siguientes ecuaciones:




El valor de b, se puede obtener mediante otras fórmulas, la consulta de las cuales se deja como ejercicio.


PREDICCIÓN:

Uno de los fines al obtener la ecuación de regresión es el poder emplearla para predecir el valor de y para determinado valor de x. Se debe tener precaución al aplicar la ecuación de regresión para hacer predicciones fuera del intervalo de valores de la variable independiente, porque fuera de él no se puede asegurar que sea válida la misma relación.

En el análisis de correlación, se determina el grado de relación que puede haber entre dos variables. Este grado de correlación lo obtenemos mediante el cálculo del Coeficiente de correlación.

COEFICIENTE DE CORRELACIÓN:

Denominado coeficiente de correlación lineal de Pearson y simbolizado por r o R, es una medida de interdependencia de dos variables aleatorias, y su valor oscila entre –1 y +1.

Su cálculo se puede realizar mediante la aplicación de la siguiente fórmula:

Donde:
El valor de r se aproxima a +1 cuando la correlación tiende a ser lineal directa (mayores valores de x, significan mayores valores de y) y se aproxima a –1 cuando la relación tiende a ser lineal inversa.

Si no hay correlación de ningún tipo entre dos variables aleatorias, entonces tampoco habrá correlación lineal, por lo que r = 0. Sin embargo el que ocurra que r= 0, sólo nos dice que no hay correlación lineal, pero puede que la haya de otro tipo.

El siguiente diagrama resume el análisis del coeficiente de correlación entre dos variables:

Correlación negativa perfecta
Correlación negativa moderada
Ninguna correlación
Correlación positiva perfecta
Correlación positiva moderada
Correlación negativa fuerte
Correlación positiva fuerte
Correlación positiva débil
Correlación negativa débil
0
0.5
– 0.5
– 1
1



COEFICIENTE DE DETERMINACIÓN:

Denominamos coeficiente de determinación R2 como el coeficiente que nos indica el porcentaje del ajuste que se ha conseguido con el modelo lineal, es decir el porcentaje de la variación de Y que se explica a través del modelo lineal que se ha estimado, es decir a través del comportamiento de X. A mayor porcentaje mejor es nuestro modelo para predecir el comportamiento de la variable Y.

También se puede entender este coeficiente de determinación como el porcentaje de varianza explicada por la recta de regresión y su valor siempre estará entre 0 y 1 y es igual al cuadrado del coeficiente de correlación (r).

R2 = r2

Es una medida de la proximidad o de ajuste de la recta de regresión a la nube de puntos. También se le denomina bondad del ajuste.

1 - R2 nos indica qué porcentaje de las variaciones no se explica a través del modelo de regresión, es como si fuera la varianza inexplicada que es la varianza de los residuos.

EJEMPLO:

Los siguientes datos fueron recopilados por un gerente de ventas y corresponden a los años de experiencia y las ventas anuales de 5 de sus empleados:

Años de experiencia
6
12
15
21
24
Ventas anuales ($ millones)
38
68
83
113
128

Tomamos los años de experiencia como variable independiente.
A continuación se presentan los cálculos necesarios para determinar la ecuación de regresión con cuadrados mínimos.

vendedor i
xi
yi
xi yi
xi2
Yi2
1
6
38
228
36
1444
2
12
68
816
144
4624
3
15
83
1245
225
6889
4
21
113
2373
441
12769
5
24
128
3072
576
16384
Totales
78
430
7734
1422
42110

Aplicando la fórmula:


Se obtiene


b = 5.

El cálculo de la ordenada al origen (c) es el siguiente:


= 86 – 5(15.6)
= 8.


Por lo anterior, la función estimada de regresión, deducida con el método de los mínimos cuadrados, es

Y = 5X + 8

La pendiente de la función de regresión (b = 5) es positiva, lo cual implica que al aumentar los años de experiencia, las ventas también aumentan. De hecho, en este ejemplo, posemos llegar a la conclusión que las ventas aumenten en $ 5 millones por cada año de experiencia.

Si quisiéramos predecir el valor de las ventas anuales para un empleado que tiene 20 años de experiencia, el resultado sería:
Y = 5(20) + 8 = 108

En consecuencia, predeciríamos ventas anuales de 108 millones de pesos para este empleado.

A continuación, se analizará si el modelo desarrollado si es el adecuado para estimar y predecir.


Para hallar el coeficiente de correlación, se determinará primero la covarianza:


Se hallan las desviaciones típicas:


Luego el coeficiente de correlaci ón es



En este caso se tiene que las dos variables x (años de experiencia) y y (Ventas anuales) una relación lineal positiva perfecta. Esto es, todos los puntos de datos están en una recta con pendiente positiva (5).

El coeficiente de determinación en este caso también es igual a 1. Expresándolo de manera porcentual se tiene el 100%, lo cual significa que el 100% de la variación en las ventas se puede explicar con la relación lineal entre la experiencia y las ventas.




USO DE LA CALCULADORA EN LA REGRESIÓN LINEAL:

Si se dispone de una calculadora casio fx-3500p ó fx-3600p se pueden ejecutar los siguientes pasos, los cuales se van explicando tomando como modelo el ejemplo resuelto:

1. Oprimir las teclas mode 2 y en la pantalla debe aparecer LR (Regresión Lineal).

2. Con las teclas INV AC se borra la información que puede haber de trabajos anteriores. Para constatar el borrado, oprimir las teclas KOUT 3 y debe aparecer 0 en la pantalla. Si aparece otro número se repite el procedimiento.

3. Se introduce la información con la tecla [(... para la variable X, y con RUN para la variable Y. Teniendo en cuenta que primero es X1, luego [(..., a continuación Y1 RUN. Luego X2 [(... , Y2 RUN, y así sucesivamente. No debe haber equivocación al introducir los datos.

4. Introducida la información se comprueba, en parte, si la operación fue realizada correctamente oprimiendo KOUT 3, debe aparecer el número de parejas introducidas, en este caso 5.

5. Con la tecla KOUT y las teclas (1, 2, 3, 4, 5, 6) se obtiene lo que aparece en negrilla debajo de cada una de las teclas, así:
KOUT 1 = Sxi2 = 1422.
KOUT 2 = Sxi = 78.
KOUT 3 = n = 5.
KOUT 4 = Syi2 = 42110.
KOUT 5 = Syi = 430.
KOUT 6 = S xi yi = 7734.

6. Con la tecla INV y las teclas del 1 al 9 se obtiene lo que aparece señalado en rojo o anaranjado debajo de cada tecla.
INV 1 = media de X = 15.6
INV 2 = nsx = nS x = 6.41 (6.406246951). Corresponde a la desviación típica, elevando al cuadrado se obtiene la varianza Sx2 = 41.04
INV 3 = n-1sx = n-1S x = 7.16 (7.162401832)
INV 4 = media de Y = 86
INV 5 = nsy = nS y = 32.03 (32.03123476). La varianza Sy2= 1026
INV 6 = n-1sy = n-1S y = 35.81 (35.81200916).

El coeficiente de posición c se obtiene con INV 7 siendo igual a 8 y el coeficiente angular b con INV 8 igual a 5, con lo cual se tiene la función estimada de regresión Y = 5x + 8.

El coeficiente de correlación se obtiene con INV 9 siendo igual a 1.






APLICACIÓN DE EXCEL EN LA REGRESIÓN LINEAL:


Excel dispone de funciones que permiten trabajar con coeficientes correlación, regresión y otros conceptos sobre variables multidimensionales.

Para ver las funciones de la categoría Estadística, se hace clic sobre el icono insertar función, fx, de la barra de fórmulas (o se elige la opción Insetar función del menu Insertar), en la opción categoría de la función se elige Estadísticas, presentándose todas las funciones de dicha categoría en el cuadro Nombre de la función.





Para el ejemplo que venimos trabajando:



A
B
1
xi
yi
2
6
38
3
12
68
4
15
83
5
21
113
6
24
128




Si en el cuadro Nombre de la función hacemos clic sobre una función, por ejemplo la función COEF.DE.CORREL, se obtiene el siguiente cuadro. Una vez completados los argumentos (Variables X e Y) se obtiene el resultado en la parte inferior. Al pulsar Aceptar, la fórmula y su resultado se insertan en la celda activa de la hoja de cálculo.



A continuación, se presenta una relación de las funciones de Excel para correlación y regresión, acompañada de los resultados para el ejemplo que venimos trabajando para las variables X e Y de la hoja de cálculo cuyos valores ocupan los rangos A2:A6 y B2:B6. Para algunas funciones se presenta la caja correspondiente.










FUNCIÓN
VALOR QUE DEVUELVE
RESULTADO EN EL EJEMPLO
COVAR(X;Y)
Devuelve la covarianza de x e y definida por
205.2
COEF.DECORREL(X;Y)
Devuelve el coeficiente de correlación de x e y.
1
COEFICIENTE.R2(Y;X)
Da el coeficnete de determinación de y en x.
1
PENDIENTE(Y;X)
Da la pendiente de la línea de regresión de y sobre x. (Coeficiente angular)
5
INTERSECCION.EJE(Y;X)
Da la ordenada en el origen de la línea de regresión de y sobre x. (Coeficiente de posición)
8
PRONOSTICO(x; Y;X)
Halla la predicción según la línea de regresión de y sobre x para el valor k de la variable independiente.
Si x=20 entonces
y = 108




EJERCICIOS:



1. A continuación se presentan cinco observaciones de dos variables, X y Y.

xi
2
4
7
9
11
yi
24
30
31
36
40

a. Trace un diagrama de dispersión de datos.
b. ¿Que indica el diagrama trazado en el inciso a acerca de la relación entre las dos variables?
c. Trate de aproximar la relación entre x y y.trazando una recta que pase por los datos.
d. Forme la ecuación estimada de regresión calculando los valores de b y c.
e. Aplique la ecuación estimada de regresión para predecir el valor de y cuando x = 6.


2. Se ha realizado una observación a cinco familias respecto a el número de integrantes (x) y sus gastos mensuales (y) en agua en miles de pesos:


xi
2
5
7
8
10
yi
30
42
55
75
97

a. Hallar la recta de regresión.
b. ¿Cuanto se espera que gaste una familia si esta constituida por 6 personas?
c. Hallar el coeficiente de correlación y concluir.
d. Hallar el coeficiente de determinación y concluir.


3. Se dispone de 7 parejas de datos para los cuales se sabe:

n = 7
å x = 420,6
å y = 5958,7
å x y = 500073,09
å x 2 = 35119,7
å y 2 = 7213831,23

a. Hallar la recta de regresión.
b. Hallar el coeficiente de correlación y concluir.
c. Hallar el coeficiente de determinación y concluir.


4. En el semestre inmediatamente anterior el profesor de Estadística registro los puntajes obtenidos por sus estudiantes en una prueba inicial (de conocimientos elementales) y la nota definitiva en la materia en dicho semestre. Los resultados fueron los siguientes



Estudiante
1
2
3
4
5
6
7
8
9
10
Puntaje Prueba inicial
39
43
21
47
2
25
32
3
4
15
Definitiva
35
37
29
42
29
31
33
32
36
25


a. Elabore el diagrama de dispersión.
b. Obtenga la ecuación de la recta de regresión.
c. Si un estudiante obtuvo en la prueba inicial 45, ¿cuál sería la nota definitiva que se espera obtenga al final del semestre?
d. Si un estudiante obtuvo en definitiva 4.0, ¿qué edad puntaje habría obtenido en la prueba inicial?




5. Nota: Use Excel o una calculadora para resolver el siguiente problema:
Una compañía que fabrica partes para maquinaria quiere desarrollar un modelo para estimar el número de horas - trabajador requeridas para corridas de producción de lotes de diversos tamaños. Se selecciona una muestra aleatoria de 18 corridas de producción (2 para cada tamaño de lote de 10, 20, 30, 40, 50, 60, 70, 80 y 90) y se obtienen los siguientes resultados:



TAMAÑO DEL LOTE
HORAS – TRABAJADOR
TAMAÑO DEL LOTE
HORAS – TRABAJADOR
10
30
50
112
10
40
60
128
20
50
60
135
20
55
70
148
30
73
70
160
30
67
80
170
40
87
80
162
40
95
90
180
50
108
90
190



a. Grafique el diagrama de dispersión.
b. Suponga una relación lineal y utilice al método de mínimos cuadrados para encontrar los coeficientes de regresión A y B.
c. Interprete el significado de la ordenada A y la pendiente B en este problema.
d. Pronostique el número promedio de horas – trabajador requeridas para una corrida de producción con un tamaño de lote de 45.
e. ¿Por qué no es adecuado predecir el número promedio de horas – trabajador para una corrida de producción de un lote de tamaño 100? Explique.
f. Suponga que las horas – trabajador para el lote de tamaño 60 son 117 y 119. Resuelva los incisos a. y d. con estos valores y compare los resultados.