lunes, 20 de abril de 2009

Distribuci'on Binomial Negativa (Pascal)

Distribución de Probabilidad
BINOMIAL NEGATIVA (Pascal)

73. Si el 90% de producción está conforme con las normas de calidad, cuál es la probabilidad de que el lote 20 será el tercer lote defectuoso?
*Rta: 0.0285

74. Un estudio geológico indica que en un pozo exploratorio la probabilidad de encontrar el petróleo es de 0,20. Encuentre la probabilidad de que el tercer encuentro de petróleo ocurra en el quinto pozo que se perfora.
*Rta: 0.0307

75. El 10% de las máquinas producidas en una línea de montaje resultan defectuosas.
a). Cuál es la probabilidad de encontrar la primera máquina defectuosa en la segunda prueba?
b). En la quinta prueba?
c). En la quinta prueba o antes?
*Rta: 0.09; 0.0437; 0.9914

76. Con los datos del ejercicio anterior, obtenga la media y la varianza del número de la prueba en la cual se encuentra:
a). La primera máquina en buenas condiciones.
b). La tercera máquina en buen estado.
*Rta: 1.11, .1235; 3.33, .3704

77. Con los datos del ejercicio anterior, cual es la probabilidad de tener que probar por lo menos dos máquinas más antes de encontrar la primera máquina operable dado que las dos primeras máquinas probadas resultaron defectuosas?
*Rta: 0.10

domingo, 27 de enero de 2008

TIPOS DE MUESTREO Y DETERMINACIÓN DE TAMAÑO DE MUESTRA.

Iniciando nuestra investigación hay que tener en cuenta los siguientes pasos:
1. Valorar las condiciones de estudio y tipo de información que podemos obtener (datos objetivos: archivos, base de datos, mediciones etc. o datos subjetivos: encuesta).
2. Definir el tipo de muestreo mas apropiado para nuestros datos.
3. Determinar tamaño de la muestra (para muestreos probabilísticas)
4. Estimar a los parámetros de la población (muestreo probabilístico) o hacer comentarios sobre la población (muestreo no probabilístico).
5. Realizar aplicaciones estadísticas: Estadísticos Descriptivos, Pruebas de Hipótesis, Análisis de Varianza, Análisis Factorial, Modelos Lineales, Diseño Experimental, Datos de Interés etc.
6. Analizar los resultados y hacer conclusiones.

En la actualidad, el tratamiento estadístico se realiza mediante varios programas estadísticos de computación especialmente preparados para ello. El estudio se va a realizar por medio de los programas SPSS (Statistical Package for the Social Sciences) y Microsoft EXCEL.
Es evidente que el investigador debe tener muy claro los objetivos de la investigación, los procedimientos estadísticos apropiados para las variables de estudio (datos) y cómo quiere los resultados.

Muestreo
Podemos definir dos tipos de poblaciones: poblaciones finitas y poblaciones infinitas. Población es finita cuando se conoce el tamaño total de elementos y población es infinita cuando no se conoce el tamaño o es imposible determinarlo.

La mayoría de las poblaciones son demasiado grandes para realizar una investigación e implican mucho tiempo, un equipo de trabajo enumerado y unos costos muy elevados lo que nos lleva a tomar una decisión de seleccionar una parte pequeña de la población llamada la muestra.

Para elegir una muestra es importante primero definir el tipo de Muestreo que se adapte a las condiciones de nuestro trabajo. Hay dos tipos de Muestreo: muestreo probabilístico (muestreo Aleatorio) o muestreo no probabilístico (muestreo no Aleatorio).

Muestreo probabilístico (muestreo Aleatorio): requiere de listado completo de los elementos que componen una población para que todos los elementos de la población tengan la misma probabilidad de ser incluidos en la muestra. Es indispensable determinar el tamaño de la muestra.
Este método es preferible porque los resultados obtenidos en la muestra son validos para estimar a los parámetros de la población (se estima que la población tiene aproximadamente el mismo
Muestreo no probabilístico (muestreo no Aleatorio): no requiere de listado de los elementos que componen una población, no se conoce la probabilidad de ser incluido en la muestra. No se determina el tamaño de la muestra ya que no existen pruebas de que tales muestras sean representativas de las poblaciones sobre las que se quiere hacer una estimación. Normalmente los estimadores obtenidos no serán muy parecidos a los parámetros de la población, por lo siguiente no se tiene en cuenta la determinación de tamaño de la muestra, simplemente hay que tratar de que sea representativa sin tratar de obtener cantidades que se correspondan con las proporciones de la población. Se busca tener la suficiente información para poder hacer comentarios sobre la población.
Los resultados obtenidos solo son validos para esos determinadas condiciones en el momento actual.

comportamiento el que hallamos en la
muestra).

Las formas más conocidas muestreo probabilístico:

Muestreo aleatorio simple
Cada elemento de la muestra debe tener la misma y conocida probabilidad de ser seleccionado. Se trata de hacer una lista completa y enumerada de la población. Asignar, fijar y ordenar los números aleatorios mediante una tabla o una función generadora de números aleatorios por computadora, por medio de los cuales se seleccionan los elementos que van a formar la muestra. (Ejemplo: seleccionar un grupo o una muestra de estudiantes del total de matriculados en la facultad de ingeniería).

Muestreo, aleatorio sistemático
En una lista completa se selecciona al azar el primer elemento al cual se suma sucesivamente el número fijo que representa el tamaño del intervalo hallándose por medio de: N/n (siendo N el tamaño de la población y n el tamaño de la muestra) hasta obtener los demás elementos hasta completar el tamaño de la muestra. (Ejemplo: Tamaño del intervalo= N/n=100/20=5. Cada quinto dato a partir del primer elemento elegido entrará a la muestra hasta completar 20 datos).

Muestreo aleatorio estratificado
Este método consiste en dividir la población en estratos o grupos homogéneos y luego tomar una muestra aleatoria simple de cada grupo o estrato. Es preferible, en cuanto sea posible, usar la misma fracción de muestreo dentro de los estratos, realizando un muestreo aleatorio estratificado proporcionado; en el caso contrario se usan diferentes fracciones de muestreo en los estratos y se denomina como muestreo aleatorio estratificado desproporcionado. (Ejemplo: seleccionar de a un grupo o de a una muestra de estudiantes matriculados en cada ingeniería en particular: Ambiental, Sistemas, Industrial, etc.).

Muestreo aleatorio por conglomerados
Es muy similar al muestreo estratificado. Para superar las dificultades del muestreo realizado sobre una población en una amplia o dispersa área geográfica, ésta se divide en unidades relativamente pequeñas llamadas conglomerados (en general siguiendo los límites geográficos o áreas de interés para la investigación), seleccionando una muestra aleatoria de conglomerados. Al estudio entran todos los elementos que componen cada conglomerado elegido. (Ejemplo: distritos, barrios o una zona silvestre en varias áreas compactas).


Las siguientes formas son más utilizadas en muestreo no probabilístico:
Muestreo intencional o por conveniencia:
Las unidades de muestreo son accesibles, convenientes y fáciles de medir. Se seleccionan casos típicos de una población, actuando en forma intencional, a criterio de un experto. Se puede obtener una gran cantidad de encuestas con rapidez, verificando antes de encuestar si cumple con los criterios que hemos establecido.

Muestreo casual
Se trata de entrevistar a personas de forma casual, sea en la calle o por teléfono. También se utiliza por las televisiones, radios y empresas de investigación de mercado.
Muestreo por cuotas
Hay que decidir las características específicas sobre las que se basarán las cuotas (como ser edad, religión, educación, adultos, niños, etc.). Se especifica la cantidad de unidades o de entrevistas a realizar a personas que reúnan determinadas características (por ejemplo: hombres, educación superior, casados, entre 30 y 35 años).



Determinación del tamaño de la muestra (Muestreo Probabilístico o Aleatorio):

• Para una población infinita:
a) n = z2 pq/e2 (np  5 y nq  5)
b) n = 1/e2 (al sustituir en (a) por:  = 0,05, el valor de z = 1,96  2, y p = q = 0,5).

Ejemplo:
Para (b) si aceptamos e = 0.05: n = 1/(0.052 ) = 400
e = 0.07: n = 1/(0.072 ) = 204
e = 0.10: n = 1/(0.102 ) = 100
e = 0.12: n = 1/(0.122 ) = 69


• Para una población finita:
a) n = Nz2 pq/[e2 (N - 1) + z2 pq] (np  5 y nq  5)
b) n = N/[e2 (N -1) +1] (al sustituir en (a) por:  = 0,05, el valor de z = 1,96  2, y p = q = 0,5).

Ejemplo:
Para (b) si aceptamos: e = 0.05 y N = 500: n = 500/[ 0.052 (500 – 1) + 1]) = 222
e = 0.10 y N = 500: n = 500/[ 0.102 (500 – 1) + 1]) = 83
e = 0.10 y N = 1000: n = 1000/[ 0.102 (1000 – 1) + 1]) = 91

Donde:
N - tamaño de la población.
n - tamaño de la muestra.
p - probabilidad de éxito, proporción de la variable de interés (se obtiene de los estudios anteriores sobre el mismo tema o de realización de una prueba piloto con una muestra pequeña, estimando el valor de p o se acepta que p = q = 0,5 si no se tiene ninguna información).
q = (1 – p) - probabilidad de fracaso.
 - el nivel de confianza elegido.
Z el valor de z.
e - error de la estimación: 1%, 2%, 5%, 10% etc. (se aplican diferentes márgenes de error para determinar el tamaño de la muestra; entre mas grande aceptamos el error mas pequeña será la muestra).

DISTRIBUCION DE FRECUENCIAS.

FACULTAD DE INGENIERÍA


Asignatura: ESTADISTICA DESCRIPTIVA
Profesora: ALLA GUTIERREZ

TEMA: DISTRIBUCIÓN DE FRECUENCIAS

Fecha: 2011


Objetivo:

Profundizar y afianzar los conocimientos estadísticos creando un ambiente de acceso relativamente sencillo a los programas estadísticos, utilizando un enfoque pedagógico al proporcionar una explicación del uso del programa, desarrollando nuevas habilidades en el estudiante que satisfacen en la necesidad de resolver problemas de la realidad y investigación.



Introducción:

La estadística desempeña un importante papel en todas las áreas de investigación y la toma de decisiones de nivel empresarial. Proporciona herramientas que le permitan al ingeniero plantear modelos que faciliten la tarea de investigación y proyección de las actividades futuras.
Fortaleciendo las bases fundamentales de la Estadística con el uso de programas estadísticos y las hojas de cálculo, forma parte integral del proceso de aprendizaje, motivando a los estudiantes y elevando su nivel de conocimiento que lo llevara a ser un profesional eficiente.


Competencias a desarrollar: Interpretativa

Capacidad de reconocer conceptos básicos de la estadística, calculando, aplicando y analizando medidas de tendencia central y de dispersión.

Capacidad para comprender la importancia de la estadística como herramienta de investigación, análisis e intervención de la Ingeniería Ambiental en la solución de problemas de la comunidad y su entorno ambiental.




Metodología:

Inducción: Resolver los ejercicios propuestos analizando resultados de acuerdo a las propiedades y conceptos básicos de la estadística.
Profundización: Prácticas en la sala de computo utilizando Statgraphics o Excel.


Trabajo individual:
Realización del Taller.

Perfeccionamiento:
Buscar información y/o datos reales relacionados con Ing. Ambiental,(mínimo 50 datos) de una variable continua.
Plantear el problema y objetivo.
Realizar el análisis de los resultados y presentar conclusiones.


Socialización:
Individual o en parejas.

Evaluación:

Presentación de informe: Individual o en parejas.


Bibliografía

CHAO Lincoln. Estadística para las ciencias administrativas. Mc Graw Hill.
MARTÍNEZ B, Ciro. Estadística: Apuntes y 600 problemas resueltos.
WEBSTER L. Allen. Estadística Aplicada a los negocios y la economía. Mc Graw Hill.



Ejercicios Propuestos: DISTRIBUCION DE FRECUENCIAS.

VARIABLE DISCRETA

1. No. de hijos por familia (Realizar una encuesta en el salón de clase).
a) Organizar los datos obtenidos en una tabla da frecuencias.
b) Graficar diagramas de frecuencias absolutas, relativas, absolutas acumuladas y relativas acumuladas.

2. Con el siguiente texto organice una tabla de frecuencias, según el número de letras que componen cada palabra. Grafique los diagramas correspondientes.

La motivación es necesaria para que ocurran las respuestas y, por lo tanto, afecta indirectamente a lo que se aplica y aprende, pero, el aprendizaje en sí no requiere de motivación. En gran medida, el compromiso más importante es el de la persona. El éxito o el fracaso de su disposición a ser un gran hombre, parte de él mismo.

3. Los siguientes datos corresponden al número de piezas defectuosas por cada mil artículos hallados en la revisión del control de calidad en una fábrica:
5 2 9 6 4 2 7 6 11 5 8 3 6 9 11 4 7
7 9 8 5 3 7 9 8 7 5 4 5 7 5 6 7 9
5 7 7 5 5 3 7

a) Organizar los datos obtenidos en una tabla da frecuencias.
b) Graficar los diagramas de frecuencias absolutas, relativas, absolutas acumuladas y relativas acumuladas.


VARIABLE CONTINUA

4. Realizar una encuesta en el salón de clase, tomando como datos la ESTATURA de los estudiantes del grupo.
a) Organizar los datos obtenidos en una tabla da frecuencias.
b) Graficar Histograma de frecuencias absolutas y relativas, Polígono de frecuencias y Polígono (Ojiva) de frecuencias absolutas acumuladas y relativas acumuladas.


5. Realizar una encuesta en el salón de clase, tomando como datos el PESO de los estudiantes del grupo.
a) Organizar los datos obtenidos en una tabla da frecuencias.
b) Graficar Histograma de frecuencias absolutas y relativas, Polígono de frecuencias y Polígono (Ojiva) de frecuencias absolutas acumuladas y relativas acumuladas.

6. Saldos promedios ( en miles de pesos) de las cuentas que se cancelan antes de cumplir un año :

8 12 17 21 25 29 33 49
32 44 51 34 59 63 37 43
39 65 73 57 83 89 68 95
46 86 54 76 61 48 55 52
59 77 79

a) Organizar los datos en una tabla da frecuencias.
b) Graficar Histograma de frecuencias absolutas y relativas, Polígono de frecuencias y Polígono (Ojiva) de frecuencias absolutas acumuladas y relativas acumuladas.

7. Areas en metros cuadrados, de salones de clase de una universidad:

20.4 23.8 28.6 43.7 43.3 39.4 25.6
28.9 29.3 31.6 28.8 48.0 40.7 29.5
31.9 32.1 32.9 31.6 31.8 28.9 28.3
33.4 33.7 43.6 33.0 33.3 34.0 30.1
38.2 39.0 34.7 34.8 35.0 32.3 32.8

a) Organizar los datos en una tabla da frecuencias.
b) Graficar Histograma de frecuencias absolutas y relativas, Polígono de frecuencias y Polígono (Ojiva) de frecuencias absolutas acumuladas y relativas acumuladas.


MEDIDAS DE TENDENCIA CENTRAL

8. Con los siguientes datos, no agrupados, calcular media aritmética, mediana y moda:
a) 5 2 9 6 4 2 7
b) 7 9 8 5 3 7 9 8 7 5
c) 33.4 34.0 33.8 34.7 34.3 33.7 34.0 34.9

9. Con los datos agrupados, de los ejercicios 1 a 7, calcular media aritmética, mediana y moda; cuartiles, deciles y percentiles.


MEDIDAS DE DISPERSION

10. Con los datos del ejercicio 8, calcular varianza y desviación estándar.

11. Con los datos agrupados de los ejercicios 1 a 7, calcular varianza, desviación estándar, intervalos de confianza y coeficiente de variación.



TALLER


Los siguientes datos corresponden a los tiempos (en minutos) de utilización de Internet de una cuenta particular.

6.12 14.08 5.45 47.21 12.51 97.15 42.36
48.02 12.13 10.10 57.23 39.18 68.47 39.25
25.00 32.00 7.21 28.31 25.07 58.45 45.56
37.05 19.15 18.52 47.34 53.12 67.32 47.46
13.08 72.01 18.54 16.35 11.48 57.31 33.23
18.10 32.09 15.23 35.11 10.25 46.20 46.21
18.00 8.12 25.48 22.28 49.56 59.35 41.02
13.50 7.14 27.33 48.15 11.21 53.23 37.54
12.30 46.11 33.29 7.17 34.11 86.25 33.32
13.15 28.15 34.45 34.49 13.00 32.51

Sin utilizar programas de computador:

a) Organizar los datos en una tabla da frecuencias.
b) Calcular las medidas de tendencia central y Asimetría.
c) Calcular las medidas de dispersión y Curtosis..
d) Graficar Histograma de frecuencias absolutas y relativas, Polígono de frecuencias y Ojiva de frecuencias absolutas acumuladas y relativas acumuladas.
e) Resumir y analizar los resultados obtenidos.




TRABAJO INDIVIDUAL: DISTRIBUCIÓN DE FRECUENCIAS


Buscar información y/o datos reales (mínimo 50 datos) de una variable continua.

¡Presentar la Fotocopia o el original de fuente de los datos!

Sin utilizar programas de computador:
a) Plantear el problema y objetivo.
b) Organizar los datos en una tabla da frecuencias.
c) Calcular las medidas de tendencia central y Asimetría (Interpretar cada resultado).
d) Calcular las medidas de dispersión y Curtosis (Interpretar cada resultado).
e) Graficar Histograma de frecuencias relativas, Polígono de frecuencias y Ojiva de frecuencias relativas acumuladas.
f) Analizar los resultados obtenidos.



Práctica STATGRAPHICS O EXCEL:

Verificar los resultados obtenidos con el uso del programa STATGRAPHICS o Excel en la sala de cómputo con la asesoría del profesor.





GUIA STATGRAPHICS: Distribución de frecuencias.
Frequency Tabulation


Paso 1: INICIO ® Programas ® STATGRAPHICS Plus 5.1 ® Sgwin

Paso 2: StatWizard
· Analyze Existing Data or Enter New Data Enter

Paso 3: StatWizard – Data localition

· I Want to Enter New Data Enter

Paso 4: STATGRAPHICS Plus
ACEPTAR Enter

Paso 5: Modify Column
Name: Col 1
Type
· Numeric Enter

Paso 6: Entrar Datos en la Col 1

Paso 7: Describe ® Numeric Data ® One-Variable Analysis Enter
¯
Summary Statistics Options Enter
 Average ΠMin
ð Median ð Max
ð Mode ð Range
ð Variance
ð Std. Deviation Enter

Paso 8: One-Variable Analysis

Col 1 ¨ Col 1
­ ­
Enter Enter

Paso 9: Ver resumen
Ver gráficas

CONCEPTOS BASICOS DE ESTADISTICA.

FACULTAD DE INGENIERÍA

Asignatura: ESTADISTICA DESCRIPTIVA
Profesora: ALLA GUTIERREZ


TEMA: GENERALIDADES DE LA ESTADÍSTICA

Fecha: 2011


Objetivo:
Leer y analizar los conceptos básicos que le permitan al estudiante
reconocer el significado de la estadística, explicar lo que significa estadística descriptiva y estadística inferencial, diferenciar entre una variable cuantitativa y una variable cualitativa, distinguir entre una variable discreta y una variable continua.



Introducción:

La estadística es un conjunto de teorías y métodos que han sido desarrollados para tratar la recolección, el análisis y la descripción de datos muestrales con el fin de extraer conclusiones útiles, su función primordial es apoyar al investigador al decidir sobre el parámetro de la población de que procede la muestra.

Competencias a desarrollar: Interpretativa

Capacidad de reconocer conceptos básicos de la estadística, explicar lo que significa estadística descriptiva y estadística inferencial y su entorno ambiental.

Capacidad para comprender la importancia de la estadística como herramienta de investigación, análisis e intervención de la Ingeniería Ambiental en la solución de problemas de la comunidad y su entorno ambiental.

Metodología:
Inducción: Leer la Historia y Generalidades analizando los conceptos básicos de la estadística.
Profundización: En la parte final de la guía encuentras una serie de ejercicios, los cuales hay que responder de la forma propuesta.

Trabajo individual:
Leer la Historia y Generalidades analizando los conceptos básicos de la estadística. Responder los ejercicios propuestos.

Perfeccionamiento:
Discusión y análisis en grupos de los términos y conceptos básicos consultados y ejercicios resueltos.
Buscar los ejemplos en la solución de problemas de la comunidad y su entorno ambiental.



Socialización:
Cada grupo se encarga de responder de a varias preguntas abriendo discusión entre opiniones de los demás grupos.

Evaluación:

· Participación en clase
· Presentación de informe: en grupos


Bibliografía

CHAO Lincoln. Estadística para las ciencias administrativas. Mc Graw Hill.
MARTÍNEZ B, Ciro. Estadística: Apuntes y 600 problemas resueltos.
WEBSTER L. Allen. Estadística Aplicada a los negocios y la economía. Mc Graw Hill.





HISTORIA

El estudio de la Estadística ha sufrido cambios sustanciales desde sus comienzos. Merecen mención especial dos fuentes de tendencias de desarrollo. Primeramente, el origen de la Estadística puede advertirse ya en la necesidad de datos numéricos en los estados que surgían de la sociedad medieval en la Europa Occidental. Al transformarse la sociedad medieval en el estado político, el nuevo gobierno necesitaba información sobre los recursos del país para poder tener éxito. Así pues era obligado para los nuevos gobernantes el obtener descripciones numéricas, tales como el número de ciudadanos de las diversas unidades políticas bajo su jurisdicción: ciudades, condados y provincias. El término Estadística, que se deriva del latín status, que significa estado en el sentido político, se empleo entonces para referirse a la recolección y descripción de tales datos del estado. La necesidad de acopiar y analizar datos numéricos impulsó a desarrollar métodos para facilitar la labor, que era lo que constituía lo más considerable de la Estadística hasta la era moderna.

No es necesario enumerar todos los que contribuyeron al desarrollo de los métodos estadísticos. Pero se ha de mencionar sin embargo al belga Adolph Quetelet (1796 - 1874), que fue el primero en aplicar métodos modernos a conjuntos de datos. Suele llamarse a Quetelet "padre de la Estadística moderna" por su continua insistencia en la importancia de aplicar métodos estadísticos. Sus distinguidas contribuciones a la práctica y a la metodología estadísticas cubrieron muchos campos de la estadística oficial, tales como los censos, el desarrollo de la uniformidad y comparabilidad de estadísticas entre las naciones, y la organización de la primera conferencia Estadística internacional, La Comisión Central de Estadística, que Quetelet fundó, fue el modelo para instituciones similares en otros países.

Otra fuente de la Estadística se encuentra en la atención prestada al juego en el siglo XVII. Debido a la tolerancia y al prestigio de que disfrutaban varias formas de juegos para recreación de la nobleza de Inglaterra y Francia durante este período, se suscitó un interés intenso por los juegos de azar, cosa que sin proponérselo, llevó al desarrollo de la teoría de las Probabilidades. Y entre tanto, existía ya una tecnología lo bastante avanzada como para suministrar dispositivos para juegos, tales como dados y cartas, con suficiente refinamiento como para desafiar la aguda imaginación del matemático. El jugador depende del azar o posibilidad de error asociada a una línea de acción dada; el resultado efectivo de una prueba es cosa desconocida, pero la teoría de las Probabilidades da el número esperado de ocurrencia de un suceso particular en un número muy elevado de pruebas. La Estadística moderna se interesa enormemente por dicha teoría.

Al mismo tiempo, los estudios de Probabilidades requerían el tratamiento matemático de los errores en las mediciones, de lo que resultaron teorías y métodos desarrollados para describir las configuraciones de distribución de tales errores. Ya desde el siglo XVIII se había observado que las medidas repetidas de un cierto objeto o fenómeno daban lugar a una configuración en la distribución de los errores que tenía la forma de una curva acampanada. La curva es simétrica con respecto al valor verdadero, lo cual significa valor de error nulo, que queda en el centro. Es simétrica porque las desviaciones negativas y positivas respecto del centro son iguales en magnitud y frecuencia. Cuanto mayores las derivaciones menores serán las frecuencias.

A propósito de la evaluación de los errores de observación en astronomía, se hizo un descubrimiento de importancia mayor para la estadística. La distribución de errores resultante con su forma de campana Y su simetría se llama curva normal de errores. También se dice distribución gaussiana de errores, por el nombre de su descubridor Karl Frierich Gauss (1777 - 1855).

Entre los contemporáneos de Quetelet y Gauss que contribuyeron al avance de la estadística como ciencia estaban Florence Nightingale (1820 - 1910) Y Francis Galton (1822 - 1911). Florence Nightingale creía firmemente en los métodos Estadísticos. Sostenía que todo director debería guiarse por el conocimiento estadístico si quería tener éxito y que los políticos y los legisladores fracasaban frecuentemente por la insuficiencia de sus conocimientos estadísticos. Galton, como su primo Charles Darwin, se interesó profundamente en el estudio de la herencia, a la cual aplicó métodos estadísticos. Entre sus principales contribuciones se encuentra el haber desarrollado métodos tan fundamentales como la regresión y la correlación.

La obra de Galton fue estímulo para una serie de investigaciones de Karl Pearson (1857 -1936), el cual inició la publicación del periódico Bíométrica, que ha influido profundamente en el desarrollo de la estadística. Muchos de los métodos Estadísticos fueron descubiertos por Pearson, siendo el más importante la distribución ji - cuadrado, que encontró en 1990.

En el siglo XX, quienes han contribuido de manera más descollante al estudio de la estadística han sido William S. Gosset (1876 - 1937) Y Sir Ronald Fisher (1890 - 1962). Gosset, que escribía bajo el seudónimo "Student", dedujo la distribución t y su contribución especial fue en el campo de la teoría de pequeñas muestras. Fisher halló conocida distribución F y aportó contribuciones continuamente hasta 1962, muchas de ellas han tenido grande influencia en los modernos procedimientos Estadísticos. Si bien su trabajo era sobre todo en los campos de la biología, genética y agricultura, su impacto ha llegado a todas las aplicaciones de la Estadística.


GENERALIDADES

En la vida diaria los diversos fenómenos de orden económico, social, político, educacional, e incluso biológico, aparecen, se transforman, y finalmente desaparecen. Para tan abundante y complejo material es preciso tener un registro ordenado y continuo de conseguir en un momento dado los datos necesarios para un estudio de lo que ha sucedido, sucede o puede suceder.

Para ello es necesario contar con un método, con un conjunto de reglas o principios, que permitan la observación, el ordenamiento, la cuantificación y el análisis de dichos fenómenos. Ese método es el que se denomina ESTADÍSTICA.

La palabra ESTADÍSTICA se refiere a un sistema o método científico usado en la recolección, organización, análisis, interpretación numérica de la información. También se puede decir que la ESTADÍSTICA estudia el comportamiento de los fenómenos de grupo.

Hay dos fases en el campo de la Estadística. En primer lugar, está la fase que solo se limita a la descripción y análisis de una serie de datos sin llegar a conclusiones o generalizar con resultados a un grupo mayor. Esta (fase) se conoce como Estadística deductiva o descriptiva. En segundo lugar esta la fase que trata de llegar a conclusiones acerca de un grupo mayor basada en información de un grupo menor o muestra: es esta la estadística inductiva o inferencial. Las conclusiones a que se llega respecto a la población o universo, se exponen en términos probabilísticos, sin estar completamente seguros de estas inferencias.

Desde el punto de vista descriptivo analítico, la Estadística se define como un conjunto sistemático de procedimientos para observar y describir numéricamente los fenómenos, descubrir las leyes que regulan la aparición, transformación y desaparición de los mismos.

Generalmente se asocia la palabra ESTADISTICA con cifras sobre algún campo particular. Podemos asociarla sobre el número de nacimientos, defunciones, transacciones comerciales, valor de las acciones en el mercado de valores, el volumen físico y monetario o importaciones, el beneficio y utilidad de las empresas o la demanda presente o potenciar algún producto. Cuando usamos la palabra Estadística es para referirnos más bien a datos tabulados y ordenadamente presentados.

FENÓMENOS QUE ABARCA Y NO ABARCA LA ESTADÍSTICA

Los fenómenos o hechos que continuamente suelen suceder presentan ciertas características tales como las de ser observados y manifestarse al exterior mediante registros, al mismo tiempo el de cuantificarse y aun el de poder determinar la intensidad con que se produce cierto fenómeno.

El campo de acción de la Estadística es muy amplio, sin embargo, no todos los fenómenos son abarcados. Únicamente aquellos que reúnen ciertas condiciones a saber:
1. Fenómenos colectivos o de grupos.
2. Fenómenos de frecuente repetición.
3. Fenómenos de distinta frecuencia.
4. Fenómenos distantes en el espacio.
5. Fenómenos distantes en el tiempo.
6. Fenómenos cualitativos que puedan cuantificarse.

En cambio quedan fuera del campo de acción de la Estadística, los enumerados a continuación.
1. Fenómenos individuales.
2. Fenómenos que no se exteriorizan.
3. Fenómenos accidentales en el tiempo y en el espacio.
4. Fenómenos cualitativos que no puedan cuantificarse.

FINALIDADES DE LA ESTADÍSTICA

Son numerosas las finalidades de Estadística; entre las más importantes podemos anotar:
1. Conocer la realidad acerca de un fenómeno.
2. Determinar lo normal o típico de un fenómeno.
3. Determinar los cambios que presentan los fenómenos.
4. Relacionar dos o más fenómenos.
5. Determinar las causas que originan el fenómeno.
6. Hacer estimaciones sobre el comportamiento futuro.
7. Partiendo de un grupo menor obtener conclusiones para un grupo mayor.

VARIABLE Y TIPO DE VARIABLES

En esta sección revisaremos algunos conceptos que se utilizarán extensamente en esta guía. Con el propósito de no crear en el estudiante un estado de desaliento, resultado de la confusión propia cuando se empiezan a manejar conceptos abstractos, hemos preferido dejar de lado el excesivo formalismo, presentar las ideas de la manera más simple posible y procurando que queden lo más adecuadas al lenguaje Estadístico.

Variable. Es toda característica que toma diferentes valores en distintas personas, lugares o cosas. Por ejemplo, la estatura de las personas, el número de personas que residen en una vivienda, el sexo de los estudiantes de la universidad.

Datos. Son números o medidas que han sido recopilados como resultados de observaciones. Los datos pueden provenir de recuentos tales como el número de personas que laboran en una empresa o de mediciones como el peso de una persona.

Variable aleatoria. Cuando los valores que asume la variable han sido antecedidos por una selección aleatoria de los objetos medidos o son resultados de algún proceso al azar. A las variables aleatorias usualmente se les denota por letras X. Y, Z; y a los valores por las respectivas minúsculas.

Si de las cuentas corrientes de los clientes de un banco se escogen cinco al azar en un día determinado, la variable depósito en cuenta corriente de cada cliente constituye una variable aleatoria que podemos designar X. Si alguna de las cuentas aparece con un registro o saldo de 1.000.000 de pesos entonces x = 1.000.000.

Variable continua. Es aquella que teóricamente puede tomar cualquier valor dentro de un intervalo. Por ejemplo, la estatura de las personas o el tiempo necesario para realizar una transacción bancaria de parte del cliente.

Variable discreta. Es aquella que toma valores separados entre sí por alguna cantidad. Por ejemplo, el número de personas que llegan en una hora a un banco a solicitar un servicio.

Variable cuantitativa. Es aquella que asume valores acompañados de una unidad de medida. Por ejemplo, el número de accidentes anuales ocurridos en una carretera de mucha circulación o el ingreso por familia en determinados sectores de la ciudad.

Variable cualitativa. Es la que se refiere a clasificación, como estado civil, preferencia por una marca, etc.


COMPONENTES DE UNA INVESTIGACIÓN ESTADÍSTICA -

El estudio estadístico de una situación con propósitos inferenciales se centra en dos conceptos fundamentales: población y muestra, los cuales serán definidos a continuación.

Población. Es el conjunto formado por todos los valores posibles que puede asumir, la variable objeto de estudio.

Así por ejemplo, en un estudio sobre la preferencia de los votantes en una elección presidencial, la población consiste en todas las respuestas de los votantes registrados. Pero el término no sólo está asociado a la colección de seres humanos u organismos vivos; y tenemos así que, si se va a hacer una investigación de las ventas anuales de los supermercados, entonces las ventas anuales de todos los supermercados constituyen así mismo la población.

Es bueno tener en cuenta que el término población se interpreta de dos maneras cuando se hace un estudio estadístico, a saber:
La interpretación propia en el Análisis Estadístico, que corresponde a la que hemos presentado anteriormente.
Como el conjunto de objetos sobre los cuales actúa la variable considerada.

Por tanto, no es extraño escuchar expresiones tales como, "se hizo un estudio de los niveles de ingreso de la población trabajadora colombiana", entendiéndose con ello que el elemento estadístico objeto de análisis fue el registro numérico de los ingresos.

Muestra. Es cualquier subconjunto de la población, escogido al seguir ciertos criterios de selección.

La muestra es el elemento básico sobre el cual se fundamenta la posterior inferencia acerca de la población de donde se ha tomado. Por ello, su escogencia y selección debe hacerse siguiendo ciertos procedimientos que son ampliamente tratados en la parte de la estadística llamada Teoría de muestreo.

El concepto de muestra tiene también las dos connotaciones que hemos señalado para la población.

Las características de una población se resumen para su estudio generalmente irá mediante lo que se denominan parámetros; éstos a su vez se toman o consideran como valores verdaderos de la característica estudiada. Por ejemplo, la proporción de todos los clientes que declaran cierta preferencia por una marca particular de un producto dado, es un parámetro de la población de todos los clientes; es la verdadera proporción de la población. Igualmente, la media aritmética de las cuentas corrientes de los clientes de un banco determinado constituye un parámetro de la población de las cuentas de los clientes de ese banco.

Cuando la característica de la población estudiada se reduce a una muestra el resumen de esa característica se hace mediante una esta (medida) o estadígrafo. Así por ejemplo. si se toman 100 de todos los posibles clientes y se les entrevista para ver si están a favor de una marca particular de un producto, estos 100 clientes la constituyen una muestra.. Si hay 70 clientes que prefieren dicha marca entonces la proporción muestral será 0.70 y constituirá un estadígrafo; de igual manera si se escogen 1,000 cuentas del total de las cuentas comentes; las 1,000 observaciones conforman una muestra y el promedio aritmético de estas cuentas un estimador.

La inferencia estadística se orienta a sacar conclusiones acerca del parámetro o parámetros poblacionales con base en el valor de un estimador obtenido a partir de los datos muestrales extraídos de esa población. Para llegar a ese objetivo a través de un proceso racional y eficaz, se aconseja que se tengan en cuenta los siguientes pasos:

Formulación del problema. En este punto se debe especificar de manera clara la pregunta que se debe responder y la población de datos asociada a la pregunta. Los conceptos deben ser precisos y deben ponerse limitaciones adecuadas al problema motivadas por el tiempo, dinero disponible y la habilidad de los Investigadores. Algunos conceptos como, artículo defectuoso, económico, salario, pueden variar en cada caso y para cada problema debemos coincidir con las ideas señaladas en el estudio.

Diseño del experimento. Este aspecto es de gran importancia, puesto que la recolección de datos requiere dinero y tiempo. Es siempre nuestro deseo obtener máxima Información con el mínimo costo (dinero y tiempo) posible. Incluir excesiva Información en la muestra es a menudo costoso y antieconómico. Incluir poca también es poco satisfactorio. Esto implica, entre otras cosas, que debemos determinar el tamaño de la muestra o la cantidad o tipo de datos que nos permita resolver el problema de la manera más eficiente.

Recolección de datos. Esta parte, por lo general, es la que exige más tiempo en la Investigación. Esta recolección debe ajustarse a reglas estrictas ya que de los datos esperamos extraer la Información deseada.

Tabulación y descripción de los resultados. En esta etapa, los datos muestrales se exponen de manera clara y se ilustran con representaciones tabulares y gráficas (diagramas. histogramas, etc.); además se calculan las medidas estadísticas apropiadas al proceso inferencial que haya sido escogido.

Inferencia estadística y conclusiones. Este último paso constituye tal vez la contribución más importante de la estadística al proceso inferencial. Aquí se fija el nivel de confiabilidad para la inferencia; esto es debido a que las conclusiones derivadas de inferencias estadísticas jamás se pueden tomar con un 100% de certeza, pero sí se les puede asociar un nivel de confiabilidad; en términos de probabilidad denominados nivel de confianza y nivel de significancia. El proceso Inferencial nos llevará a una conclusión estadística que servirá de orientación a quien o quienes deban tomar la decisión (administrativa o clínica) sobre el tema objeto de estudio.



EJERCICIOS PROPUESTOS: GENERALIDADES DE LA ESTADÍSTICA

1. Clasifique cada una de las variables (cuantitativa. cualitativa. discreta. continua) asociada a las características indicadas.
a. Distancia diaria recorrida por cada estudiante para ir de su casa a la universidad.
b. Tiempo que requiere un estudiante para responder a un examen de Estadística.
c. Llamadas que llegan al conmutador de una empresa durante un día.
d. Color del cabello de los estudiantes de sexo femenino que toman el curso de estadística en el presente semestre.
e. Preferencia por cierta marca de gaseosa.
f. Estatura de los estudiantes de sexo masculino que pertenecen al equipo de básquetbol.

2. En cuáles de los siguientes casos la variable considerada es de carácter aleatorio:

a. El médico de la universidad registra el peso de los estudiantes que Ingresan este semestre a la universidad.
b. El médico de la universidad cita a todos los estudiantes que ingresan este semestre; de ellos escoge aleatoriamente 50 y registra el peso de cada uno de ellos.
c. El contador de una empresa registra el saldo bancario que ésta ha mantenido durante los días del último año.
d. El contador de una empresa registra el saldo bancario que ésta ha mantenido durante 45 días del último año, escogidos al azar.

3. Se ha hecho un estudio para determinar la preferencia de una marca especial de detergente por parte de las amas de casa; Entre las 50 amas de casa entrevistadas. 30 dijeron que preferían esta marca.
a. ¿Qué constituye la muestra?
b. ¿Qué constituye la población?

5. Un informe reciente en la revista Fortune reveló que los japoneses pronto controlarán hasta un 35% de las ventas de autos en los Estados Unidos; comparado con el 28% de finales de los años 80 está apenas un 8% por encima de lo ocurrido en 1970. ¿Esta información contiene estadística descriptiva, inferencial, o ambas? Explique.

7. La revista Forbes (febrero de 1997) reportó datos sobre las condiciones y estilos de vida en varias ciudades de Colombia. Algunas de esos datos se reproducen aquí.

CIUDAD
POBLACIÓN EN MILLONES
MEDIANA DE INGRESOS POR HOGAR
MEJOR NEGOCIO HOTELERO
ATRACCIÓN MÁS VISITADA
TASA DE CRIMINALIDAD POR CADA 100.000
CALI
3.5
420000
TONE
PARQUE DE LA CAÑA
846.2
CARTAGENA
2.5
450000
DECAMERON
SAN FELIPE
1296.5
BARRANQUILLLA
2.5
375000
IROTAMA
PUENTE PUMAREJO
263.4
MANIZALES
5.0
301000
CALDAS
NEVADO DEL RUIZ
693.1
SAN ANDRÉS
1.0
750000
SAN LUIS
JHONNY KEY
634.9

a. Identifique las variables cualitativas y cuantitativas.
b. ¿Cuáles variables son discretas y cuáles continuas?
c. Identifique cada variable como nominal, ordinal, o de razón.
d. ¿Cuáles son descriptivas y cuáles inferenciales?

8. Un ejemplo de características cualitativa pueden ser datos sobre:

a. Salarios
b. Pulsaciones por minuto
c. Gastos mensuales en alimentación
d. Ocupación
e. Temperatura

9. Una muestra es aleatoria cuando las unidades se seleccionan:

a. En forma caprichosa.
b. Por conveniencia.
c. A través de un censo.
d. En forma repetitiva.
e. De tal manera que todas tengan la misma posibilidad.

10. Por población o universo se entiende:

a. Un recuento de unidades.
b. Un conjunto de seres humanos.
c. Un conjunto de datos.
d. Un conjunto de medidas o el recuento de todas las unidades que tienen una característica común.
e. Ninguna de las anteriores.


11. Cualquier medida aplicada a la característica de las unidades en la población se denomina:

a. Parámetro.
b. Estimador.
c. Estadístico.
d. Variable.
e. Población.

12. Dentro de los hechos o fenómenos que no caen dentro del campo de la estadística están:

a. Los de frecuente repetición.
b. Los de distinta frecuencia.
c. Los colectivos.
d. Los individuales.
e, Los cualitativos que pueden cuantificarse

13. La estadística descriptiva tiene como objetivo:

a. Probar la significación de los resultados.
b. Ser herramienta indispensable en el muestreo.
c. Descubrir las causas que originan el hecho.
d. Lograr conclusiones más allá de las muestras
e. Efectuar comparaciones sin sacar conclusiones de tipo más general.

14. Se debe responder verdadero si el enunciado es siempre válido. En caso contrario se deberá sustituir la palabra subrayada por otra, con la cual el enunciado tenga validez.

a. Parámetro es el resultado al aplicar una medida a las características de las unidades de una población.
b. El recuento de los empleados de una empresa, de acuerdo al cargo, es un ejemplo de características cuantitativas.
c. La estadística Descriptiva es el «estudio» de una muestra a fin de poder hacer estimaciones acerca de los estadísticos de la población, de la cual se tomó la muestra.
d. Una muestra aleatoria significa que cada elemento tiene una probabilidad diferente al ser seleccionado.
e. La inferencia es un ordenamiento sistemático de la información en cuadros y gráficas que siempre observamos en las diferentes publicaciones e informes.

15. En los tres (3) ejemplos siguientes, determinar en cada uno de ellos:

¿Cuál es la población?
¿Cuál es la muestra?
¿Cuál es la unidad?
¿Cuál es la característica?
¿Cuál es cualitativa o cuantitativa?
¿Cuál de las variables es discreta o continua?

a. Se realiza un estudio en 350 hogares de la clase media de la ciudad Bellavista para conocer el tipo de aceite o grasa usada en la cocina. Los resultados fueron: 130 hogares utilizan el ajonjolí; maíz en 90 hogares; girasol en 75 hogares; etc.


b. El laboratorio de control de calidad de una empresa realiza un test de rapidez de acción de un pesticida de jardín, en 50 plantas infestadas. Los resultados fueron observados cada hora, habiéndose obtenido algunos datos del número de plantas totalmente libres de plaga, después del los períodos de tiempo que se indican: 6 horas, 6 plantas; 7 horas, 9 plantas: 8 horas, 5 plantas; etc.

c. En un plantel de 800 niños de ambos sexos, de 5 a 12 años, se realizó un test de aceptación a 20 : niños, utilizando una escala de 10 puntos, para medir el grado de aceptación de un nuevo producto que fabrica la compañía Chocolatera la Avispa SA










Nombre: Código:
------------------------------------------------- ----------------------------
----------------------------------------- ------------------------
----------------------------------------- ------------------------

lunes, 17 de septiembre de 2007

INTRODUCCION A LA PROBABILIDAD. DISTRIBUCIONES DE PROBABILIDAD.

UNIVERSIDAD LIBRE

FACULTAD DE INGENIERÍA
DEPARTAMENTO DE AMBIENTAL

Asignatura: ESTADISTICA DESCRIPTIVA (02231)
Grupo: 5A
Profesora: ALLA GUTIERREZ

Guía No. 3

TEMAS:
INTRODUCCION A PROBABILIDAD.
DISTRIBUCIONES DE PROBABILIDAD


Fecha: 2007/II


Objetivo:
Brindar a los estudiantes del curso los conocimientos fundamentales de las distintas ramas de la estadística, logrando introducir desde los conceptos básicos hasta los procedimientos de vanguardia con una visión practica que permita resolver problemas de las empresas en el ámbito de decisiones de riesgo, creando modelos estadísticos adecuados para una buena tomo de decisiones.


Introducción:

La estadística desempeña un importante papel en todas las áreas de investigación y la toma de decisiones de nivel empresarial. Proporciona herramientas que le permitan al ingeniero plantear modelos que faciliten la tarea de investigación y proyección de las actividades futuras.
Fortaleciendo las bases fundamentales de la Estadística con el uso de programas estadísticos y las hojas de cálculo, forma parte integral del proceso de aprendizaje, motivando a los estudiantes y elevando su nivel de conocimiento que lo llevara a ser un profesional eficiente.

Competencias a desarrollar: Interpretativa

Interpretar y describir las tendencias de datos y desarrollar la compresión de los conceptos básicos de probabilidad.
Facilitar la comprensión de los conceptos básicos de las distribuciones de probabilidad continuas y discretas.


Metodología:
Inducción: Resolver los ejercicios propuestos analizando resultados de acuerdo a las propiedades y conceptos básicos de la Probabilidad.
Profundización: Prácticas en la sala de computo utilizando Statgraphics o Excel.

Trabajo individual:
Realización de ejercicios propuestos como tarea.

Perfeccionamiento:
Realizar el análisis de los resultados y presentar conclusiones.
Trabajo en grupos.
Prácticas en Statgraphics o Excel.

Socialización:
Individual o en parejas.

Evaluación:

Presentación de tareas.


Bibliografía

1. CANAVOS, George Probabilidad y Estadística. Ed. McGRAW HILL.

2. MARTINEZ, Ciro Estadistica. Ed. ECOE.

3. MENDENHALL, William Estadística Matemática con aplicaciones. Ed. Iberoamérica.

4. MENDENHALL, William Introducción a la Probabilidad y Estadística. Ed. Thomson

5. SPIEGEL, Murray Estadística. Ed. McGRAW HILL.

6. WALPOLE, Ronald Probabilidad y Estadística para Ingenieros. Ed. PRENTICE HALL.



Ejercicios Propuestos:
INTRODUCCION A LA PROBABILIDAD
DISTRIBUCIONES DE LA PROBABILIDAD



I. INTRODUCCION A LA PROBABILIDAD.


EVENTOS.

1. Después de un extenso estudio, los archivos de una compañía de seguros revelan que la población de un país cualquiera puede clasificarse, según sus edades, como sigue: un 35% menores de 20 años; un 25% entre 21 y 35 años; un 20% entre 36 y 50 años; un 15% entre 51 y 65años; un 5% mayores de 65.
Suponga que se puede elegir un individuo de tal manera que cualquier habitante del país su­puesto tiene la misma posibilidad de ser elegido.
a) Cuál es la probabilidad de que el individuo sea mayor de 35 años?
b) Tenga edad entre 21 y 65 años?
*Rta: 0.40; 0.60

2. En un semáforo que tiene luz roja, los conductores de marcas de carros Mazda, Chevrolet, BMW están esperando el cambio del semáforo.
a) Cuál es la probabilidad de que el conductor del Mazda, sea el segundo que reacciona?
b) El segundo Ch, tercero BMW.
*Rta: 1/3; 1/6

3. Se inspeccionan los sistemas hidráulicos de aterrizaje que lle­gan a un taller de reparación de aviones, para encontrar defec­tos eventuales. Los registros indican que 8% tiene solamente defectos en los ejes; 6% sólo en los cojinetes y 2% en ejes y co­jinetes a la vez. Se selecciona al azar un sistema hidráulico. Cuál es la probabilidad de que el sistema tenga:

a) Un cojinete defectuoso?
b) Un eje o un cojinete defectuoso?
c) Exactamente uno de los dos tipos de defectos?
d) Ningún tipo de defecto?
*Rta: 0.08; 0.16; 0.14; 0.84



4. Una empresa dedicada a la búsqueda de petróleo, en 10% de sus perforaciones, encuentra petróleo. Si la compañía perfora dos pozos, los cuatro eventos posibles y tres de sus probabilidades son:

Evento la. Perforación 2a. Perforación Probabilidad
E1 Exito Exito .01
E2 Exito Fracaso ?
F3 Fracaso Éxito .09
E4 Fracaso Fracaso .81
a) Obtenga la probabilidad de que la compañía encuentra petróleo en la 1a. perforación y falle en la segunda?
b) Que encuentre petróleo en al menos una de las dos perfora­ciones?
*Rta: 0.09; 0.19
5. De los voluntarios que llegan a un banco de sangre, 1 de 3 tiene sangre tipo 0+, 1 de 15 tipo 0- , 1 de 3 tipo A+; y 1 de 16 tipo A-. Se selecciona al azar el nombre de un donante de los registros del banco. Cuál es la probabilidad de que la persona tenga:

a) Sangre tipo 0+?
b) Sangre tipo O?
c) Sangre tipo A ?
d) Sangre que no es del tipo A, ni 0?
*Rta: 1/3; 2/5; 19/48; 49/240

6. Los empleados de cierta compañía han elegido a cinco de ellos para representarlos en el consejo de productividad empresa - empleados. Las características de las cinco son:

1. H - 30 años
2. H - 32
3. M - 45
4. M - 20
5. H - 40

Este grupo desea elegir un vocero sacando su nombre de una caja. La pregunta es: Cuál es la pro­babilidad de que el vocero sea mujer o mayor de 35 años?
*Rta: 3/5

7. Un sistema contiene 2 componentes A y B. Se sabe que la probabilidad de que A funcione es 0,9 y la de B es 0.8, y de la proba­bilidad de ambos es 0.72. Determinar la probabilidad de que el sistema funcione.
*Rta: 0.98



8. Se plantea el diseño de un centro comercial que reunirá diversos establecimientos con diferentes necesidades de energía eléctrica y agua. El Ingeniero deberá diseñar tales servicios de modo que el material con que se cuenta no exceda en gran medida a la de­manda real y que tampoco resulten inadecuadas las capacidades. Existen cuatro clasificaciones: para energía eléctrica se tiene 10 y 20 unidades a saber, E10 y E20; y para agua 2 o 4 unidades, esto es A2 y A4. Han hecho los siguientes cálculos respecto a la probabilidad.

Evento P
E10 A2 0.1
E10 A4 0.2
E20 A2 0.2
E20 A4 0.5

Obtener la probabilidad de que:
a) La demanda de agua sea de 4 unidades?
b) La demanda de electricidad sea para 20 unidades?
c) La demanda de agua sea de 4 unidades o de que la energía sea de 20 unidades?
*Rta: 0.7; 0.7; 0.9

9. Tres equipos de radar, que trabajan independientemente, están disponibles para detectar cualquier avión que vuela sobre cierta área. Cada equipo tiene una probabilidad de 0.02 de no de­tectar un avión que vuele en el área.
a) Si un avión entre por casualidad al área, ¿ Cuál es la pro­babilidad de que no sea detectado?
b) Cuál es la probabilidad de que sea detectado por los tres equipos de radar?
*Rta: 0.000008; 0.941192

10. Un detector de mentiras muestra una lectura positiva ( es de­cir, indica una mentira ) en 10% de los casos cuando la persona dice la verdad y en 95% de los casos cuando la persona miente. Suponga que se sospecha de dos personas de haber cometido un delito, que fue ejecutado por una sola persona, y de hecho sólo una es la culpable.
Cuál es la probabilidad de que:
a) El detector muestre una lectura positiva para los dos sos­pechosos?
b) El detector muestre una lectura positiva para el sospechoso culpable y una lectura negativa para el inocente?
c) Esté completamente equivocado el detector , es decir, que indique una lectura positiva para el inocente y una lectura negativa para el culpable?
d) El detector de una lectura positiva para cualquiera de las dos o para ambos sospechosos?
*Rta: 0.095; 0.855; 0.005; 0.955


PROBABILIDAD CONDICIONAL.

11. El 18% de los alumnos de una Universidad fallaron en el examen Estadística, y el 20%
fallaron en su examen de Matemáticas. El 8% de los alumnos fallaron en ambas
asignaturas.
a) Cuál es la probabilidad de aprobar matemáticas, si falló en estadística?
b)Si un alumno perdió matemáticas, cuál es la probabilidad de aprobar estadística?
*Rta: 0.55; 0.60

12. El 27% de habitantes de un barrio tienen el vehículo propio y el 34% tienen la casa propia, el 17% tienen casa y vehículo.
a) Cuál es la probabilidad de tener vivienda, si se tiene el vehículo?
b) Si se tiene la vivienda, cuál es la probabilidad de tener vehículo propio?
*Rta: 0.629; 0.50

13. Con los datos del ejercicio 3, responde las siguientes preguntas:
a) Cuál es la probabilidad de que el avión tenga ejes defectuosos, si se sabe, que los cojinetes tienen estado acepta­ble?
b) Si se tienen ejes nuevos, cuál es la probabilidad de tener los cojinetes defectuosos?
*Rta: 0.063; 0.043

14. Un sistema S consta de los componentes A y B. Funciona 0.10 del tiempo; el componente A falla 0.60, en tanto que el B falla 0.75.
a) Cuál es la probabilidad si falló B, A sigue funcionando?
b) Cuál es la probabilidad de que falle B, si A funciona correctamente?
*Rta: 0.40; 0.75

15. Durante un accidente automovilístico se descubrió que 300 de 500 accidentes ocurren de noche, 52% guarda relación con la ingestión de bebidas alcohólicas y 37% tiene lugar de noche y se relaciona con la ingestión de bebidas alcohólicas:
a) Cuál es la probabilidad de que un accidente se relacione con el alcohol si ocurrió de noche?
b) Cuál es la probabilidad de que haya ocurrido de noche, si se relacionó con la ingestión de bebidas alcohólicas? *Rta: 0.616; 0.711

16. Cierta Compañía de Seguros halló que alrededor de dos de cada 1000 cheques son girados con fondos insuficientes y además que tales cheques son posfechados.. Además, dos de cada 100 cheques girados con fondos suficientes son posfechados. Si se recibe un cheque posfechado, cuál es la probabilidad que provenga de un cliente con fondos insuficientes?
*Rta: 0.0909

17. De veinte carros que llegaron a un taller mecánico 5 tienen problemas de
mala carburación, 8 tienen rotura de la correa del ventilador y 10 otro tipo de
problemas.
a) Cuál es la probabilidad de que un carro con problemas de carburación no tenga rotura de la correa del ventilador?
b) De que uno de los carros con rotura de la correa resulta también con problemas de carburación?
*Rta: 0.40; 0.375




ANALISIS COMBINATORIO.


18. Un examen consta de 4 preguntas y se deja libertad para contestarlas en el orden que se desee. De cuantas maneras se podrá contestar?
*Rta: 24

19. Si un estudiante tiene 9 libros y desea ordenar 5 de ellos sobre una repisa. De cuántas maneras distintas puede hacerlo?
*Rta: 15120

20. De cuántas maneras se puede formar con 9 personas una comisión de 5 miembros?
*Rta: 126

21. Cierta marca de automóviles tiene cinco modelos diferentes, con cuatro tipo de motores, con dos tipos de transmisiones y en ocho colores.
a) Cuántos coches tendría que adquirir un distribuidor si quiere incluir un automóvil por cada combinación modelo – motor - transmisión?


b) Cuántos coches tendría que tener en existencia un centro de distribución si almacenara los coches de todos los colores disponibles para cada combinación de (a)?
*Rta: 40; 320

22. En muchos estados las placas de los automóviles se identifican por tres letras y tres números, cuál es el número total si ninguna letra de placas posible puede usarse más de una ocasión en la misma placa?
*Rta: 15 600 000

23. Después de lanzar un dado y extraer al azar una letra del alfabeto, cuantos resultados posibles tendrá el espacio muestral?
*Rta: 150

24. Una aerolínea tiene 6 vuelos diarios de Nueva York a California y 7 vuelos de California a Hawai. Si los vuelos se hacen en días separados, cuántos diferentes arreglos de vuelos puede ofrecer la aerolínea de Nueva York a Hawai?
*Rta: 42

25. Una oficina dispone de 8 computadores de marca Sony, 3 Acer, 9 Panasonic. Si fallan 3 computadores al mes, determinar la pro­babilidad de que:

a) Los 3 Sean Sony?
b) Los tres sean Acer?
c) 2 sean Sony y 1 Acer?
d) Al menos uno sea Acer?
e) Sean uno de cada marca?
*Rta: 14/285; 1/1140; 7/95; 23/57; 18/95



TEOREMA DE BAYES


26. Tres compañías de servicios de mensajería anuncian que entregarán un paquete en cualquier parte del país a mas tardar en 24 horas. Las compañías A, B y C transportan 50, 40 y 10% del número total de paquetes. Si el 0.85%, 0.45% y el 2.5% de los paquetes se entregan con retraso por las compañías A, B y C respectivamente, cuáles son las probabilidades:
a) De que un paquete entregado con retardo haya sido llevado por la compañía A? B? C?
b) De que un paquete entregado a tiempo haya sido llevado por la compañía A? B? C?
*Rta: a) 0.4971; 0.2105; 0.2924 b) 0.5000; 0.4016; 0.0983


27.. Los cuatro ayudantes de una gasolinería deben limpiar el para brisas de los autos de los clientes, Juan quien atiende el 20% de todos los autos, no cumple su cometido una vez cada 20 autos; Tomás quien atiende el 60% de los autos, no limpia el parabrisas una vez nada 10 autos, Jorge atiende el 15% de ellos, no cumple su cometido una vez cada 10 autos y Pedro quien atiende el 5% de los autos, no limpia el parabrisas una vez cada 20 autos. Si un cliente se queja de que su parabrisas no fue lavado. ¿ Cuál es la probabilidad de que su auto lo haya atendido Juan?
*Rta: .114

28. Durante los últimos años se ha escrito mucho sobre la posible relación entre el fumar y el cáncer pulmonar. Supóngase que en un Centro Médico, de todos los fumadores de quienes se sospecha que tenían cáncer pulmonar, el 90% lo tenía, mientras que únicamente mente el 5% de los no fumadores lo padecía. Si la proporción de fumadores es de 0.45. ¿ Cuál es la probabilidad de que un paciente con cáncer pulmonar, seleccionado al azar, sea fumador?
*Rta: .9364

29. Una compañía estudia la comercialización de un nuevo producto y se decide asignar una posibilidad del 50% de que el producto sea superior al ofrecido por el competidor, 30% de que tenga la misma calidad y un 20% de que sea inferior. La probabilidad de que la encuesta alcance que éste es superior es de 0.7, de la misma calidad es 0,4, si es inferior es de 0.2. Dado el resultado de la encuesta. Cuál es la probabilidad corregida, de obtener un producto superior?
*Rta: .6863

30. El 40% de los artículos producidos por una compañía han tenido éxito en el
mercado y el 60% no lo han tenido. Se lleva a cabo una investigación de mercado y el
80% de los compradores de los artículos exitosos están satisfechos con su compra y el
30% de los clientes están satisfechos con la compra de la mercancía que no ha tenido
éxito en el mercado. Al gerente de mercadotecnia le gustaría conocer la probabilidad de
que el nuevo artículo tendrá éxito si el comprador estará satisfecho con la compra.
*Rta: 0.64

31. Una empresa que ensambla televisores compra un cierto chip en tres
distribuidoras: A, B y C un 30, 20 y 50% respectivamente. Se sabe que 3% de
los chips de la distribuidora A son defectuosos, 5% de la B y 4% de la C
también son defectuosos.
a) Si un chip seleccionado al azar resulto ser defectuoso, cuál es la probabilidad de que haya sido manufacturado por la distribuidora B?
b) Cuál es la probabilidad de que un chip resulto ser aceptable, si se compro en la distribuidora C?
*Rta: 0.2564; 0.4995



II. DISTRIBUCIONES DE LA PROBABILIDAD.

VARIABLES ALEATORIAS DISCRETAS
Y SUS DISTRIBUCIONES DE PROBABILIDAD


VALOR ESPERADO

32. Un inversionista se da cuenta de que tiene una probabilidad de 0.40 de obtener una utilidad de $25.000, y una probabilidad de 0.60 de perder $15.000 en una inversión. Encuentra su ganancia esperada y Desviación Estándar?
* Rta: 1.000

33. Un contratista hace las siguientes estimaciones:
Tiempo de Probabilidad
Terminación
10 días 0.30
15 días 0.20
22 días 0.50

Calcule el valor esperado para la terminación del proyecto. Halle desviación estándar.
*Rta: 17+/-5.29

34. Un proceso de fabricación que consiste de tres pasos requiere de un tiempo promedio de 15 minutos para la terminación del primer paso, 25 minutos para el segundo y 30 minutos para el tercero. Las desviaciones estándar respectivas son de tres, cuatro y cinco minutos. Encuentre la media y la varianza del tiempo total de terminación del proceso.
Rta: 70; 50

35. Una fábrica embarca su producto en dos camiones con dimensiones 8x10x30 y 8x10x40 pies, respectivamente. El 30% de sus embarques se hacen en el camión de 30 pies y el 70% en el camión de 40 pies. Encuentre la media por vehículo del volumen embarcado. (Se supone que los camiones siempre van llenos).
*Rta: 2960


36. Un vendedor está tratando de decidir si hacer una llamada a un cliente potencial en la periferia de su territorio de ventas. Estima que el costo de hacer la llamada será de $ 100. Las utilidades potenciales, excluido el costo de la llamada, se muestran en la tabla. Cuál es la utilidad neta esperada de hacer la llamada?
Rendimientos potenciales dela llamada:


Rendimiento Probabilidad
potencial
0 0.60
50 0.10
100 0.15
500 0.10
1000 0.05
*Rta: E(rendimientos): $120; E(rendimientos netos): $20


Distribución de Probabilidad
BINOMIAL.


37. Se sabe que en la manufactura de cierto artículo uno de cada 10 resulta defectuoso. Cuál es la probabilidad de que una mues­tra aleatoria de 4 artículos contenga:

a) Ninguno defectuoso?
b) Exactamente uno defectuoso?
c) Exactamente dos defectuosos?
d) No más de dos defectuosos?

Rta: .6561; .2916; .0486; .9963


38. Conforme a los registros universitarios, fracasa el 5% de los alumnos de cierto curso. Cuál es la probabilidad de que 6 estudiantes seleccionados al azar menos de 3 hayan fracasado?
Rta: .9977


39. Supóngase que un lote de 300 fusibles eléctricos contiene 5% de defectuosos. Determine la probabilidad de que se pueda en­contrar al menos un fusible defectuoso en una muestra de cinco fusibles.
Rta: .226

40. La experiencia ha demostrado que el 30% de todas las personas afectadas por cierta enfermedad, se recupera. Una compañía farmacéutica desarrolló una nueva vacuna. Se seleccionaron al azar 10 personas con la enfermedad en cuestión y se les administró la vacuna; poco después 9 se recuperaron. Supóngase que la vacuna es absolutamente ineficaz. Cuál es la probabilidad de que al menos 9 de 10 personas infectadas se recuperen?
Rta: .000144

41. Muchas compañías de energía eléctrica han empezado a promover el ahorro de energía al ofrecer descuentos a consumidores que mantienen su consumo de energía por debajo de ciertas normas de subsidio establecidas. Un reciente reporte informa que el 70% han reducido suficientemente el uso de energía eléctrica para poder disfrutar de los descuentos. Si se selecciona al azar cinco residentes, encuentre la probabilidad de que:
a) Los cinco clasifican para tarifas más favorables?
b) Al menos cuatro clasifican para tarifas más favorables?
Rta: .1681; .5282

42. Un examen de opción múltiple está compuesto de 15 preguntas, con cinco respuestas posibles, cada una; de las cuales solamente una es correcta. Supóngase que uno de los estudiantes que realizan el examen contesta las preguntas al azar. Cuál es la probabilidad de que conteste correctamente al menos 10 preguntas?
Rta: .000

43. Si la probabilidad de que se desplome una estructura después de 30 años de servicio es 0,01, obtenga la probabilidad de que de 10 estructuras de esa clase, las siguientes se derrumben después de 30 años de servicio.
a) Ninguna?
b) Una exactamente?
c) No más de una?
d) Más de una?
e) Por lo menos una?
* Rta: .9043; .0913; .9956; .0044; .0957

44. Una factoría observa que, en promedio el 20% de las tuercas producidas por una máquina son defectuosas. Si se toman 10 tuercas al azar, hallar la probabilidad de que:
a) Exactamente 2 sean defectuosas
b) Dos o más sean defectuosas
c) Más de 5 sean defectuosas.
*Rta: .3020; .6242; .00637

45. Las observaciones durante un largo periodo muestran que un vendedor determinado puede concluir una venta en una sola entre­vista con una probabilidad de 0.2. Supóngase que el vendedor entrevista a cuatro prospectos ( o compradores prospectivos). Cuál es la probabilidad de que:
a) Exactamente 2 prospectos compren el producto?
b) Al menos 2 prospectos compren el artículo?
c) Todos los prospectos compren el producto?
*Rta: .1536; .1808; .0016

46. Se inspeccionan los grandes lotes de productos que llegan a una planta a fin de encontrar artículos defectuosos. Se examinan 10 artículos y el lote será rechazado si se encuentran 2 o más artículos defectuosos. Si el lote contiene exactamente 5% de artículos defectuosos, cuál es la probabilidad de que el lote sea aceptado? Cuál es la probabilidad de que sea rechazado?
*Rta: .914; .086

47. De los 6.000 estudiantes matriculados en la Universidad, se sabe que 4800 de ellos se trasladan a la Universidad utilizando el transporte urbano. Si se selecciona una muestra de 8 estudiantes, cuál es la probabilidad de que:
a) No más de 2 utilicen dicho servicio?
b) Por lo menos 3 no lo utilizan?
c) Exactamente 2 no lo utilizan?
d) Exactamente 2 lo utilizan?
*Rta: .00123; .2039; .2912; .001146

48. Se forma una empresa de exploración petrolera con suficiente capital para financiar 10 exploraciones. La probabilidad de que una exploración en particular sea exitosa es de 0.1. Supóngase que las exploraciones son independientes. Encuentre la media y la varianza del número de exploraciones exitosas.
*Rta: 1.0; 0.9

49. Supóngase que la Empresa del ejercicio anterior tiene un costo fijo de 20.000 (dólares) para preparar el equipo antes de la pri­mera exploración.
Si cada exploración exitosa cuesta $30.000 y cada exploración fallida, $15.000, encuentre el costo total esperado de la em­presa para las 10 exploraciones.
*Rta: $ 185.000

50. Supóngase que la probabilidad de éxito es 0,10 y el número de observaciones es 100. Encuentre la media y la desviación estándar de la distribución probabilistica, tanto para el número como para el porcentaje de éxitos.
*Rta: 10; 3; 0.10; 0.03


Distribución de Probabilidad de
POISSON


51. Si el 1% de las bombillas fabricadas por una compañía son de­fectuosas, hallar la probabilidad de que en una muestra de 100 bombillas 3 sean defectuosas.
*Rta: .06131

52. Si la probabilidad de que una persona adquiera la enfermedad como consecuencia de una vacuna contra la misma es 0.0002; Cuál es la probabilidad de que adquieran exactamente 3 personas en una población de 10.000 vacunados? Menos de 3? más de 3?
*Rta: .1804, .6765, .1431

53. Se estima que cada una de 10.000 personas es alérgica a cierta sustancia utilizada en la fabricación de cosméticos. Cuál es la probabilidad de que en 20.000 usuarios, más de 5 personas sufran reacciones alérgicas, debido a su uso? (P más de 2)=?; P (al menos 1 ) =?; P (menos de 3) =?)
*Rta: .0166, .3233, .8647, .6765

54. Supóngase que en una Empresa aérea se ha enterado el superior de vuelos, que en promedio uno de cada 150 vuelos se retrasan más de una hora. Si se hacen 1500 vuelos en un mes, cuál es la probabilidad de que:
a) Exactamente 3 vuelos se retrasen mas de una hora?
b) Más de 3 vuelos se retrasen más de una hora?
c) Menos de 5 vuelos se retrasen más de una hora?
*Rta: .008085; .9889; .03108

55. Después de una prueba de laboratorio muy rigurosa con cierto componente eléctrico, el fabricante determina que en promedio sólo fallarán dos componentes antes de tener 1000 horas de operación. Un computador observa que son 5 los que fallan an­tes de las 1000 horas. Si el número de componentes que fallan es una variable aleatoria de Poisson. ¿ Existe suficiente evidencia para dudar de la conclusión del fabricante?
*Rta: .0361; .0527

56. Las lesiones laborales graves que ocurren en una planta side­rúrgica, tienen una media anual de 2.7. Dado que las condiciones de seguridad serían iguales en la planta durante el próximo año, cuál es la probabilidad de que el número de lesiones graves sea menor que dos?
*Rta: .249

57. Si la probabilidad de que una viga de concreto falle por com­presión es de 0.05, determine la probabilidad de que de una muestra de 50 vigas:
a) Por lo menos 3 fallen por compresión;
b) Ninguna viga falle por compresión.
*Rta: .4775; .082

58. En un almacén particular los clientes llegan al mostrador de caja, conforme una distribución de Poisson con un promedio de 7 por hora. En una hora dada, ¿ Cuál es la probabilidad de que:
a) No lleguen más de tres clientes ?
b) Lleguen al menos 2 clientes?
c) Lleguen exactamente cinco clientes?
Rta: .0818; 1-8e**-7; .1277

59. Una vendedora se da cuenta de que la probabilidad de venta en una entrevista única es aproximadamente 0.03, Cuál es la pro­babilidad de que ella haga al menos una venta al tener 100 compradores posibles?
*Rta: 1-.97 **100

60. Según la "U.S Fire Administration", 185 personas murieron en 12,438 incendios en hoteles y moteles en 1979, o sea aproximadamente 1.5 muertos por cada 100 incendios CU.s. New and report, agosto 3 de 1991).

a) Cuál es la probabilidad de que el Número de muertos exceda de 8, si en una región ocurrieron 200 incendios en hoteles y moteles? (El promedio de muertos para 200 incendios es igual a 2 (1.5)=3).
b) Al ocurrir 200 incendios en cierta región y al exceder el número de muertos de 8. ¿Sospecha Usted que la razón promedio de muertos en la región seria más alta que la media nacional? Explique.
*Rta: .004; si.



Distribución de Probabilidad
GEOMETRICA.


61. Los registros indican que una cierta vendedora tiene éxito en formalizar una venta en 30% de sus entrevistas. Supóngase que una venta en cualquier otro momento es independiente. Cuál es, la probabilidad de que esta vendedora tenga que tratar con 10 personas antes de hacer su primera venta?
*Rta: 0.012

62. Si la probabilidad de que falle un motor durante cualquier pe­ríodo de una hora es p = 0,02 y si Y es el número de períodos horarios hasta la primera falla, hallar la media y desviación estándar de Y.
*Rta: 50; 49.497

63. Se supone que el 30% de los aspirantes para cierto trabajo industrial tiene un entrenamiento avanzado en programación. Los aspirantes son entrevistados, uno tras otro y son seleccionados al azar del conjunto de aspirantes. Determine la probabilidad de que se encuentre el primer aspirante con un entrenamiento avanzado en programación en la quinta entre­vista. Cuál es el número esperado de aspirantes que hay que entrevistar para encontrar el primero con un entrenamiento avan­zado?
*Rta: 0.072; 3.333

64. Un explorador de petróleo perforará una serie de pozos en cierta área para encontrar un pozo productivo. La probabilidad de que tenga éxito en una prueba es 0.2.

a) Cuál es la probabilidad de que el primer pozo productivo sea el tercer pozo perforado?
b) Cuál es la probabilidad de que el explorador no vaya a en­contrar un pozo productivo, si solamente puede perforar a lo más 10 pozos?
*Rta: 0.128; 0.8**10

65. Cuantos pozos espera que tendría que perforar el explorador del ejercicio anterior, antes de encontrar un pozo productivo? Ex­prese su respuesta en forma intuitiva.
*Rta: E=5; E=4 antes

66. Se estima que el 60% de una población de consumidores prefiere una marca particular de pasta de dientes A. ¿ Cuál es la probabilidad, al entrevistar a un grupo de consumidores, de que se tenga que entrevistar exactamente 5 personas para encontrar el primer consumidor que prefiere la marca A? Al menos 5 personas?
*Rta: 0.01536; 0.0256


67. Una agencia de seguros encontró que 1 de 100 reclamaciones de los seguros de propiedades excede de 1 millón (de dólares) si Y el número de demandas archivadas antes de encontrar la primera demanda por más de $ 1 millón, halle la media y desviación estándar de Y.
*Rta: 9


Distribución de Probabilidad
HIPERGEOMETRICA.

68. Un furgón contiene 20 computadoras electrónicas grandes, 2 de las cuales
estaban defectuosas. Si se seleccionan al azar tres computadoras del furgón:
Cuál es la probabilidad de que 2 de ellas tengan desperfectos?
*Rta: 0.016

69.. Un producto industrial se embarca en lotes de 20. La prueba para determinar si un articulo es defectuoso es costosa y por lo tanto, se examina solamente una muestra de 5 artícu­los de cada lote y se rechaza el lote si se encuentra más de un artículo defectuoso.
a. Si un lote contiene cuatro defectuosos, cuál es la pro­babilidad de que sea rechazado?
b. Cuál es el número promedio esperado de defectuosos en la muestra de 5? Hallar los intervalos al 95%.
*Rta: 0.2487; 1; 0.632 , 1+.79498


70. Considérese un fabricante de automóviles que compra los motores a una compañía donde se fabrican bajo estrictas especificaciones. El fabricante recibe un lote de 40 motores. Su plan para aceptar el lote consiste en seleccionar 8 y someterlos a prueba. Si encuentra que ninguno de los motores presenta serios defectos, el fabricante acepta el lote; de otra for­ma lo rechaza. Si el lote contiene dos motores con serios defectos, Cuál es la probabilidad de que sea aceptado?
*Rta: 0.6359

71. Es una caja de 10 fusibles, 2 de ellos están defectuosos. Si se examina una muestra aleatoria de 4 fusibles, cuál es la probabilidad de encontrar:
a). Ninguno defectuoso?
b). Uno defectuoso?
c). Uno ó menos defectuosos?
*Rta: 0.333; 0.533; 0.866

72. Suponga que un radioreceptor contiene seis transistores, de los cuales dos
son defectuosos. Se quitan y prueban tres transistores al azar. Si Y el número
de defectuosos encon­trados, en donde Y = 0, 1 o 2. Encuentre la
probabilidad. Ha­llar la media y la varianza para una muestra aleatoria n= 5.
*Rta: 0.2; 0.6; 0.2



Distribución de Probabilidad
NORMAL


73. Hallar el área bajo curva normal:
a) entre Z = 0 y Z = 1.2
b) entre Z = - 0.68 y Z = 0
c) entre Z = - 0.46 y Z = 2.21
d) entre Z = 0.81 y Z = 1.94
e) a la izquierda de Z = - 0.6
f) a la izquierda de Z = 0.68
g) a la derecha de Z = - 1.28
h) a la derecha de Z = 1.04
i) a la derecha de Z = 1.04 y a la izquierda de Z = - 0.6
j) a la derecha de Z = - 2.28 y a la izquierda de Z = 1.96

74. Encontrar el valor de Z:
a) El área a la derecha de Z es igual a 0.2266
b) El área a la izquierda de Z es igual a 0.0314
c) El área entre - 0.23 y Z es igual a 0.5722
d) El área entre 1.15 y Z es igual a 0.0730
*Rta: 0.75; - 1.86; 2.08; 1.62

75 Ciertos estudios demuestran que el consumo de gasolina de los autos medianos
tiene una distribución normal con un consumo medio de 25.5 km/galón y con
una desviación estándar de 4.5 km/galón.
a) Que porcentaje de autos medianos consumen 30 ó más km/galón?
b) Si un fabricante desee producir un automovil que tenga un mejor
rendimiento que el 95% de los autos existentes, cuántos km por galón
debe recorrer este nuevo auto?
*Rta: 0.1587; 32.9 km/galón

76. Si X se encuentra distribuida normalmente con un promedio igual a 10 y una desviación estándar igual a 2, calcule la probabilidad:
a) X < 12
b) X > 11
c) X > 9
*Rta: 0.8413; 0.3085; 0.6915

77. La medición del diámetro interior de un tubo de fundición esta normalmente distribuida con una media de 5.01 cm y una desviación estándar de 0.03 cm. Los límites de especificación son: 5.00 + 0.05 cm y 5.00 – 0.05 cm.
a) Que porcentaje de tubos de fundación es inaceptable?
b) Que diámetro mínimo debe tener el tubo, si se encuentra en el 12% del límite inferior?
*Rta: 0.1148, 4.97 cm.

78. Si el promedio de permanencia de una cuenta de ahorros es de 18 meses y una desviación estándar de 6.45 meses:
a) Si un depositante abre una cuenta de ahorros en un banco, cuál es la probabilidad de que aún haya dinero en esa cuenta después de 22 meses?
b) Cuál es la probabilidad de que la cuenta se haya cerrado antes de los dos años?
c) Cuántos meses durarán el 90% de las cuentas?
*Rta: 0.2676; 0.8238, 26.25 meses.

79. La duración de una bombilla esta normalmente distribuida con un promedio de 1.860 horas y una desviación estándar de 68 horas. Estimar el porcentaje de bombillas que duren:
a) más de 2000 horas;
b) menos de 1750 horas.
c) Cuántas meses durarán 92% de las bombillas?
*Rta: 0.0197; 0.0526; 1955.88 meses.

80. Se observo durante un largo periodo que la cantidad semanal gastada en mantenimiento y en las reparaciones en cierta fabrica tiene una distribución normal con una media de $400 y desviación estándar de $20. Si el presupuesto para la próxima semana es de $450, ¿Cuál es la probabilidad de que los costos reales sean mayores que la cantidad presupuestada?
*Rta: 0.0062

81. Una empresa metalmecánica produce rodamientos con diámetros que tienen una distribución normal con una media de 3.0005 pulgadas y una desviación estándar de 0.0010 pulgadas. Las especificaciones requieren que los diámetros estén en el intervalo 3.000 + 0.0020 y 3.000 – 0.0020 pulgadas. Se rechazan los cojinetes que quedan fuera Del intervalo y deben volverse a maquinar. Con la maquinaria actual, ¿qué fracción de la producción total será aceptada? ¿Rechazada?
*Rta: 0.9270; 0.0730

82. Los alambres que se utilizan en cierta computadora deben tener una resistencia entre 0.12 y 0.14 ohms. Las resistencias reales de los alambres producidos por la compañía A tienen una media de 0.13 ohms y una desviación estándar de 0.005 ohms.
a) Cuál es la probabilidad de que un alambre seleccionado al azar satisfaga las especificaciones?
b) Cuál es la probabilidad de que los cuatro satisfagan las especificaciones?
*Rta: 0.9544; 83

83. Se supone que los resultados de un examen tienen una distribución normal con una media de 78 y una varianza de 36.
a) Cuál es la probabilidad de que una persona que presenta el examen obtenga calificaciones mayores que 72?
b) Suponga que a los estudiantes que se encuentran en el 10% de la parte superior de la distribución se les asigna una calificación A. ¿Cuál es la calificación mínima que debe obtener un estudiante para tener una calificación A?
c) Cuál debe ser la mínima calificación aprobatoria si el aprobador pretende que el 28.1% de los estudiantes apruebe?
d) Se sabe que la calificación de un estudiante es mayor que 72, ¿Cuál es la probabilidad de que su calificación sea mayor de 8.4?
*Rta: 0.8413; 85.68; 81.48; 0.1886


Práctica STATGRAPHICS: Distribuciones de probabilidad
Probability Distributions.
Seguir los pasos 1 – 5.
Paso 6: Describe ® Distribution ® Probability Distributions
Paso 7: Probability Distributions
O Normal
O Binomial
O Poisson
O Hipergeometric
O Geometric Enter
Paso 8: En la tabla con el boton der. del Mouse
¯
Analysis Options Enter
Paso 9: Normal Options
Mean: Std. Dev.:
ð ð
Paso 10: Resumen.














martes, 11 de septiembre de 2007

ESTADISTICA INFERENCIAL, VI semestre, GUIA No: 1. ANALISIS DE REGRESION Y CORRELACION LINEAL

UNIVERSIDAD LIBRE

FACULTAD DE INGENIERÍA
DEPARTAMENTO DE AMBIENTAL

Asignatura: ESTADISTICA INFERENCIAL (02232)
Grupo: 6A
Profesora: ALLA GUTIERREZ

Guía No. 1

TEMA: ANALISIS DE REGRESION Y CORRELACION LINEAL.

Fecha: 2008


Objetivo:
Brindar a los estudiantes del curso los conocimientos fundamentales de las distintas ramas de la estadística, logrando introducir desde los conceptos básicos hasta los procedimientos de vanguardia con una visión practica que permita resolver problemas de las empresas en el ámbito de decisiones de riesgo, creando modelos estadísticos adecuados para una buena toma de decisiones.


Introducción:
Si se dispone de dos series de datos emparejadas, con frecuencia se desea conocer si ambas variables están relacionadas o si son independientes. Por ejemplo, ¿en qué medida, un aumento de los gastos en publicidad hace aumentar las ventas de un determinado producto? ó ¿será que existe alguna relación entre la talla y el peso de una persona?

A continuación, representaremos la relación entre dos variables mediante una gráfica llamada diagrama de dispersión, luego, estableceremos un modelo matemático para estimar el valor de una variable basándonos en el valor de otra, en lo que llamaremos análisis de regresión y finalmente estudiaremos el grado de relación existente entre las variables en lo que llamaremos análisis de correlación.


Competencias a desarrollar: Interpretativa

Desarrollar una visión amplia sobre el campo de estudio de la estadística y sus aplicaciones.
Distinguir entre la estadística descriptiva e inferencia estadística.
Estudiar las fuentes de datos, tablas y graficas.
Interpretar y describir las tendencias de datos y desarrollar la compresión de los conceptos básicos de probabilidad.
Facilitar la comprensión de los conceptos básicos de las distribuciones de probabilidad continuas y discretas.





Metodología:
Inducción: Explicación magistral en clase de teorías y conceptos, discusión y puesta en práctica de los mismos, por medio de ejercicios en clase y para que el estudiante realice su cuenta.
Profundización: Determinar y aplicar el modelo de regresión lineal en la predicción de valores.
Aplicar la regresión lineal para el pronóstico en series de tiempo.
Usar Excel en el modelo de regresión y correlación lineal.
Prácticas en la sala de computo utilizando Statgraphics o Excel.





Trabajo individual:


Buscar información y/o datos reales (mínimo 10 datos) de una variable Indep. Y Depend.

¡Presentar la Fotocopia o el original del fuente de los datos!

Sin utilizar programas de computador:
a) Plantear el tema, problema y objetivo.
b) Organizar los datos en una tabla.
c) Calcular el valor estimado, coef. de regresión y correlación (Interpretar cada resultado obtenido).
d) Graficar.
e) Resumir y analizar los resultados obtenidos.









Realización de ejercicios propuestos como tarea.

Perfeccionamiento:
Realizar el análisis de los resultados y presentar conclusiones.
Trabajo en grupos.
Prácticas en Statgraphics o Excel.

Socialización:
Individual o en parejas.

Evaluación:

Presentación de tareas. Presentación de trabajo, evaluación de conceptos.


Bibliografía


ANDERSON, David. SWEENEY, Dennis. WILLIAMS, Thomas. Estadística para administración y economía. México: Thomson, séptima edición. 1999.
BERENSON Mark. LEVINE David. KREHBIEL Timothy. Estadística para administración. México: Prentice Hall, Segunda edición. 2000.
CHAO LINCOLN. Estadística para ciencias administrativas. Bogotá: Mc Graw Hill, tercera edición. 1993.
MARTINEZ Bencardino Ciro. Estadística y Muestreo. Bogotá: Ecoe ediciones, décima edición. 2000.

SPIEGEK, Murray R. Teoría y problemas de Estadística. Bogotá: Mc Graw Hill.

MASSON y LIND. Estadística para administración y economía. Alfaomega.

PORTUS, Lincoyan. Curso práctico de estadística. Ed. Mc Graw Hill.

FREUND, John. Estadística Elemental. Ed Prentice Hall.

WALPONE y MYERS. Probabilidad y estadística. Ed. Mc Graw Hill.





REGRESIÓN Y CORRELACIÓN LINEAL

Si se dispone de dos series de datos emparejadas, con frecuencia se desea conocer si ambas variables están relacionadas o si son independientes. Por ejemplo, ¿en qué medida, un aumento de los gastos en publicidad hace aumentar las ventas de un determinado producto? ó ¿será que existe alguna relación entre la talla y el peso de una persona?

A continuación, representaremos la relación entre dos variables mediante una gráfica llamada diagrama de dispersión, luego, estableceremos un modelo matemático para estimar el valor de una variable basándonos en el valor de otra, en lo que llamaremos análisis de regresión y finalmente estudiaremos el grado de relación existente entre las variables en lo que llamaremos análisis de correlación.

La relación existente entre dos variables puede ser lineal, cuadrática, exponencial, logarítmica, etc. En este documento vamos a centrarnos en la posible relación lineal entre dos variables.





DIAGRAMA DE DISPERSIÓN

En un plano cartesiano se representan tantos puntos como pares de observaciones se tengan, correspondiendo cada punto a un par de observaciones; a esta representación gráfica se le denomina indistintamente diagrama de esparcimiento o nube de puntos.



RECTA DE REGRESIÓN

Se llama así a la recta que atraviesa la nube de puntos y que mejor se ajusta a ellos. El modelo matemático que describe una relación lineal cuando se estima el valor de Y en función de x esta dada así, Y = a + bx ó Y= Bx + A. (Esta última notación es la empleada en las calculadoras CASIO)

Donde:

Y es la variable que se va a estimar en función de otra variable (x) que se supone conocida. Se le denomina también como variable dependiente, explicada o predictando.

x es la variable cuyo valor supuestamente se conoce, se le denomina variable independiente, predictor o explicativa.

b es la pendiente o sea la que determina el ángulo de inclinación de la recta. Denominada coeficiente angular, cuantificando la cantidad que aumenta o decrece Y por cada unidad que aumente o disminuya la variable independiente x.

El coeficiente angular puede representarse así:

b > 0
b < b =" 0">a , corresponde al coeficiente de posición. Es el valor donde la recta intercepta al eje Y. Puede ser mayor, menor o igual a 0.

Se debe encontrar la línea que represente al conjunto de puntos, para lograr esto se deben determinar los coeficientes de regresión muestrales (Coeficiente angular y de posición) que son estimadores de los parámetros o coeficientes de regresión poblacional. Los valores de b y c corresponden a aquellos que hacen que los Yi sean lo más cercanos posibles a los valores observados yi, para determinarlos lo más indicado es aplicar el método de los mínimos cuadrados.

CRITERIO DE LOS MÍNIMOS CUADRADOS:

En el método de los mínimos cuadrados se emplean los datos de la muestra para determinar los valores de b y c que minimizan la suma de los cuadrados de las desviaciones entre los valores observados de la variable dependiente yi, y los valores estimados de la variable dependiente, Yi. Este criterio se puede expresar así:

Mín S( yi – Yi)2
Siendo
yi = valor observado de la variable dependiente para la i-ésima observación.
Yi = valor estimado de la variable dependiente para la i-ésima observación.

Aplicando el cálculo diferencial se puede demostrar que los valores de b y c que minimizan la anterior expresión se pueden determinar con las siguientes ecuaciones:




El valor de b, se puede obtener mediante otras fórmulas, la consulta de las cuales se deja como ejercicio.


PREDICCIÓN:

Uno de los fines al obtener la ecuación de regresión es el poder emplearla para predecir el valor de y para determinado valor de x. Se debe tener precaución al aplicar la ecuación de regresión para hacer predicciones fuera del intervalo de valores de la variable independiente, porque fuera de él no se puede asegurar que sea válida la misma relación.

En el análisis de correlación, se determina el grado de relación que puede haber entre dos variables. Este grado de correlación lo obtenemos mediante el cálculo del Coeficiente de correlación.

COEFICIENTE DE CORRELACIÓN:

Denominado coeficiente de correlación lineal de Pearson y simbolizado por r o R, es una medida de interdependencia de dos variables aleatorias, y su valor oscila entre –1 y +1.

Su cálculo se puede realizar mediante la aplicación de la siguiente fórmula:

Donde:
El valor de r se aproxima a +1 cuando la correlación tiende a ser lineal directa (mayores valores de x, significan mayores valores de y) y se aproxima a –1 cuando la relación tiende a ser lineal inversa.

Si no hay correlación de ningún tipo entre dos variables aleatorias, entonces tampoco habrá correlación lineal, por lo que r = 0. Sin embargo el que ocurra que r= 0, sólo nos dice que no hay correlación lineal, pero puede que la haya de otro tipo.

El siguiente diagrama resume el análisis del coeficiente de correlación entre dos variables:

Correlación negativa perfecta
Correlación negativa moderada
Ninguna correlación
Correlación positiva perfecta
Correlación positiva moderada
Correlación negativa fuerte
Correlación positiva fuerte
Correlación positiva débil
Correlación negativa débil
0
0.5
– 0.5
– 1
1



COEFICIENTE DE DETERMINACIÓN:

Denominamos coeficiente de determinación R2 como el coeficiente que nos indica el porcentaje del ajuste que se ha conseguido con el modelo lineal, es decir el porcentaje de la variación de Y que se explica a través del modelo lineal que se ha estimado, es decir a través del comportamiento de X. A mayor porcentaje mejor es nuestro modelo para predecir el comportamiento de la variable Y.

También se puede entender este coeficiente de determinación como el porcentaje de varianza explicada por la recta de regresión y su valor siempre estará entre 0 y 1 y es igual al cuadrado del coeficiente de correlación (r).

R2 = r2

Es una medida de la proximidad o de ajuste de la recta de regresión a la nube de puntos. También se le denomina bondad del ajuste.

1 - R2 nos indica qué porcentaje de las variaciones no se explica a través del modelo de regresión, es como si fuera la varianza inexplicada que es la varianza de los residuos.

EJEMPLO:

Los siguientes datos fueron recopilados por un gerente de ventas y corresponden a los años de experiencia y las ventas anuales de 5 de sus empleados:

Años de experiencia
6
12
15
21
24
Ventas anuales ($ millones)
38
68
83
113
128

Tomamos los años de experiencia como variable independiente.
A continuación se presentan los cálculos necesarios para determinar la ecuación de regresión con cuadrados mínimos.

vendedor i
xi
yi
xi yi
xi2
Yi2
1
6
38
228
36
1444
2
12
68
816
144
4624
3
15
83
1245
225
6889
4
21
113
2373
441
12769
5
24
128
3072
576
16384
Totales
78
430
7734
1422
42110

Aplicando la fórmula:


Se obtiene


b = 5.

El cálculo de la ordenada al origen (c) es el siguiente:


= 86 – 5(15.6)
= 8.


Por lo anterior, la función estimada de regresión, deducida con el método de los mínimos cuadrados, es

Y = 5X + 8

La pendiente de la función de regresión (b = 5) es positiva, lo cual implica que al aumentar los años de experiencia, las ventas también aumentan. De hecho, en este ejemplo, posemos llegar a la conclusión que las ventas aumenten en $ 5 millones por cada año de experiencia.

Si quisiéramos predecir el valor de las ventas anuales para un empleado que tiene 20 años de experiencia, el resultado sería:
Y = 5(20) + 8 = 108

En consecuencia, predeciríamos ventas anuales de 108 millones de pesos para este empleado.

A continuación, se analizará si el modelo desarrollado si es el adecuado para estimar y predecir.


Para hallar el coeficiente de correlación, se determinará primero la covarianza:


Se hallan las desviaciones típicas:


Luego el coeficiente de correlaci ón es



En este caso se tiene que las dos variables x (años de experiencia) y y (Ventas anuales) una relación lineal positiva perfecta. Esto es, todos los puntos de datos están en una recta con pendiente positiva (5).

El coeficiente de determinación en este caso también es igual a 1. Expresándolo de manera porcentual se tiene el 100%, lo cual significa que el 100% de la variación en las ventas se puede explicar con la relación lineal entre la experiencia y las ventas.




USO DE LA CALCULADORA EN LA REGRESIÓN LINEAL:

Si se dispone de una calculadora casio fx-3500p ó fx-3600p se pueden ejecutar los siguientes pasos, los cuales se van explicando tomando como modelo el ejemplo resuelto:

1. Oprimir las teclas mode 2 y en la pantalla debe aparecer LR (Regresión Lineal).

2. Con las teclas INV AC se borra la información que puede haber de trabajos anteriores. Para constatar el borrado, oprimir las teclas KOUT 3 y debe aparecer 0 en la pantalla. Si aparece otro número se repite el procedimiento.

3. Se introduce la información con la tecla [(... para la variable X, y con RUN para la variable Y. Teniendo en cuenta que primero es X1, luego [(..., a continuación Y1 RUN. Luego X2 [(... , Y2 RUN, y así sucesivamente. No debe haber equivocación al introducir los datos.

4. Introducida la información se comprueba, en parte, si la operación fue realizada correctamente oprimiendo KOUT 3, debe aparecer el número de parejas introducidas, en este caso 5.

5. Con la tecla KOUT y las teclas (1, 2, 3, 4, 5, 6) se obtiene lo que aparece en negrilla debajo de cada una de las teclas, así:
KOUT 1 = Sxi2 = 1422.
KOUT 2 = Sxi = 78.
KOUT 3 = n = 5.
KOUT 4 = Syi2 = 42110.
KOUT 5 = Syi = 430.
KOUT 6 = S xi yi = 7734.

6. Con la tecla INV y las teclas del 1 al 9 se obtiene lo que aparece señalado en rojo o anaranjado debajo de cada tecla.
INV 1 = media de X = 15.6
INV 2 = nsx = nS x = 6.41 (6.406246951). Corresponde a la desviación típica, elevando al cuadrado se obtiene la varianza Sx2 = 41.04
INV 3 = n-1sx = n-1S x = 7.16 (7.162401832)
INV 4 = media de Y = 86
INV 5 = nsy = nS y = 32.03 (32.03123476). La varianza Sy2= 1026
INV 6 = n-1sy = n-1S y = 35.81 (35.81200916).

El coeficiente de posición c se obtiene con INV 7 siendo igual a 8 y el coeficiente angular b con INV 8 igual a 5, con lo cual se tiene la función estimada de regresión Y = 5x + 8.

El coeficiente de correlación se obtiene con INV 9 siendo igual a 1.






APLICACIÓN DE EXCEL EN LA REGRESIÓN LINEAL:


Excel dispone de funciones que permiten trabajar con coeficientes correlación, regresión y otros conceptos sobre variables multidimensionales.

Para ver las funciones de la categoría Estadística, se hace clic sobre el icono insertar función, fx, de la barra de fórmulas (o se elige la opción Insetar función del menu Insertar), en la opción categoría de la función se elige Estadísticas, presentándose todas las funciones de dicha categoría en el cuadro Nombre de la función.





Para el ejemplo que venimos trabajando:



A
B
1
xi
yi
2
6
38
3
12
68
4
15
83
5
21
113
6
24
128




Si en el cuadro Nombre de la función hacemos clic sobre una función, por ejemplo la función COEF.DE.CORREL, se obtiene el siguiente cuadro. Una vez completados los argumentos (Variables X e Y) se obtiene el resultado en la parte inferior. Al pulsar Aceptar, la fórmula y su resultado se insertan en la celda activa de la hoja de cálculo.



A continuación, se presenta una relación de las funciones de Excel para correlación y regresión, acompañada de los resultados para el ejemplo que venimos trabajando para las variables X e Y de la hoja de cálculo cuyos valores ocupan los rangos A2:A6 y B2:B6. Para algunas funciones se presenta la caja correspondiente.










FUNCIÓN
VALOR QUE DEVUELVE
RESULTADO EN EL EJEMPLO
COVAR(X;Y)
Devuelve la covarianza de x e y definida por
205.2
COEF.DECORREL(X;Y)
Devuelve el coeficiente de correlación de x e y.
1
COEFICIENTE.R2(Y;X)
Da el coeficnete de determinación de y en x.
1
PENDIENTE(Y;X)
Da la pendiente de la línea de regresión de y sobre x. (Coeficiente angular)
5
INTERSECCION.EJE(Y;X)
Da la ordenada en el origen de la línea de regresión de y sobre x. (Coeficiente de posición)
8
PRONOSTICO(x; Y;X)
Halla la predicción según la línea de regresión de y sobre x para el valor k de la variable independiente.
Si x=20 entonces
y = 108




EJERCICIOS:



1. A continuación se presentan cinco observaciones de dos variables, X y Y.

xi
2
4
7
9
11
yi
24
30
31
36
40

a. Trace un diagrama de dispersión de datos.
b. ¿Que indica el diagrama trazado en el inciso a acerca de la relación entre las dos variables?
c. Trate de aproximar la relación entre x y y.trazando una recta que pase por los datos.
d. Forme la ecuación estimada de regresión calculando los valores de b y c.
e. Aplique la ecuación estimada de regresión para predecir el valor de y cuando x = 6.


2. Se ha realizado una observación a cinco familias respecto a el número de integrantes (x) y sus gastos mensuales (y) en agua en miles de pesos:


xi
2
5
7
8
10
yi
30
42
55
75
97

a. Hallar la recta de regresión.
b. ¿Cuanto se espera que gaste una familia si esta constituida por 6 personas?
c. Hallar el coeficiente de correlación y concluir.
d. Hallar el coeficiente de determinación y concluir.


3. Se dispone de 7 parejas de datos para los cuales se sabe:

n = 7
å x = 420,6
å y = 5958,7
å x y = 500073,09
å x 2 = 35119,7
å y 2 = 7213831,23

a. Hallar la recta de regresión.
b. Hallar el coeficiente de correlación y concluir.
c. Hallar el coeficiente de determinación y concluir.


4. En el semestre inmediatamente anterior el profesor de Estadística registro los puntajes obtenidos por sus estudiantes en una prueba inicial (de conocimientos elementales) y la nota definitiva en la materia en dicho semestre. Los resultados fueron los siguientes



Estudiante
1
2
3
4
5
6
7
8
9
10
Puntaje Prueba inicial
39
43
21
47
2
25
32
3
4
15
Definitiva
35
37
29
42
29
31
33
32
36
25


a. Elabore el diagrama de dispersión.
b. Obtenga la ecuación de la recta de regresión.
c. Si un estudiante obtuvo en la prueba inicial 45, ¿cuál sería la nota definitiva que se espera obtenga al final del semestre?
d. Si un estudiante obtuvo en definitiva 4.0, ¿qué edad puntaje habría obtenido en la prueba inicial?




5. Nota: Use Excel o una calculadora para resolver el siguiente problema:
Una compañía que fabrica partes para maquinaria quiere desarrollar un modelo para estimar el número de horas - trabajador requeridas para corridas de producción de lotes de diversos tamaños. Se selecciona una muestra aleatoria de 18 corridas de producción (2 para cada tamaño de lote de 10, 20, 30, 40, 50, 60, 70, 80 y 90) y se obtienen los siguientes resultados:



TAMAÑO DEL LOTE
HORAS – TRABAJADOR
TAMAÑO DEL LOTE
HORAS – TRABAJADOR
10
30
50
112
10
40
60
128
20
50
60
135
20
55
70
148
30
73
70
160
30
67
80
170
40
87
80
162
40
95
90
180
50
108
90
190



a. Grafique el diagrama de dispersión.
b. Suponga una relación lineal y utilice al método de mínimos cuadrados para encontrar los coeficientes de regresión A y B.
c. Interprete el significado de la ordenada A y la pendiente B en este problema.
d. Pronostique el número promedio de horas – trabajador requeridas para una corrida de producción con un tamaño de lote de 45.
e. ¿Por qué no es adecuado predecir el número promedio de horas – trabajador para una corrida de producción de un lote de tamaño 100? Explique.
f. Suponga que las horas – trabajador para el lote de tamaño 60 son 117 y 119. Resuelva los incisos a. y d. con estos valores y compare los resultados.