Bienvenida
Bienvenido/a a “Estadística Aplicada a las Ciencias y la Ingeniería” por Emilio L. Cano.
Este libro incluye los contenidos habitualmente presentes en el currículo de asignaturas de Estadística de los grados Ciencias e Ingenierías de universidades españolas. Aunque no aparezca en el título, el manual incluye también los contenidos de Probabilidad necesarios. Si bien existe abundante material bibliográfico que cubre los contenidos de estas asignaturas, quería elaborar un material propio que no fuera solamente para mis clases sino algo más global. En los últimos años ya lo hice para asignaturas de grado y Máster en ADE.1 Por otra parte, me motiva cubrir el hueco de los materiales de acceso gratuito con la opción de comprar una edición impresa2 y con el enfoque que se menciona en el siguiente apartado. Por otra parte, los libros publicados originalmente en inglés y traducidos al español a menudo me resultan lejanos a nuestro idioma (por muy buenas que sean las traducciones, los ejemplos en acres no son muy intuitivos para un lector español). Espero que también sirva para lectores de otros países de habla hispana.
Estándares y software
Los contenidos de este libro se basan en dos paradigmas que están presentes en los intereses de investigación y docencia del autor: los estándares y el software libre. En lo que se refiere a estándares, la notación utilizada, definiciones y fórmulas se ajustarán el máximo posible a la utilizada en normas nacionales e internacionales sobre metodología estadística. Estas normas se citarán pertinentemente a lo largo del texto. En cuanto al software libre, se proporcionarán instrucciones para resolver los ejemplos que ilustran la teoría utilizando software libre. No obstante, el uso del software es auxiliar al texto y se puede seguir sin necesidad de utilizar los programas. Según lo que proceda en cada caso, se utilizará software de hoja de cálculo, el software estadístico y lenguaje de programación R,3 y el software de álgebra computacional Máxima4. Respecto al software de hoja de cálculo, las fórmulas utilizadas se han probado en el software libre LibreOffice5, en Hojas de Cálculo de Google6 y también en Microsoft EXCEL7 que, aunque no es software libre, su uso está más que generalizado y normalmente los estudiantes disponen de licencia de uso a través de su universidad. En caso de que el nombre de la función sea distinta en EXCEL, se indicará en el propio ejemplo.
Las normas son clave para el desarrollo económico de un país. Estudios en diversos países, incluido España, han demostrado que la aportación de la normalización a su economía es del 1% del PIB8. La Asociación Española de Normalización (UNE) es el organismo legalmente responsable del desarrollo y difusión de las normas técnicas en España. Además, representa a España en los organismos internacionales de normalización como ISO9 y CEN10.
Las normas sobre estadística que surgen de ISO las elabora el Technical Committee ISO TC 6911 Statistical Methods. Por su parte, el subcomité técnico de normalización CTN 66/SC 312, Métodos Estadísticos, participa como miembro nacional en ese comité ISO. Las normas que son de interés en España, se ratifican en inglés o se traducen al español como normas UNE. Para una descripción más completa de la elaboración de normas, véase Emilio L. Cano, Javier M. Moguerza, and Mariano Prieto Corcoba13.
Estructura del libro
Este libro se ha elaborado utilizando el lenguaje Markdown con el propio
software R y el paquete bookdown.14
Se incluyen una gran cantidad de ejemplos resueltos tanto de forma analítica
como mediante software. En algunos casos se proporciona el uso de funciones
en hojas de cálculo (y el resultado obtenido con un recuadro).
En otros, código de R, que aparecen en el texto
sombreados y con la sintaxis coloreada, como el fragmento a continuación
donde se puede comprobar la sesión de R en la que ha sido generado este material.
Obsérvese que los resultados se muestran precedidos de los símbolos
#>
.
sessionInfo()
#> R version 4.2.3 (2023-03-15)
#> Platform: x86_64-apple-darwin17.0 (64-bit)
#> Running under: macOS Big Sur ... 10.16
#>
#> Matrix products: default
#> BLAS: /Library/Frameworks/R.framework/Versions/4.2/Resources/lib/libRblas.0.dylib
#> LAPACK: /Library/Frameworks/R.framework/Versions/4.2/Resources/lib/libRlapack.dylib
#>
#> locale:
#> [1] en_US.UTF-8/en_US.UTF-8/en_US.UTF-8/C/en_US.UTF-8/en_US.UTF-8
#>
#> attached base packages:
#> [1] stats graphics grDevices utils datasets
#> [6] methods base
#>
#> other attached packages:
#> [1] flextable_0.8.4 fontawesome_0.5.0
#>
#> loaded via a namespace (and not attached):
#> [1] zip_2.2.2 Rcpp_1.0.10 jquerylib_0.1.4
#> [4] bslib_0.4.2 compiler_4.2.3 later_1.3.0
#> [7] base64enc_0.1-3 gfonts_0.2.0 tools_4.2.3
#> [10] downlit_0.4.2 digest_0.6.31 uuid_1.1-0
#> [13] evaluate_0.20 jsonlite_1.8.4 memoise_2.0.1
#> [16] lifecycle_1.0.3 rlang_1.0.6 shiny_1.7.4
#> [19] cli_3.6.0 rstudioapi_0.14 yaml_2.3.7
#> [22] crul_1.3 curl_5.0.0 xfun_0.36
#> [25] fastmap_1.1.0 withr_2.5.0 officer_0.5.2
#> [28] knitr_1.42 xml2_1.3.3 fs_1.6.0
#> [31] sass_0.4.5 gdtools_0.3.0 systemfonts_1.0.4
#> [34] askpass_1.1 grid_4.2.3 glue_1.6.2
#> [37] httpcode_0.3.0 data.table_1.14.6 R6_2.5.1
#> [40] rmarkdown_2.20 bookdown_0.32 magrittr_2.0.3
#> [43] promises_1.2.0.1 ellipsis_0.3.2 htmltools_0.5.5
#> [46] mime_0.12 xtable_1.8-4 httpuv_1.6.8
#> [49] openssl_2.0.5 cachem_1.0.6 crayon_1.5.2
Normalmente, la descripción o enunciado de los ejemplos se incluyen en bloques con el siguiente aspecto:
Esto es un ejemplo. A continuación puede mostrarse código o no. Los ejemplos pueden ir precedidos por un icono para identificar su campo de aplicación, por ejemplo Biología, Ciencia y tecnología de Alimentos, o Ciencia e Ingeniería Ambiental.
Cuando el ejemplo incluya explicaciones sobre cómo resolverlo con software, estas explicaciones aparecerán en bloques con el siguiente aspecto:
HOJA DE CÁLCULO
La función FACT
obtiene el factorial de un número x (\(x!\)):
=FACT(5)
\(\boxed{\mathsf{120}}\)
También se incluirán con el formato anterior indicaciones para usar la calculadora científica, cuando esto sea posible.
El texto incluye otros bloques con información de distinto tipo, como los siguientes:
Este contenido se considera avanzado. El lector principiante puede saltarse estos apartados y volver sobre ellos en una segunda lectura.
Estos bloques están pensados para incluir información curiosa o complementaria para poner en contexto las explicaciones.
Este volumen cubre los contenidos de asignaturas básicas de Estadística en un amplio rango de grados. Puede servir también como repaso para alumnos de posgrado o incluso egresados que necesiten refrescar conocimientos o aprender a aplicarlos con software moderno. Un segundo volumen cubrirá en el futuro métodos y modelos avanzados para entornos más exigentes.
El libro está dividido en 4 partes. La primera parte está dedicada a la Estadística Descriptiva, y consta de un capítulo introductorio seguido de sendos capítulos para el análisis exploratorio univariante y bivariante. La segunda parte trata la Probabilidad en 4 capítulos, uno introductorio, dos dedicados a las variables aleatorias univariantes y bivariantes respectivamente, y finalmente un capítulo que trata los modelos de distribución de probabilidad. En la tercera parte se aborda la inferencia estadística, con una introducción al muestreo y la estimación puntual, seguida de capítulos dedicados a los contrastes de comparación de grupos, análisis de regresión y diseño de experimentos. La última parte está dedicada al control estadístico de la calidad, en la que, tras un capítulo introductorio, se tratan las dos herramientas más importantes en este campo: el control estadístico de procesos (SPC, Statistical Process Control, por sus siglas en inglés) y los muestreos de aceptación o, dicho de otra forma, la inspección por muestreo. Finalmente, una serie de apéndices con diverso material complementan el libro en su conjunto.
Sobre el autor
Emilio López Cano, Estadístico y entusiasta de R. Actualmente soy Profesor Contratado Doctor en la Escuela Técnica Superior de Ingeniería Informática e investigador en el Data Science Laboratory de la Universidad Rey Juan Carlos. Mis intereses de investigación incluyen Estadística Aplicada, Aprendizaje Estadístico y Metodologías para la Calidad. Previamente he sido profesor e investigador en la Universidad de Castilla-La Mancha, donde sigo colaborando en docencia e investigación, y Estadístico en empresas del sector privado de diversos sectores.
Presidente del subcomité técnico de normalización UNE (miembro de ISO) CTN 66/SC 3 (Métodos Estadísticos). Profesor en la Asociación Española para la Calidad (AEC). Presidente de la asociación Comunidad R Hispano.
Más sobre mí, información actualizada y publicaciones: http://emilio.lcano.com.
Contacto: emilio@lcano.com
El material se proporciona bajo licencia CC-BY-NC-ND. Todos los logotipos y marcas comerciales que puedan aparecer en este texto son propiedad de sus respectivos dueños y se incluyen en este texto únicamente con fines formativos. Se ha puesto especial cuidado en la adecuada atribución del material no elaborado por el autor, véase el Apéndice H. Aún así, si detecta algún uso indebido de material protegido póngase en contacto con el autor y será retirado. Igualmente, contacte con el autor si desea utilizar este material con fines comerciales.
Este obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0 Internacional.
Agradecimientos
Este libro es el resultado de años de trabajo en la docencia, investigación y transferencia de conocimiento en el campo de la Estadística. Está construido a partir de las contribuciones a lo largo de los años de compañeros y amigos como Javier M. Moguerza, Andrés Redchuk, David Ríos, Felipe Ortega, Mariano Prieto, Miguel Ángel Tarancón, Víctor M. Casero, Virgilio Gómez-Rubio, Matías Gámez, y muchos otros (perdón a l@s omitid@s por no ser más exhaustivo).
Especial agradecimiento a toda la comunidad del software libre y lenguaje de programación R, y en particular al R Core Team, al equipo de Posit (antes RStudio) y a los amigos de R Hispano.