Di3 Ingeniería Industrial
Prefacio
1
Prerequisitos para el curso
1.1
Primer referencia biblográfica que puede ayudarte.
1.1.1
R para Ciencia de Datos
2
Introducción
2.1
TIPOS DE ANÁLISIS
2.1.1
Algunos aporte metodológicos
2.2
¿Cómo aporta la analítica de datos a estos problemas
2.3
El postulado de la Teoría de Darwin
2.4
Propuestas de apropiación de la Analitica de Datos.
2.5
Síntesis y aprendizaje.
3
Analítica de Datos
3.1
Teoría
3.1.1
Bases de la analítica de datos
4
Revisión de las herramientas de software y hardware disponibles
4.1
Software para celulares
4.2
Herramientas para PC
4.2.1
Análisis Bibliométrico
4.3
Análisis Cuantitativo y Porducción de Textos
4.4
Tecnologías
4.4.1
Nueral Net Tools
4.5
El impacto de las Finanzas
4.6
Casos de estudio para el aula virtual
5
Primer taller de trabajo
5.1
Encontrando a Antonov
5.1.1
Rescatas datos de excel dentro R-Cran
5.1.2
Captura de Archivo Local
5.2
Manejo de datos y estructuras
5.2.1
¿Qué columnas tienen esta tabla?
5.2.2
Pequeño análisis multivariado
5.2.3
Estudio más detallado
5.2.4
Calidad del modelo
5.2.5
Comparación
5.2.6
Predicción
5.2.7
Intervalos de confianza
5.2.8
Extrapolación
6
Redes Neuronales y Clusters
6.1
Implementación NeuralNet
6.1.1
Caso de estudio sistema de emergencias medicas
6.2
Contexto General
6.3
Introducción
6.4
Desarrollo
6.5
Generalizacion para la regresión lineal
6.5.1
Calidad del modelo lineal
6.5.2
Primera predicción
6.6
Construcción de la Red Neuronal
6.6.1
Grpafico de la Red Nuronal
6.7
Real vs Predicción
6.8
Validación cruzada
6.9
Resultado
6.10
Conclusiones
6.11
Referencias
7
Clusterización
7.0.1
Carga de datos desde archivos externos
7.1
Captura de datos
7.1.1
¿Desde dónde podemos cargar datos?
7.1.2
Revisión de Datos Ejemplo
7.2
Análisis Exploratorio
7.3
Historgramas Análisis de Histograma
7.4
Gráficos de Densidad
7.5
Gráficas Ralas y Análisis Multivariado
7.6
Mínimo numero de dimensiones
7.7
Análisis de Componentes Principales
8
Scores
8.1
Análisis de Clusters o Conglomerados
8.1.1
Otros gráficos de agrupamiento
9
Taller Redes Neuronales
9.1
Carge de bibliotecas
9.2
Carga de Datos
9.3
Tratamiento de variables categóricas
9.4
Histogramas superpuestos
9.5
Cuadro de campos categóricos
9.6
Profit versus País
9.7
Visualización de Tablas
9.8
Normailización
9.9
Modelo de Neural Net
9.10
Ploteo de la red Neuronal
9.11
Ploteo de la red proporcional
9.11.1
Evaluación de la performance del modelo
9.12
Predicted profit Vs Actual profit of test data.
9.13
Desnormalización de los resultados
9.14
Mejoramiento de la performance del modelo
9.15
Performance del modelo mejorado
9.16
Modelo Mejorado KPI
9.17
Neural Net Clasificación
9.18
Muestreo
9.19
Visualización del clasificador
9.20
Aramdos de set de entrenamiento y de predicción
10
Gestión del Riesgo
10.1
Definiciones:
10.1.1
Dsiminuir Riesgo = Aumentar la Certidumbre
10.2
KNN
10.2.1
Kesimo Vecino Más Próximo
10.2.2
Cargar datos frontera pareto
10.3
Riesgo y Estacionalidad
10.4
ARIMA S-ARIMA
10.4.1
Introducción
10.4.2
Business as Usual
10.5
Caso de estudio
10.5.1
Pre-Análisis Exploratorio de Datos (PAED)}
10.6
Ajuste del modelo
10.6.1
Tabla con caption
10.6.2
Tabla escalada
10.7
Tabla a lo ancho
10.8
Tablas centradas
10.8.1
Elección del mejor modelo
10.8.2
Medidas de diagnostico
10.8.3
Prueba de Box-Ljung
10.8.4
Función auto.arima ():
10.8.5
Predecir utilizando un modelo ARIMA
11
Árboles Clasificadores y Toma de Decisión
11.1
11.2
Clasificación con Diagrama Aluvial
11.3
Detalle de las variables categóricas
11.4
Valores de Empleos Generados (Freq)
11.4.1
Enálisis del ploteo de Empleos
11.4.2
Histograma de Montos Financiados
11.5
Montos Financiados
11.5.1
Creando el Diagrama
11.5.2
Algunos ejemplos de aluvial
11.6
Árboles de Decisión (clasificación)
11.7
Uso de un árbol de decisión
11.7.1
Entrenamiento del arbol
11.7.2
Nivel 1 del Árbol
11.7.3
Nivel 2
11.7.4
Nivel 3
11.7.5
Vista gráfica del arbol
12
Taller de ARIMA
12.1
El caso de consumo de Cemento de la Provincia de Jujuy
12.2
Test de Phillips-Perron (KPSS Unit Root Test)
12.3
Obtener el precio de las acciones.
12.4
Ejercicio de la cotización de HOLCIM Argentina
12.4.1
Gráfica de Precios
12.4.2
Gráfica de Volatilidad
12.4.3
Gráfica de Precios
12.4.4
Gráfica de Volatilidad
12.5
Bibiografía del capítulo
13
Minería de Texto
13.1
Análisis de Sentimiento
13.1.1
Politica Industrial, Desarrollo e Innovación
13.1.2
Análisis de Sentimiento con R
13.1.3
Preguntas
13.1.4
Preparación
13.1.5
Comando para instalar bibliotecas
13.1.6
Visualización
13.1.7
Importando los datos
13.1.8
Cargas datos en memoria
13.1.9
Nuestros datos lucen así:
13.1.10
Descargamos este léxico de la siguiente dirección:
13.1.11
Aplicación del léxico
13.1.12
Este léxico luce así:
13.2
Preparación preliminar de datos capturados
13.2.1
Convirtiendo tuits en palabras
13.2.2
Analítica Lexográfica
13.2.3
Cambio Columna
13.3
Exploración
13.3.1
Palabras Totales
13.3.2
Palabras Únicas
13.3.3
Palabras Positivas
13.3.4
Similitudes
13.3.5
Resultados
13.3.6
Tendencias
13.3.7
Ploteo de resultados
13.3.8
Tendencia de Candidatos
13.3.9
Usando LOESS (regression local)
13.3.10
LOESS
13.3.11
Tendencia
13.3.12
Identificación
13.3.13
Ajuste Lineal
13.3.14
Clarificación
13.3.15
Usando la media móvil
13.3.16
Media Móvil
13.3.17
Comparación de Gráficas
13.3.18
Proporciones
13.3.19
Imagen positiva y Negativa
13.3.20
Imagen Positiva y Negativa por Fecha
13.3.21
Bloxplots (diagrama caja y bigotes)
13.3.22
Boxplot
13.3.23
Dinámica de los cambios
13.3.24
Dinámica
13.3.25
Usando densidades
13.3.26
Densidad
13.3.27
Tendencias Dinámicas
13.4
Conclusiones del análisis de sentimiento
14
Datasets
15
Datasets utilizados en el curso
15.1
WASH
15.2
Impactos de la aglomeración industrial en la eficiencia ecológica y polución
15.3
Implementación de algoritmo K-Means para dispositivos eterogeneos (cpu/gpu)
15.4
(Infrastructure) Global Wine Statistics Trained Neural Net
15.5
Aerocargo Trafic Argentina - from 2014 to 2019 (no covid-19 data included)
15.6
Energy Statistical Yearbook 2018 - Statistics
15.7
Herederos
15.8
Índice de Innovación Potencial
15.9
Residuos Agrícolas
15.10
Comparación de la competitividad de Bodegas Vitícolas de Mendoza
15.11
World Compliance Association
15.12
Empresas innovadoras
15.13
Uso de Energías Alternativas
15.14
Set de datos 50 Start Ups Latinoamérica y Caribe
Referencias
16
Minería de Textos II
16.1
Revisión de una tesis usando minería de textos.
16.1.1
Flujo de trabajo con rattle
16.2
Cargar las biblioteca para Minería de texto
16.2.1
Crear carpeta del CORPUS
16.2.2
Crear CORPUS
16.2.3
Examinando el objeto CORPUS
16.2.4
Examinando más detalles
16.3
Pre Prosesamiento
16.4
Remover Puntuaciones
16.5
Remover Comillas
16.6
Parte 2
16.6.1
Convertir Corpus a Minusculas
16.6.2
Remover Números
16.6.3
Remover artículos, preposiciones, etc
16.7
Remover espacios dobles
16.8
Familia de Palabras conversión en matriz de proximidad
16.9
Numero de terminos
16.9.1
Red de Términos
16.10
Matriz de Proximidad
16.10.1
Terminos Matriciales
16.10.2
Secuencias
16.10.3
Seciencias con la idea "cada" correlación 0.975
16.10.4
Seciencias con la idea "escala" correlación 0.975
16.10.5
Secuencias con la idea "modelo" correlación 0.975
16.10.6
Secuencias con la idea "transporte" correlación 0.975
16.10.7
Recomendación de Contactos Sugeridos
16.11
R Markdown
16.12
Including Plots
Published with bookdown
Material de Clase
Referencias