Validación de modelos predictivos en minería de datos

Validación de modelos predictivos en minería de datos PDF Author: José Alberto Frydman Prizant
Publisher:
ISBN:
Category :
Languages : es
Pages :

Get Book Here

Book Description
Aprendizaje de máquina (Machine Learning) es una de las áreas más importantes en inteligencia artificial y su reciente aplicación en la extracción de información en grandes bases de datos de la industria y los negocios se conoce como Minería de Datos (Data Mining). Dado que existe un número bastante grande de métodos de aprendizaje usados en Minería de Datos, ha surgido recientemente un mayor interés en su comparación y en establecer las ventajas y desventajas de cada uno. Saber escoger el mejor algoritmo para un problema en especial tiene un poco de ciencia y arte, y si bien se han comenzado a usar métodos estadísticos para este propósito, no existe un consenso en la comunidad de inteligencia artificial sobre cuál es la técnica adecuada para elegir el mejor método para un problema en particular. En esta investigación se propone el análisis de varianza como una técnica robusta que no presenta los inconvenientes de la prueba t apareada, ni el efecto multiplicativo cuando se comparan más de dos algoritmos. Saber elegir el mejor algoritmo para extraer información oculta de los repositorios puede considerarse una ventaja competitiva en todo negocio cuya operación genere o requiera gran cantidad de datos.

Validación de modelos predictivos en minería de datos

Validación de modelos predictivos en minería de datos PDF Author: José Alberto Frydman Prizant
Publisher:
ISBN:
Category :
Languages : es
Pages :

Get Book Here

Book Description
Aprendizaje de máquina (Machine Learning) es una de las áreas más importantes en inteligencia artificial y su reciente aplicación en la extracción de información en grandes bases de datos de la industria y los negocios se conoce como Minería de Datos (Data Mining). Dado que existe un número bastante grande de métodos de aprendizaje usados en Minería de Datos, ha surgido recientemente un mayor interés en su comparación y en establecer las ventajas y desventajas de cada uno. Saber escoger el mejor algoritmo para un problema en especial tiene un poco de ciencia y arte, y si bien se han comenzado a usar métodos estadísticos para este propósito, no existe un consenso en la comunidad de inteligencia artificial sobre cuál es la técnica adecuada para elegir el mejor método para un problema en particular. En esta investigación se propone el análisis de varianza como una técnica robusta que no presenta los inconvenientes de la prueba t apareada, ni el efecto multiplicativo cuando se comparan más de dos algoritmos. Saber elegir el mejor algoritmo para extraer información oculta de los repositorios puede considerarse una ventaja competitiva en todo negocio cuya operación genere o requiera gran cantidad de datos.

Realtime data mining aplicado a la predicción de índices de bolsa incluyendo social media analytics

Realtime data mining aplicado a la predicción de índices de bolsa incluyendo social media analytics PDF Author: Andrés Fernando Fuentes Medina
Publisher:
ISBN:
Category :
Languages : es
Pages :

Get Book Here

Book Description
El presente trabajo tiene que ver con la obtención de modelos predictivos para la bolsa de valores que funcionen en intervalos cortos de tiempo. Además de trabajar con los precios que tienen las acciones en determinado instante, se incorporan los mensajes de la red social Twitter que tienen relación con dichas acciones y así verificar su impacto. Inicialmente se describe el estado del arte, los conceptos y herramientas utilizadas a lo largo del proyecto, ya que por su naturaleza interdisciplinar incorpora temas como el data mining, machine learning, sentiment analysis y computación distribuida. Se explica la metodología usada, que va desde la extracción de datos hasta la presentación y evaluación de resultados. Se distingue dos partes fundamentales: análisis con datos históricos y análisis con datos en tiempo real. Se describe para ambas partes el preprocesamiento de datos, ya que estos por ser de distinta naturaleza se les aplica criterios diferentes, entre los que se trata la reducción de dimensión y el sentiment analysis. Para la obtención de los modelos predictivos se aplican tres métodos distintos de machine learning, se compara y se evalúa los resultados para finalmente escoger los mejores. Con la información extraída en los pasos previos se lleva a cabo la implementación en tiempo real mediante Apache Spark, para hacer predicciones en tres intervalos distintos de tiempo. Tomando en cuenta las consideraciones de trabajar con un flujo constante de datos se describe una aplicación que optimiza el tiempo necesario para la evaluación de este tipo de modelos en ambiente de pruebas. Los resultados obtenidos se comparan con los de los modelos de datos históricos. El resultado final del proyecto es la descripción de la arquitectura e implementación de un sistema para evaluación de modelos predictivos de acciones bursátiles con datos en stream. Las conclusiones se enmarcan en la verificación de agregar información de redes sociales a los clásicos modelos predictivos que toman en cuenta solamente precios de acciones, así como también el hecho de trabajar con información en tiempo real.

Tecnicas de Mineria de Datos. Modelos Predictivos

Tecnicas de Mineria de Datos. Modelos Predictivos PDF Author: Maria Perez Marques
Publisher: CreateSpace
ISBN: 9781494226916
Category : Business & Economics
Languages : es
Pages : 240

Get Book Here

Book Description
Las técnicas de minería de datos propiamente dichas, engloban técnicas predictivas enfocadas a la modelización y clasificación ad hoc, y técnicas descriptivas enfocadas generalmente a la clasificación post hoc y otro tipo de técnicas variadas. Las técnicas predictivas especifican el modelo para los datos en base a un conocimiento teórico previo. El modelo supuesto para los datos debe contrastarse después del proceso de minería de datos antes de aceptarlo como válido. Podemos incluir entre estas técnicas todos los tipos de regresión, modelos lineales generales GLM, modelos logísticos, análisis discriminante, árboles de decisión y redes neuronales. Pero, tanto los árboles de decisión, como las redes neuronales, el análisis discriminante y los modelos logísticos son a su vez técnicas de clasificación que pueden extraer perfiles de comportamiento o clases, siendo el objetivo construir un modelo que permita clasificar cualquier nuevo dato. Los árboles de decisión permiten clasificar los datos en grupos basados en los valores de las variables. El mecanismo de base consiste en elegir un atributo como raíz y desarrollar el árbol según las variables más significativas. Todas estas técnicas predictivas de modelización se tratan en este libro a través de ejemplos prácticos

Valora tu Hipótesis

Valora tu Hipótesis PDF Author: Asociación mentorDay
Publisher: mentorDay
ISBN:
Category : Business & Economics
Languages : es
Pages : 77

Get Book Here

Book Description
"Valora tu hipótesis" es una guía práctica diseñada para emprendedores y profesionales que buscan validar sus ideas de negocio utilizando modelos predictivos y análisis de datos. En este ebook, descubrirás cómo las técnicas avanzadas de aprendizaje automático, estadísticas y minería de datos pueden ayudarte a predecir comportamientos futuros, reducir riesgos y tomar decisiones informadas. Aprenderás a definir hipótesis de negocio, identificar los datos clave, construir modelos predictivos efectivos y verificar tus predicciones con datos reales. Este recurso es indispensable para quienes desean optimizar sus estrategias y maximizar las oportunidades de éxito de su empresa, al aplicar la inteligencia artificial de manera inteligente en la toma de decisiones.

Introducción a la Minería de Datos

Introducción a la Minería de Datos PDF Author:
Publisher: Editora E-papers
ISBN: 8576502313
Category :
Languages : es
Pages : 219

Get Book Here

Book Description


Mineria de Datos. Redes Neuronales Y Rboles de Decisin / Data Mining. Neural Networks and Decision Trees

Mineria de Datos. Redes Neuronales Y Rboles de Decisin / Data Mining. Neural Networks and Decision Trees PDF Author: Cesar Perez Lopez
Publisher: CreateSpace
ISBN: 9781493768400
Category : Computers
Languages : en
Pages : 196

Get Book Here

Book Description
Este libro profundiza en dos de las técnicas más habituales utilizadas en minería de datos, como son las redes neuronales y los árboles de decisión. El contenido se aborda de una forma sencilla y fácil de entender a través de una de las soluciones de software más comunes de entre las existentes en el mercado, en concreto, SAS ENTERPRISE MINER. Se persigue como finalidad inicial clarificar las aplicaciones relativas a métodos tradicionalmente calificados como difíciles u opacos. Se busca presentar las aplicaciones en la minería de datos sin necesidad de manejar desarrollos matemáticos elevados ni algoritmos teóricos complicados, que es la razón más común de las dificultades en la comprensión y aplicación de esta materia.Hoy en día se utiliza la minería de datos en diferentes campos de la ciencia. Cabe destacar las aplicaciones financieras y en banca, en análisis de mercados y comercio, en seguros y salud privada, en educación, en procesos industriales, en medicina, en biología y bioingeniería, en telecomunicaciones y en muchas otras áreas. Lo esencial para empezar a trabajar en minería de datos, sea cual sea el campo en que se aplique, es la comprensión de los propios conceptos, tarea que no exige ni mucho menos el dominio de aparato científico que conlleva la materia. Posteriormente, cuando ya sea necesaria la operatoria avanzada, los programas de ordenador permiten obtener los resultados sin necesidad de descifrar el desarrollo matemático de los algoritmos que están debajo de los procedimientos.

Validación interna de modelos predictivos de regresión logística

Validación interna de modelos predictivos de regresión logística PDF Author: Birja Manuel Fernández Félix
Publisher:
ISBN:
Category :
Languages : es
Pages : 46

Get Book Here

Book Description


CIENCIA DE DATOS. DIAGNOSIS DE MODELOS ECONOMÉTRICOS PREDICTIVOS

CIENCIA DE DATOS. DIAGNOSIS DE MODELOS ECONOMÉTRICOS PREDICTIVOS PDF Author:
Publisher: CESAR PEREZ
ISBN: 1716967554
Category : Business & Economics
Languages : en
Pages : 272

Get Book Here

Book Description
En este libro se tratan las fases de Análisis, Estimación y Validación de modelos profundizando en las técnicas de estimación y diagnosis para las tipologías de modelos más habitales. Se `profundiza en las problemáticas de la Autocorrelación, Heterescedasticidad, Multicolinealidad, Endogeneidad, Observaciones Influyentes, Normalidad Residual, Linealidad y otros problemas de diagnosis en los modelos predictivos de aprendizaje supervisado. Todas estas técnicas se ilustrarán con ejemplos significativos que serán resueltos utilizando el software más habitual, como R, SAS, SPSS y STATGRAPHICS.

Aplicación de técnicas de minería de datos para predecir la popularidad de noticias en Internet

Aplicación de técnicas de minería de datos para predecir la popularidad de noticias en Internet PDF Author: Joel Medina Jimenez
Publisher:
ISBN:
Category :
Languages : es
Pages :

Get Book Here

Book Description
La minería de datos es un estudio cuyo uso se ha empezado ha desarrollar hace pocos años. Hay una gran cantidad de información, pero gran parte de esta es bastante compleja. El presente trabajo se propone predecir, mediante la minería de datos, cuál será el nivel de popularidad de las publicaciones de una página web. Para llevarlo a cabo, se ha utilizado una metodología muy conocida para un buen uso de la minería de datos llamada CRISPDM. Esta metodología se compone de diferentes etapas las cuales se han seguido en este proyecto, poniendo más énfasis en las últimas fases. Para poder realizar este proyecto se ha usado un lenguaje de programación aprendido en el grado, llamado Python. Por medio del uso de librerías Pandas y Sklearn incluidas en Python, se ha conseguido crear modelos predictivos. También se ha empleado una plataforma llamada Anaconda donde mediante Spyder, se ha tratado de realizar una programación en Python más dinámica y así poder observar los resultados rápidamente.

Technology, Sustainability and Educational Innovation (TSIE)

Technology, Sustainability and Educational Innovation (TSIE) PDF Author: Andrea Basantes-Andrade
Publisher: Springer Nature
ISBN: 3030372219
Category : Technology & Engineering
Languages : en
Pages : 492

Get Book Here

Book Description
This book presents the proceedings of International Conference on Knowledge Society: Technology, Sustainability and Educational Innovation (TSIE 2019). The conference, which was held at UTN in Ibarra, Ecuador, on 3–5 July 2019, allowed participants and speakers to share their research and findings on emerging and innovative global issues. The conference was organized in collaboration with a number of research groups: Group for the Scientific Research Network (e-CIER); Research Group in Educational Innovation and Technology, University of Salamanca, Spain(GITE-USAL); International Research Group for Heritage and Sustainability (GIIPS), and the Social Science Research Group (GICS). In addition, it had the endorsement of the RedCLARA, e-science, Fidal Foundation, Red CEDIA, IEEE, Microsoft, Business IT, Adobe, and Argo Systems. The term “knowledge society” can be understood as the management, understanding and co-creation of knowledge oriented toward the sustainable development and positive transformation of society. In this context and on the occasion of the XXXIII anniversary of the Universidad Técnica del Norte (UTN), the Postgraduate Institute through its Master of Technology and Educational Innovation held the I International Congress on Knowledge Society: Technology, Sustainability and Educational Innovation – TSIE 2019, which brought together educators, researchers, academics, students, managers, and professionals, from both the public and private sectors to share knowledge and technological developments. The book covers the following topics: 1. curriculum, technology and educational innovation; 2. media and education; 3. applied computing; 4. educational robotics. 5. technology, culture, heritage, and tourism development perspectives; and 6. biodiversity and sustainability.