Tag: Machine Learning

  • La primera edición de la escuela de Machine Learning en Sevilla de BigML reúne a 92 empresas y grandes organizaciones nacionales e internacionales.
  • 184 asistentes de 13 países acuden a Sevilla el 7 y 8 de marzo y posicionan a la capital andaluza como referente de la tecnología e innovación

Machine Learning School en Sevilla 2019

Machine Learning School in Sevilla que ha contado con la colaboración de la Consejería de Economía, Conocimiento, Empresas y Universidad, el Ayuntamiento de Sevilla y Cibersur, y los patrocinios de ITelligent,  La Caseta y qosITconsulting. Durante el 7 y 8 de marzo en el salón de actos de EOI Andalucía, 184 empresarios, analistas y científicos de todo el mundo se reunieron en Sevilla para asistir al mayor evento internacional de Machine Learning celebrado en Andalucía, la primera edición de la escuela de Machine Learning de BigML (MLSEV).

Los asistentes vinieron de 13 países (Andorra, Brasil, China, Dinamarca, España, Estados Unidos, India, Inglaterra, Irlanda, Italia, Líbano, Países Bajos y Portugal) para disfrutar de un evento de dos días de duración que ofreció clases magistrales, talleres prácticos para
trabajar los conceptos aprendidos y sesiones con casos de uso reales sobre cómo varias empresas nacionales e internacionales como Rabobank, TDK, T2Client, Talento Corporativo, SlicingDice, Jidoka, Good Rebels y AlterWork ya están aplicando el Machine Learning en sectores muy diversos como la banca, industria, marketing y el sector legal, entre otros.

Durante la inauguración y clausura de la primera edición de la escuela de Machine Learning de BigML en Sevilla, nos acompañaron el Secretario General de Empresa, Innovación y Emprendimiento en Junta de Andalucía, Manuel Ortigosa; el Secretario General de Economía en Junta de Andalucía, Manuel Alejandro Hidalgo; el Secretario General de Industria y de la Pequeña y Mediana Empresa del Ministerio de Industria, Comercio y Turismo, del Gobierno de España, Raúl Blanco; y Francisco Velasco, Director de la Escuela de Organización Industrial de Andalucía, también incluidos en la imagen de arriba.

Machine Learning School en Sevilla 2019 cartel

Machine Learning está transformando muchas industrias al tiempo que permite nuevos tipos de productos y servicios que nadie ha soñado hasta hace poco. Sin embargo, el conjunto de habilidades requerido para desarrollar aplicaciones de Aprendizaje automático en la vida real ha permanecido en su mayor parte en el terreno de los pocos académicos y científicos privilegiados. El mundo y la fuerza laboral global no pueden permitirse quedarse detrás de la curva en este habilitador clave de la tecnología, por lo que necesitamos con urgencia producir un grupo mucho mayor de profesionales con conocimientos de alfabetización en materia de ML, como desarrolladores, analistas, gerentes y expertos en la materia.

Para contribuir de manera significativa en este asunto, BigML , con la colaboración de la Escuela de Organización Industrial y el Ayuntamiento de Sevilla, preparan el lanzamiento de la primera edición de Machine Learning School en Sevilla. Machine Learning School o #MLSEV tendrá lugar los próximos 7 y 8 de marzo en el Salón de Actos de la Escuela de Negocios EOI, en el Parque Tecnológico de la Isla de la Cartuja (Sevilla).El objetivo del evento es acercar y desarrollar los conocimientos sobre el Machine Learning, para que los asistentes descubran el impacto que este puede llegar a tener en sus empresas y aprendan a aumentar significativamente su productividad.

Este evento es ideal para muchos profesionales que desean resolver problemas del mundo real aplicando el Machine Learning de manera práctica, por ejemplo, analistas, líderes empresariales, profesionales de la industria y cualquier persona que desee hacer más con menos recursos aprovechando el poder. Por este motivo, estará enfocado principalmente a altos mandos e intermedios de empresas así como personal del ámbito académico.

El #MLSEV de dos días de duración se incluirán clases magistrales, casos de usos y talleres prácticos que permitan a sus asistentes a aprender los conocimientos y técnicas básicas del Machine Learning. Además de los conceptos básicos, el curso cubrirá una selección de técnicas de vanguardia con ejemplos relevantes orientados a los negocios, como aplicaciones inteligentes, casos de uso en el mundo real en múltiples industrias, talleres prácticos y mucho más.

El aforo será limitado, con un cupo máximo de 200 personas, por lo que si estas interesado puedes registrarte hoy mismo y realizar tu solicitud para asegurar tu plaza. Podrás seguir las novedades del evento a través de la etiqueta #MLSEV en las redes Twitter, LinkedIn y Facebook.

lecturers MLSEV

La clasificación automática de documentos consiste en utilizar técnicas de Inteligencia Artificial sobre un conjunto de elementos para ordenarlos por clases o categorías. Sin embargo, también se pueden utilizar estas técnicas para asignar un documento a una determinada clase o categoría.

Par llevar a cabo la clasificación automática de documentos primero hay que realizar una extracción de features (características) destinadas a ser informativos y no redundantes. Esto facilitará los pasos posteriores de machine learning en la clasificación automática de documentos. La extracción de características (features) se trata de un proceso de reducción y codificación, donde un conjunto inicial de variables sin procesar (ej. texto en un documento) se reduce a características más manejables para su procesamiento (ej. números) y que se describa con precisión el conjunto de datos original.

Existen diversas técnicas de extracción de features:

Técnica clásicas

  • Term frequency – Inverse document frequency (TF IDF). Se trata una técnica muy utilizada en Machine Learning. para otorgar la relevancia de una palabra en un documento de una colección a través de una medida numérica. Esta medida numérica se utiliza para calificar la relevancia de una palabra dentro de un documento a partir de la frecuencia que aparece en el mismo. La idea en la que se basa esta técnica es que si una palabra aparece frecuentemente en el documento, debe ser importante y se le debe dar una puntuación alta. Sin embargo, si una palabra aparece frecuentemente en otros documentos, probablemente no sea un identificador único, y por tanto, se le debe asignar una puntuación más baja. Aquí, puedes consultar la fórmula matemática.

Nuevas técnicas basadas en Deep Learning:

  • Doc2vec. El objetivo principal de Doc2Vec es asociar documentos arbitrarios con etiquetas. Doc2vec es una extensión de word2vec que aprende a correlacionar etiquetas y palabras, en lugar de palabras con otras palabras. El primer paso es crear un vector que represente el “significado” de un documento para que luego se pueda utilizar como entrada a un algoritmo de aprendizaje automático supervisado y así asociar documentos con etiquetas.

Tras la extracción de features y en base a la información previa que se posea de los documentos a clasificar o categorizar, se podrán realizar diversas técnicas para la clasificación automática de documentos:

  • Clasificación supervisada. Cuando tenemos conocimiento del conjunto de documentos previamente clasificados de forma manual, ésto nos servirán para entrenar al sistema inteligente en la clasificación automática.
  • Clasificación no supervisada o clustering de documentos. Cuando no tenemos información a priori del conjunto de documentos ni de las categorías en las que deben estar clasificados.

Cuáles son las técnicas de clasificación automática de documentos más usadas

Según el tipo de clasificación, existen:

  • Técnicas de aprendizaje supervisado para clasificaciones supervisadas. Estas técnicas intentan reducir una función que partiendo de la colección de documentos (clasificación manual), tomando un documento de entrada sea capaz de predecir la clase o categoría a la que corresponde ese documento. En otras palabras, estas técnicas de clasificación supervisadas parten de un conjunto de documentos ya clasificados de forma manual (conjunto de entrenamiento) y se intenta asignar una clasificación a un segundo conjunto de documentos. Dependiendo del tipo de colección de documento o tipo de documentos a clasificar, se utilizarán unas técnicas u otras, desde algoritmos de clasificación bayesianos, arboles de decisiones, redes neuronales, …
  • Algoritmos de clustering para clasificaciones no supervisadas. Cuando no se disponen de un conjunto de documentos previamente clasificados, se opta por, a partir de las propiedades de los documentos, agruparlos (clustering) según sus semejanzas entre sí.

 

Las recomendaciones forman parte de la cotidianidad de las personas ya sea facilitarnos la decisión de qué película ver, qué zapatos comprar, a qué restaurante ir, o a qué lugar viajar, entre cientos de decisiones que tomamos a diario. Estas recomendaciones pueden desarrollarse empleando tecnologías con técnicas y algoritmos de inteligencia artificial.

En computación, los sistemas de recomendación estudian las preferencias y gustos de los usuarios con el objetivo sugerirles ítems (contenidos) factibles y de interés. Un sistema de recomendación (o “recomendador”) asiste al usuario para filtrar items relevantes de información en base a una serie de criterios u objetivos, ya sean preferencias, gustos o necesidades, que constituyen el perfil personalizado de un usuario determinado. En otras palabras, se trata de un sistema inteligente que ofrece a los usuarios sugerencias (o recomendaciones) personalizadas sobre un determinado contenido (o ítem).

No olvidemos que este es el objetivo principal de un sistema de recomendación: ofrecer contenido personalizado (películas, zapatos, productos, lugares, …) a los usuarios en base a su perfil (preferencias o intereses).

¿Cómo funcionan los sistemas de recomendación?

Estos sistemas de recomendación analizan y procesan datos históricos de los usuarios (gustos, preferencias, patrones de conducta, calificaciones, compras, etc) de una serie de ítems (marcas, productos, contenidos, servicios, precios, etc) y la transforma en información interesante para el propio usuario que necesita tomar una decisión de compra, una consumición o realizar cualquier otra acción. Desde un punto de vista más técnico, existe diversos enfoques para analizar y procesar el perfil personalizado del usuario a través de filtros (algoritmos) colaborativos, filtros basados en contenido, filtros demográficos o filtros basados en el historial del usuario, entre otros. También, existen algunos sistemas de recomendación que hacen uso de un enfoque híbrido combinando varias de estas técnicas.

sistema de recomendacion_spotify

Los recomendadores habitualmente son de tres tipos, pueden basarse tanto en el contenido (ítem) como en interacciones (acciones de usuarios activos) o en un mix de ambos tipos. Veamos en qué consiste cada uno de ellos:

Sistemas de recomendación basados en contenido: Si te gustó el libro “¿Sueñas los androides con ovejas eléctricas?” probablemente te guste la película “Blade Runner”. Este sistema de recomendación se centra en utilizar los contenidos y características de los productos (items o contenidos) para encontrar similitudes con otros productos. Este tipo de recomendador es muy útil cuando un sistema posee escasa información sobre los gustos y preferencias de los usuarios.

Sistemas de recomendación basados en interacciones. Dime con quién andas, y te diré quién eres. Esta es la idea fundamental para comprender en qué consiste este tipo de recomendador. Para realizar una recomendación, el sistema no necesita información acerca de los productos (ítmes o contenidos) sino únicamente acerca de las interacciones que realizan los usuarios. A este tipo de recomendadores se les conoce como sistemas de recomendación colaborativos, ya que se basan en las acciones que realizan otros usuarios (colaboradores) para ofrecer una recomendación personalizada al perfil de un usuario. Sirve para realizar predicciones automáticas a partir de la recopilación de interacciones de otros consumidores con interese comunes.

Sistemas de recomendaciones híbridos. Se trata de una combinación de ambos recomendadores. Un claro ejemplo de un sistema de recomendación basado en contenido y en interacciones es la plataforma Netflix. Por un lado, el dashboard de la app te muestra una parrilla personalizada donde te recomienda qué serie, documental o película ver en base a los contenidos que has visto (si ves varias películas de ciencia ficción, te recomienda películas del mismo género). Y por otro lado, en base a las películas vistas de otros usuarios similares a tus preferencias, te recomienda películas que quizás son de otros géneros pero que en base a las similitudes con otros usuarios te propone otras película que visionar. Otros ejemplos pueden ser Amazon o Spotify, que realizan sugerencias en sus apps en base a lo que otros usuarios consumen y a tus consumos.