Tag: Product Matching

Actualmente, miles de millones de productos se venden online y existen numerosas plataformas e-commerce que los venden. Identificar y combinar determinados productos para diversos fines, como para la comparación de precios, se convierte en un desafío para el sector del comercio electrónico, ya que no existen identificadores únicos y globales para cada producto. En este punto es donde entra en juego la Inteligencia Artificial y el Machine Learning.

Existen diversos portales webs enfocados a la comparación de precios para obtener las mejores ofertas en un determinado producto como la contratación de seguros de coche. Estos comparadores de precios están enfocados al cliente pero… ¿y si somos una tienda online y queremos comparar los precios de los productos de la competencia con los nuestros? ¿Cómo podemos abordarlo?

Antes de profundizar, un breve aspecto a tener en cuenta: el naming y descripción de los productos no poseen un formato estándar. Cada tienda online incluye estos datos (marca, titulo y descripción del producto) en su web de diferente forma para un mismo producto. Asimismo, las imágenes que se muestran del producto tampoco son estandarizadas y pueden aparecer con diferente perspectiva, color, claridad, etc. Evidentemente, sí existen identificadores generalizados para algunos productos como son las pulgadas de un televisor, pero es posible que según el portal de venta online no lo mencionen, lo incluyan en el titulo del producto o lo incluyan en la descripción.

Por tanto, una persona de forma manual puede visitar diferentes tiendas online y verificar que éstas coinciden con los mismos productos. No obstante,  el problema surge cuando no es viable realizar esta labor de forma manual porque el coste sería muy elevado. Es aquí donde entra en juego la Inteligencia Artificial y el Machine Learning para automatizar el proceso de Product Matching.

¡La Inteligencia Artificial y Machine Learning al rescate!

Inicialmente, en las soluciones de machine learning para la coincidencia de productos, el proveedor de soluciones tiene que construir primero una base de datos de miles de millones de productos. Esto se hace mediante la recopilación de información a través de rastreos web y feeds (crawlers).

Una vez se tiene la base de datos, se realiza el proceso de Product Matching. Un producto puede identificarse utilizando su título, su descripción, imágenes y lista de atributos o especificaciones. En muchos casos, el título del producto en sí mismo proporcionará mucha información y el sistema tiene que aprender a ordenar el nombre del producto (por ejemplo, el modelo de marca) de los atributos (pulgadas, resolución, etc. Toda esta información debe extraerse, clasificarse y colocarse en las categorías apropiadas: modelo de televisor, versión, resolución, etc.

Para cada comparación, el sistema pasa por muchos pasos y verificaciones. Se busca un número de identificación único, una prueba de similitudes de palabras clave, normalización de marca y coincidencia (por ejemplo, LG es lo mismo que Life´s Good), normalización de atributo y coincidencia (32″es lo mismo que 32 pulgadas, 32 pulg. , 32 pulgadas), coincidencia de imágenes, etc.

LG televisor

Figura 1. Ejemplo de Televisor LG en dos portales webs diferentes y cuyo título y descripción no aparecen estandarizados.

Todo esto es un proceso complicado, y existen diferentes soluciones Product Matching que se pueden emplear con diferentes técnicas pero la ventaja es que las redes neuronales y los sistemas de Product Matching aprenden con el tiempo, incluso de sus errores, y así mejoran con cada uso.

Por otro lado, el procesamiento de las imágenes de productos puede proporcionarnos información relevante que no aparece reflejado en el titulo y/o descripción del producto. En la figura 2, podemos ver cómo detectar un mismo producto (ej. Nata Pascual) en dos supermercados diferentes (supermercado A, supermercado B). En el supermercado B tenemos dos productos de Nata Pascual y queremos ver cuál de los dos hace “match” con el supermercado A. Si atendemos únicamente a las taxonomías de la descripción, ambos productos del supermercado B coinciden, en parte, con la descripción del proudcto del supermercado A. Sin embargo, ayudándonos de la imagen en lugar de la descripción se detecta cual de los dos productos del supermercado B coincide con el del supermercado A. Detectar este tipo de “anomalías” es bastante complicado, sin embargo, la herramienta netPrecie de ITELLIGENT a través de técnicas de Deep Learning detecta este tipo de diferencias en imágenes para aportar una mayor optimización al sistema de Product Matching.

PRODUCT MATCHING Ejemplo imagenes

Figura 2. Ejemplo de Product Matching a través del procesamiento imágenes con técnica de Deep Learning (netPrice)

El sistema automatizado de Product Matching desarrollado por ITELLIGENT se llama netPrice. Esta herramienta de monitorización de precios permite enlazar tu catálogo de productos con los de tu competencia a través de técnicas de Inteligencia Artificial y Machine Learning para asegurar la correcta analítica de precios. ¿Quieres saber más sobre nuestra herramienta? ¿Deseas tener una demo de netPrice?

¡Escríbenos!

  • Netprice es la plataforma más avanzada del mercado que cubre todas tus necesidades y si necesitas algo más… ITELLIGENT lo desarrolla. 
  • ITELLIGENT, con diez años en el mercado, ha sido pionera en España en aplicaciones de Inteligencia Artificial y Big Data.

Big Data e Inteligencia Artificial  al servicio de la Optimización y la Gestión de Precios. Así es Netprice de  ITELLIGENT,  una plataforma pionera en España para la monitorización, modelización y gestión de precios tanto propios como de la competencia. Se trata de una plataforma de Big Data para la gestión de millones de precios, desde catálogos de productos hasta buscadores complejos. Esta plataforma ha sido desarrollada en España por expertos en modelización de precios con analíticas avanzadas para que rentabilice tu esfuerzo.

NETPRICE se compone de los siguientes módulos:

  1. Oportunidades vs Amenazas. Optimiza tu estrategia de precios gracias a la detección de oportunidades y alertas de amenazas en base a los de tu competencia.
  2. Ajuste automático de precios. Ajuste automático de precios en sistemas ERP o ecommerce con posibilidad de supervisión previo o definición de reglas.
  3. Alertas inteligentes. Nuestras Alertas Inteligentes permiten que solo recibas aquello que es relevante para ti. Evitando la saturación  de mensajes intrascendentes.
  4. Optimización en buscadores. Basado en la ofuscación de precios y el posicionamiento en buscadores, detección de patrones de fijación de precios de la competencia para establecer estrategias.
  5. SIG o Sistema de información geográfica. Visualización sobre mapas y posibilidad de representar distintas capas: recursos de interés, geodemografia, sociodemografia,…
  6. Informes. Servicio de informes automáticos o realizado por expertos que analizarán aquello que necesites.
  7. Revenue Management. Gestión de la estrategia de precios en base a la demanda de su catálogo de productos/servicios para rentabilizar sus ventas.
  8. Mapping. Sistema automatizado de Product Matching, permite enlazar tu catálogo de productos con los de tu competencia para realizar una correcta analítica de precios.
  9. Exportar datos. Servicio que permite exportar datos masivos en diversos formatos: CSV, Excel, …

netprice plataforma big data pricing

¿Qué te ofrece NETPRICE?

CENTRADO EN LO REALMENTE RELEVANTE. ¿Pierdes oportunidades porque te falta tiempo para analizar tus precios? NETPRICE permite detectar las oportunidades y las amenazas que te merecen la pena gestionar, centrando tu esfuerzo en lo realmente relevante.

ANALÍTICA AVANZADA PARA QUE RENTABILICES TU ESFUERZO. ¿Se te escapan oportunidades en la gestión de tus precios? Gracias  a la analítica avanzada de NETPRICE (Revenue Management, análisis predictivos…) podrás rentabilizar al máximo tu política de pricing.

DESARROLLOS A MEDIDA. ¿Necesitas algún desarrollo adicional sobre nuestra plataforma? Desarrollamos para ti aquello que necesites a precios muy razonables.

ALTA VELOCIDAD DE CARGA. ¿Cansado de esperar que tu herramienta muestre los datos? Con NETPRICE obtendrás acceso a tus datos en un abrir y cerrar de ojos.

INTEGRACIÓN CON TU SISTEMA. ¿Te ves saltando de una herramienta a otra para finalizar tu trabajo? ¡No desesperes más! Utiliza NETPRICE, lo integra todo en una única plataforma permitiendo integrarla con tu ERP o plataforma de e-commerce.

EXCELENCIA EN LA ATENCIÓN AL CLIENTE. ¿Cansado de esperar a que te atiendan o de hablar con un chatbot? Con ITELLIGENT no tendrás que esperar, tendrás acceso directo a nuestro equipo y además estamos en España.

EXPERIENCIA EN EL SECTOR. No estas ante una start up, somos una empresa pionera en España con más de diez años de experiencia en el mercado con un equipo de profesionales a tu servicio.

El congreso IWANN se trata de un foro de discusión para científicos, ingenieros, educadores y estudiantes en el que se debaten y se exponen los últimos descubrimientos realizados en teorías, modelos y sistemas inspirados en la naturaleza. Estos descubrimientos han sido realizados mediante la utilización de diferentes metodologías de inteligencia computacional, enfocadas particularmente en temas relevantes al Deep Learning, la computación centrada en el ser humano y en proyectos del cerebro humano.

Este evento, organizado por la Universidad de Málaga, Universidad de Granada, Universidad Politécnica de Catalunya, Universidad de Cádiz y IEEE Computational Intelligence Society se realiza cada dos años, y los próximos días 14, 15 y 16 de junio se celebrará por primera vez en la ciudad de Cádiz.

Coincidiendo con el estreno de la Universidad de Cádiz en la participación de este Congreso, nuestro compañero Mario Rivas, ingeniero I+D+i  de nuestro equipo técnico, asistirá al IWANN el primer día del congreso para hablar de  “Using deep learning for image similarity in Product Matching”. En esta ponencia colaboran también nuestro director técnico Jaime Martel junto a docentes de la Universidad de Cádiz como María De La Paz Guerrero, Elisa Guerrero, Guillermo Bárcena y Pedro L. Galindo.

Ésta ponencia tendrá lugar el primer día de IWANN 2017, el miércoles 14 de junio de 9 a 11 de la mañana en el Salón Lequerica del edificio Constitución 1812 (ver programación).  Será la primera ponencia de las que componen la sesión “Image and Signal Processing” moderada por el Dr. Joseph Constantin.

Asimismo,  a lo largo de estos tres días, en IWANN 2017 se darán cita docentes, investigadores y profesionales del sector donde compartirán experiencias y estudios relacionados con:

  • Los métodos matemáticos y teóricos en la inteligencia computacional.
  • Formulaciones neurocomputacional.
  • Aprendizaje y adaptación.
  • La emulación de las funciones cognitivas.
  • Sistemas y neuro-ingeniería Bio-inspirado.
  • Temas avanzados en inteligencia computacional.
  • Aplicaciones

Además, IWANN 2017 contará con tres ponentes invitados de gran prestigio cómo son:

invited speakers IWANN

  • Matthias Rauterberg, de la Universidad de Eindhoven, que hablará sobre “How to desig for tne unconscious”.
  • Ulrich Rückert, de la Universidad de Bielefeld, cuya ponencia tratará acerca de “Cognitronics: Resource-efficient Architectures for Cognitive Systems”.
  • Le Lu, del Instituto Nacional de Salud de Estados Unidos, cuyo tema será “Towards ´Big Data, Weak Label and True Clinical Impact´ on Medical Image Diagnosis: The Roles of Deep Label Discovery and Open-ended Recognition”.

El Product Matching es un área perteneciente a Data Matching o Record Linkage encargada de identificar automáticamente aquellas ofertas, productos o entidades en general, que aparecen en la web procedente de diversas fuentes, aparentemente de forma distinta e independiente, pero que hacen referencia a una misma entidad real.

Actualmente, el Product Matching está experimentando un auge debido al incremento de compras online, lo cual ha propiciado la aparición de herramientas de comparación, monitorización y análisis de precios de los productos en venta. Desde el punto de vista de la implementación software, este proceso conlleva un arduo trabajo, ya que para un mismo producto, su descripción o nombre puede aparecer de distinta forma en páginas web diferentes, lo cual puede llevar a equívoco al motor de búsqueda obteniendo resultados incorrectos. Por tanto, se requiere de:

  • Un minucioso, exhaustivo y preciso proceso de búsqueda de productos a través de la web
  • Un filtrado de elementos candidatos, extracción de características, identificación y asociación de productos iguales y distintos
  • Un análisis de los parámetros o características que se requieren investigar entre estas entidades

Aproximación al estado del arte

El Product Matching debido a su relación con el Data Matching o Record Linkage comparte muchas de sus características. El Record Linkage se ha centrado principalmente, desde su nacimiento, en la fusión de distintas bases de datos en una única en la que se identifiquen aquellos elementos relacionados en ambas bases de datos, bien eliminando esas duplicaciones  y/o registrando nuevos enlaces. En las investigaciones realizadas hasta la fecha en el campo del Product Matching se pueden distinguir dos enfoques distintos:

  1. Uso de técnicas de similitud de textos (asociar a cada producto el título, descripción, características técnicas, etc.) para decidir si dos elementos de fuentes distintas hacen referencia a una misma entidad.
  2. Aplicar técnicas de aprendizaje automático para generar modelos que realicen la correspondencia entre productos.

Estos dos enfoques no son independientes entre sí. Normalmente, para el uso de técnicas de aprendizaje automático es necesario el uso de técnicas englobadas en el primer enfoque (Ej. tokenizado de textos, medidas de similitud, etc.) para obtener las entradas a los modelos que serán generados con el segundo enfoque.

Una nueva aplicación conocida como Content Based Image Retrieval (CBIR) ha surgido en el ámito del procesamiento de imágenes con el objetivo de resumir la información de una imagen en varias de sus características tales como el color, textura, forma o la combinación de éstas.

La forma de los objetos que se encuentran dentro de una imagen, es una de las características más usadas en las técnicas CBIR. Para obtenerla con necesarias técnicas de extracción morfológicas. Dentro de estas técnicas tiene una especial relevancia la basada en los Descriptores de Fourier. Dentro del campo de CBIR, también se deben destacar las técnicas de descomposición de imágenes en regiones locales de interés. Estas técnicas detectan, en una imagen, aquellos puntos más importantes y significativos pertenecientes a una región. Dichos puntos son denominados keypoints. En la literatura es posible encontrar una gran variedad de algoritmos para la obtención de keypoints dentro de una imagen.

ITELLIGENT_Product Marching_Monitorizacion de precios

Con el reciente auge del Deep Learning también han aparecido aplicaciones para CBIR. El Deep Learning consiste en un conjunto de algortimos de aprendizaje automático que generan modelos abstractos de alto nivel mediante el empleo de arquitecturas “profundas” -deep- compuestas de múltiples transformaciones no lineales, dispuestas de manera jerárquica. Ese enfoque es diferente a las técnicas convencionales de aprendizaje automático que se basan en arquitecturas “planas”.

Dentro de las múltiples técnicas englobadas dentro del Deep Learning, la técnica Convolutional Neuronal Network (CNN) es especialmente usada en el campo de CBIR. Esta técnica consiste en la utilización de múltiples capas de convolución situadas una encima de otra. Entre estas capas se comparten pesos así como la salia producida a la capa inferior. Mediante el entrenamiento de estos pesos y la disposición de las capas se consiguen modeles capaces de ser independientes a la rotación, traslación, contrastes, etc.

La importancia e imparable crecimiento del comercio electrónico –ecommerce- ha obligado a las organizaciones a disponer herramientas de monitorización de precios, que le permitan gestionar sus políticas de precios y conocer las estrategias de la competencia. Para estas herramientas es fundamental realizar una identificación adecuada de los productos entre las distintas fuentes que se monitorizan, ya que de no ser así no se podrán comparar los productos con sus verdaderos rivales, distorsionando toda la información obtenida.