Tag: big data

El Instituto de Políticas y Bienes Públicos (IPP) contrata los servicios de ITELLIGENT en el marco de un proyecto de investigación para la recolección, estructuración y mash up de datos sobre producción científica y tecnológica en España. Concretamente, los servicios que realiza ITELLIGENT se centran en:

  • Crawling web y web scrapping, para la extracción y recopilación de información de diferentes webs
  • Técnicas de mapping y mash up, para cruzar todos los datos recopilados
  • Estructuración y homogeneización de los datos no estructurados que se han extraído no estructurados que se han extraído

Blog ITELLIGENT proyectos int

ITELLIGENT posee más de diez años de experiencia en la extracción y recopilación de grandes volúmenes de datos (Big Data) así como en el procesamiento del lenguaje natural y estructuración de información no estructurada.  Además,  contamos con un amplio abanico de servicios inteligentes, útiles, flexibles y personalizados que se adaptan 100%  a las necesidades de cada cliente, convirtiéndose esto, en una gran ventaja competitiva de la empresa frente a la competencia.

El Instituto de Políticas y Bienes Públicos (IPP) es uno de los institutos del Consejo Superior de Investigaciones Científicas (CSIC) en el área de ciencias sociales. Su labor se centra en el análisis comparativo de bienes públicos y de su naturaleza, en el diseño e implementación de políticas públicas y en la interacción de ambos, con el fin de contribuir al avance en el conocimiento de la relación entre la sociedad, los mercados y el Estado.

Los proyectos de investigación del IPP se financian de convocatorias nacionales e internacionales, de manera notable del programa nacional de I+D+i del gobierno de España, del Programa Marco de la Unión Europea, así como de contratos y acuerdos con entidades públicas y privadas.

IPP CSIC

ITELLIGENT en Microsoft Research, Cambridge UK

En la imagen, Jaime Martel, CTO de ITELLIGENT, en Microsoft Research, Cambridge UK

El pasado 10 de agosto tuvimos el placer de conocer a la Dra. Regina Barzilay, profesora del Massachusetts Institute of Technology (MIT), en su ponencia sobre How Can NLP Help Cure Cancer? en la ciudad de Cambridge (UK). El evento, organizado en el centro de Microsoft Research en Cambridge UK, pertenecía a una serie de ponencias tituladas “Frontiers in AI” (Fronteras de la Inteligencia Artificial) bajo el patrocinio de Microsoft Research.

La charla de la Dra. Regina Barzilay (1970, Chisináu, Moldavia) versó sobre cómo es posible ayudar a la cura del cáncer a través de técnicas de procesamiento de lenguaje natural (PLN o NLP en inglés): How can NLP help cure cancer?

Actualmente, la mayoría de las investigaciones sobre el cáncer se llevan a cabo en el campo de la biología y medicina. La informática sin embargo, desempeña un papel de apoyo menor en este proceso, si es que lo hace. Con su ponencia, Barzilay manifiesta que el PLN, como campo de estudio, tiene la oportunidad de jugar un papel importante en esta batalla contra el cáncer. De hecho, el texto de forma libre sigue siendo el principal medio por el cual los médicos registran sus observaciones y hallazgos clínicos, pero, desgraciadamente, esta rica fuente de información textual es “subutilizada” por los modelos predictivos en oncología. Los modelos actuales sólo se basan principalmente en datos estructurados. Por este motivo, Barzilay defiende la utilización del PLN para avanzar en los estudios sobre el cáncer.

El interés de Barzilay en este tema es relevante, ya que éste comenzó en el momento en el que le diagnosticaron un cáncer de mama. A partir de ese momento, Barzilay comenzó su andadura por la investigación en este campo y descubrió que existen muchas oportunidades para mejorar los sistemas de diagnostico del cáncer. Según ella, no se aprovechan todos los datos que se generan sobre la información de los pacientes; sólo se utiliza una pequeña parte de estos datos. A través de la utilización de esta gran cantidad de datos desaprovechados, se podrían mejorar diagnósticos y tratamientos del cáncer.

A  raíz de su cáncer, Regina Barzilay, comienza a trabajar en este tema con diversos doctores del Hospital General de Massachusetts. De esta colaboración nace un sistema que permite mejorar la extracción de información de los historiales de los pacientes utilizando técnicas de PLN (Procesamiento del Lenguaje Natural). De esta forma se enriquecen las bases de datos.  Asimismo, desarrollaron técnicas para facilitar la interacción de los doctores con el sistema:

  • El sistema permite a los doctores ofrecer, de forma intuitiva y fácil, feedback al sistema (ej. indicar que un dato no es correcto)
  • El sistema no solo realiza la extracción de la información sino que también ofrece una explicación de porqué se han extraído.
Barzilay_Cambridge_UK

Varias imágenes de la ponencia de Barzilay sobre How can NLP help cure cancer? en Microsoft Research Cambridge (UK)

Además,  Regina habló de las extraordinarias oportunidades para la aplicación de técnicas de Data Science y aprendizaje automático a la lucha contra el cáncer puesto que los modelos actuales podrían mejorarse mucho más. Y no solo utilizando modelos de aprendizaje más avanzados, sino incorporando también muchos de los datos que actualmente no se utilizan -o sólo se utilizan de forma parcial-. Es decir, no sólo a partir de textos no estructurados (ej. historial del paciente) sino, sobre todo, de un mejor tratamiento de los datos (principalmente imágenes) que los modernos sistemas de diagnostico ofrecen.

Algo a destacar sobre la ponencia de Barzilay fue la presencia de Christopher Bishop,  miembro del equipo técnico de Microsoft y Director de Laboratorio de Microsoft Research Cambridge. Bishop estuvo presente en esta charla entre el público ya que ésta misma se disponía en el centro que actualmente dirige. 

Cómo se aplica el PLN

Según Barzilay el procesamiento del lenguaje natural (PLN) de sus  máquinas aplica la información de dos maneras:

La primera fue crear un sistema que coge el informe patológico que ha escrito el doctor, donde está recogida toda la información del tumor, lo reconoce y lo escribe en una base de datos, una especie de tabla estructurada, que los ordenadores pueden analizar fácilmente. Así es posible buscar a las personas que tiene el mismo tipo tumor o que presenta altos condicionantes de poder padecerlo. En definitiva, trasladar miles de informes con letras de doctores diferentes a una tabla donde se puede buscar información. Este primer sistema posee 110.00 informes patológicos de tres hospitales: el Massachusetts General Hospital, el Instituto de Cáncer Dana-Farber Cancer y el Hospital Newton Wellesley.

La segunda forma está relacionada con la interpretación de las mamografías. Se han creado sistemas que pueden ver una mamografía y predecir si la paciente se está dirigiendo hacia el cáncer. Esto es, gracias a que las máquinas identifica patrones correctamente, de tal forma que si se les muestra una serie de mamografías de cómo han ido evolucionando las pacientes que finalmente han desarrollado cáncer, pueden identificar si esos mismos rasgos se están dando en otra paciente. Algo que para los humanos es imposible de hacer.

Actualmente, Barzilay ya ha conseguido algún resultado, especialmente en la detección de condicionantes. Gracias a su trabajo han podido predecir cuando alguien tiene factores de riesgo para tener cáncer y ver cómo se desarrolla.

Regina Barziilay

Regina Barzilay, catedrática del MIT y experta en procesamiento del lenguaje. FOTO: elpais.com TECNOLOGÍA.

big-data

La información es el bien más costoso y preciado del mundo, es por ello que el crecimiento de la aplicación del Big Data está siendo exponencial. Ya no hablamos únicamente de su aplicación, sino también de su diversificación.

El concepto de análisis de datos no sólo deberá estar presente en el campo de comunicación y administrativo de una empresa, si no que deberá estarlo en todos y cada uno de sus diferentes departamentos.

Estos datos, utilizados en su conjunto, servirán para aumentar la eficiencia, el crecimiento y la productividad de todos los sectores de la empresa. Revelarán en qué punto se debe mejorar, y en qué punto se está haciendo lo correcto.

La analítica inicialmente reporta datos de tipo cuantitativo pero, actualmente, se busca también que proporcione datos cualitativos y, en definitiva, del comportamiento humano. Para que esto sea posible, y también para mejorar los datos que ya ofrece, el Big Data presenta una serie de tendencias:

  1. CAMBIO DE MENTALIDAD
  • De ser una prioridad, a ser fundamental. Las empresas anteriormente consideraban la aplicación del Big Data como algo extra. Era una herramienta que te daba ese plus sobre la competencia. Pero hoy en día ya no es así. La aplicación del Big Data y su consiguiente análisis de datos es fundamental, y si no lo haces estas quedando en desventaja respecto a tus competidores.
  1. CAMBIO CULTURAL
  • Sencillez. Si tu objetivo obtener unos datos útiles en el día a día estos tienen que ser de fácil y rápida comprensión. Se debe optimizar el tiempo dedicado para ello.
  • Flexibilidad. Si se busca conseguir datos cualitativos se tiene que aumentar la flexibilidad en el proceso de recopilación. Así cómo estar preparado para el análisis de datos más variados. Es un elemento clave para afrontar con éxito esta actual tendencia.  Otro aspecto muy importante aquí es la constante evolución a la que está sometida esta herramienta, adaptándose constantemente a los cambios que se le exigen.
  • Economizar. Este es un objetivo principal de cualquier departamento empresarial y aquí no iba a ser menos.
  • Inteligencia artificial. Este aspecto cobrará mucha importancia en el proceso productivo con el claro objetivo de aumentar la productividad y reducir y facilitar el trabajo manual.
  1. AUMENTO DE LA SEGURIDAD (ciberseguridad)

La ciberseguridad es uno de los aspectos que más preocupa a toda organización empresarial.
Estas preocupaciones se dividen en dos tipos; los descuidos humanos así como su posible desconocimiento,  y los posibles ataques cibernéticos que se pudiesen producir.

Debido a esto, la inversión de las empresas en este campo aumentará muy significativamente.

  1. PUESTOS DE TRABAJO

Ante esta corriente de utilización del Big Data, dos tipos de profesionales de diferentes especialidades que antes no se habían visto unidos, ven como sus caminos se cruzan en busca de la consecución de un mismo objetivo.

Estos dos profesionales son:

  • Ingenieros informáticos
  • Especialistas de marketing en estrategia digital

La contratación de ambos ha crecido muchísimo en este último año, y las empresas desean que ambos trabajen juntos, cooperando en busca del mismo objetivo.

El que dará el primer paso será el especialista en marketing. Este será el encargado de la creación de la estrategia a seguir y cómo llevarla a cabo. Es decir, es el encargado del diseño del plan de acción. Pero para la recopilación de estos datos será necesaria la ayuda de profesionales del mundo de la informática. Estos aportarán el trabajo de campo, y pondrán todos los datos requeridos por los especialistas de marketing a su disposición.

  1. CREACIÓN NUEVAS EMPRESAS Y MERCADO DE LA INFORMACIÓN

Existen dos tipos de empresas si diferenciamos el uso que le dan al Big Data. La primera sería la empresa que utiliza esta herramienta para un uso propio y para la mejora de su rendimiento personal. Y por otro lado encontramos a las empresas que la utilizan para vender posteriormente la información recopilada.

Es por ello que, con la utilización del Big Data se crea una nueva oportunidad de negocio, y existen ya una multitud de empresas que tienen como objetivo la compra y venta de la información.

Son muchas las empresas que por sí mismas no se pueden permitir un uso constante de dicha herramienta, así que contratan los servicios de empresas externas para momentos determinados.

De esta forma vemos como se crea un nuevo mercado, el mercado de la información. En dicho mercado la competencia es enorme, y las empresas que se empiezan a destacar son aquellas que además de ofrecer los datos cuantitativas, ofrecen también los tan deseados cualitativos.

ceei

Durante cuatro días, seis empresas se darán cita la última semana del mes de junio para hablar de softwares, aplicaciones y Big Data. La Semana del software se centrará en diversas ponencias y desayunos Networking, tendrá lugar en el Centro Europeo de Empresas e Innovación de la Bahía de Cádiz, del 27 al 30 de junio, en horario de mañana.

Entre sus ponentes se encuentra, Mario Rivas, Ingeniero de I+D+i de ITELLIGENT con su ponencia sobre “Sistemas de Inteligencia basados en el procesamiento masivos de datos”. Bajo este título el próximo 30 de junio, M.Rivas centrará su comunicación en la descripción de diversos servicios y aplicaciones basados en la obtención masiva de datos y su procesamiento con técnicas de Inteligencia Artificial.

¿Te lo vas a perder? Puedes inscribirte totalmente gratis desde la web de CEEI Bahía de Cádiz.

El resto de ponentes son:

  • Miguel LLorca de QUONEXT: “Soluciones Microsoft para la Gestión Empresarial y Productividad”. Martes, 27 de junio a las 10.00 horas.
  • Julio García de Travelinnova: “Procesos de movilidad para las empresas”. Miércoles, 28 de junio a las 10.00 horas.
  • Virginia Dominguez de Ibersogas: “Gestión integral”. Miércoles, 28 de junio a las 10.30 horas.
  • Jose Luis del Pozo de FIX Webs & Apps: “Aplicaciones Cloud”. Jueves, 29 de junio a las 10.00 horas.
  • Rafael Vega de Verjim Animation Studio:  “Verjim Animation y el uso de Toon Boom Harmony”. Jueves, 29 de junio a las 10.30 horas.
  • Mario Rivas de ITELLIGENT: “Sistemas  de Inteligencia basados en el procesamiento masivos de datos”. Viernes, 30 de junio a las 10.00 horas.

Semana del Software_CEEI Bahia-itelligent

¿Quereis más información? Os dejamos algunos enlaces de interés: