Category: Big Data y Analítica Empresarial

manhattan

Este post ha sido traducido y adaptado de dos publicaciones en Quantcast y Priceonomics.

Al elegir un sitio web donde anunciarse, las primeras impresiones pueden ser engañosas. ¿Te sorprendería saber que aproximadamente el 40% del tráfico a la web Jezebel en EE.UU. es masculino, a pesar de que su lema sea “Celebrity, Sex and Fashion for Women”? Esto refleja claramente que, el hecho de que una determinada web genere contenido especifico para un determinado público -en este caso, mujeres-, no significa que otro tipo de público pueda encontrar y consumir este tipo de contenidos.

En el artículo “Ranking the Most Popular Websites by Demographic” publicado el mes pasado por Priceonomics, se analizan datos socio-demográficos recopilados por Quantcast, una empresa que mide y cuantifica audiencias web. El modelo estadístico de Quantcast permite determinar el sexo, edad, ingresos y educación de todo el tráfico en la web. A partir de este conjunto de datos, en los artículos publicados por Quantcast y Priceonomics, pretenden averiguar qué websites atraen a la mayoría de los públicos: masculinos, femeninos, millennials, seniors, padres, adinerados y bien-educados.

Para generar estos rankings, se escogío un conjunto de webs entre las 500 websites más importantes de Estados Unidos que oscilaran entre los 8 millones y 3 mil millones de páginas vistas por mes.

Resultados del estudio

  • Zulily y BlogLovin se llevan el premio al mayor porcentaje de visitantes femeninas mientras que New Arena y Covers -web de deportes y de apuestas deportivas-, se llevan a casa el oro por tener una audiencia más masculina.
  • Gizmodo Media Group -entre las que se encuentran Deadspin, Kotaku y Jezebel- tienen el mercado millennial en la mano, mientras que websites más conservadoras de noticias como Conservative 101 y Freedom Daily, atraen tráfico de un público más senior.
  • USA Team Prep -sitio de ayuda para realizar la tarea- gana el premio para los padres que  como la web constituyen la mayor parte del tráfico web. The Real Deal -sitio de bienes inmuebles- se lleva a casa el elogio de la población más adinerada como mayor audiencia, y Crunchbase -una compañía sobre base de datos de información y referencias de inversión, atrae a una audiencia más educada aunque también un segundo entre la población adinerada.

Resultados por cada categoría demográfica

En primer lugar, observaremos qué sitio web atraen a un mayor porcentaje de visitantes mujeres y hombre:

web female

En el primer puesto del ranking de visitantes femeninas se encuentra la web Zulily, una web de venta online de ropa, juguetes y productos del hogar con grandes descuentos. Las mujeres también visitan muchos sitios web sobre lifestyle (estilo de vida) como:

  • El blog de cupones: The Krazy Coupon Lady
  • La web sobre proyectos DIY (do-it-yourself = hazlo tu mismo): Hometalk
  • Y el blog: Refinery29.

Mientras que las mujeres tienden a generar tráfico web en sites enfocados al entreteniemto y lifesty, los hombres componen la mayor parte del tráfico web en sitios web de deportes y finanzas.

web men

El primer puesto entre los visitantes masculinos se lo lleva New Arena, una web de deportes y entretenimiento, con el 98% visitantes hombres. 12 de los 25 sitios web con mayor porcentaje de tráfico web maculino han sido webs de deportes, tanto sites generalistas de deportes como webs de  apuestas, Covers and Scores and Odds; ligas imaginarias, Rotoworld; y blogs sobre deportes especificos como 90min o GolfWRX.

El publico masculino tambien domina el tráfico en los sitios web de fiananzas. como Finviz, StockCharts y StockTwist. También constituyeron la mayoría del tráfico en ServerFault, un foro para administradores de sistemas y redes.

A continuación, descubriremos los hábitos de navegación de los millenials. Para este estudio, se han definido como visitantes millenials aquellos usuarios que posean una edad entre los 25 y 34 años.

web millenials

En general, los millennials constituyen alrededor del 18% del trafico entre los 500 websites cuantificados en este estudio. Las dos principales web con más del doble de la cantidad normal de visitantes milenarios fueron Pinkvilla, un sitio de Bollywood y belleza, y Rajnikant V / S CID Jokes, un productor de contenido viral indio. Los indios americanos son uno de los grupos étnicos de más rápido crecimiento en los Estados Unidos; además, la población india tiende a ser más joven que la de los Estados Unidos, donde los baby-boomers todavía representan alrededor de un cuarto de la población.

En general, los sitios web de entretenimiento y estilo de vida atrajeron a los visitantes más millenials, específicamente la red Gizmodo Media Group, incluyendo las webs de:

  • Deadspin: entretenimiento deportivo
  • Kotaku: juegos de entretenimiento 
  • Jezebel: estilo de vida femenino
  • Jalopnik: entretenimiento automovilístico 
  • Gizmodo: entretenimiento tecnológico

Claramente, los millennials están utilizando Internet para el entretenimiento. ¿Pasará lo mismo para las generaciones más seniors? Para averiguarlo, exponemos los resultados recopilados por Quantcast sobre el ranking de los sitios web con mayor porcentaje de trafico web en cuanto a población de la tercera edad.

web seniors

Conservative 101, una web de noticias y opiniones conservadoras, gana el oro para la mayor concentración de tráfico de poblacion senior con casi el 40% de visitantes mayores de 65 años.  En general, los sitios web con la mayor proporción de visitantes mayores tienden a ser sitios web de noticias, especialmente aquellos que se inclinan hacia la extrema derecha, como Freedom Daily y US Herald, o bien a la izquierda, como Truth Examiner. Más allá de las noticias, las personas mayores también constituyen un gran porcentaje dee trafico web en sitios web de entretenimiento como  TheJigsawPuzzles.com, Viral Kittens y Shockwave.

¿Los mayores comparten estos intereses con otros grupos de edad? En este estudio se ha echado un vistazo al desglose por edad de las 25 webs principales según el tráfico de ciudadanos seniors para responder a esta pregunta:

Most senior audience

Más o menos, las personas de la tercera edad comparten intereses con edades vecinas, entre 45 y 54 años y entre 55 y 64 años. La excepción parece estar en los sitios web de juegos y entretenimiento como TheJigsawPuzzles.com y Shockwave, que tienen porcentajes mayores de lo habitual de visitantes de entre 18 y 13 años de edad.

seniors hands

¿Te ha parecido interesante? ¿Quieres saber más? Puedes ver el estudio completo tanto en la web de Priceonomics como en Quancast. En este post únicamente hemos incluido los resultados de los rankings de webs por población femenina, masculina, millennial y senior. Existen tres rankings más basados en la población “padres”, en la población “adinerada” y en la población con una “educación alta”. Para acceder a ellos, os remitimos a los citados enlaces en este post.

Inteligencia Artificial como parte del PLN

Desde los inicios de la humanidad hasta la actualidad, ha tenido lugar incremento del conocimiento tal como lo conocemos hoy día. Como resultado de siglos de investigación, con frecuencia sobre los temas aparentemente no relacionados, tenemos el conocimiento científico, el recurso más importante del que dispone la raza humana. Del procesamiento conjunto de la ciencia computacional y la lingüística aplicada, nace el Procesamiento de Lenguaje Natural (PLN o NLP en inglés), cuyo objetivo no es otro que el de hacer posible la compresión y procesamiento asistidos por ordenador de información expresada en lenguaje humano, o lo que es lo mismo, hacer posible la comunicación entre personas y máquinas.

Existen distintos programas que exhiben diferente grado del procesamiento inteligente del lenguaje. Por ejemplo, un buscador de documentos puede buscar simplemente los documentos que contienen la cadena de caracteres especificada por el usuario, sin importar que dicha cadena tenga o no un significado en un lenguaje o idioma. En este caso no sería una aplicación del PLN. Sin embargo, el mismo buscador podría buscar los documentos que comuniquen la idea especificada por el usuario, sin importar las letras que la comunican, y en este caso, sin duda, sería una excelente aplicación de PLN, ya que entendería la idea comunicada en la petición del usuario, la idea comunicada en cada uno de los documentos, y sería capaz de compararlas.

Arquitectura de un sistema de PNL

La arquitectura de un sistema de PLN se basa en una definición de Lenguaje Natural por niveles, los cuales son:

  1. Nivel fonológico: trata de cómo las palabras se relacionan con los sonidos que representan
  2. Nivel morfológico: trata de cómo las palabras se construyen a partir de unas unidades de significado más pequeñas llamadas morfemas
  3. Nivel sintáctico: trata de cómo las palabras pueden unirse para formar oraciones, fijando el papel estructural que cada palabra juega en la oración y qué sintagmas son parte de otros sintagmas
  4. Nivel semántico: trata del significado de las palabras, y de cómo los significados se unen para dar significado a una oración, también se refiere al significado independiente del contexto, es decir, de la oración aislada.
  5. Nivel pragmático: trata de cómo las oraciones se usan en distintas situaciones y de cómo el uso afecta al significado de las oraciones.

Esta arquitectura muestra cómo la computadora interpreta y analiza las oraciones que le sean proporcionadas:

  1. El usuario le expresa a la computadora qué es lo que desea hacer.
  2. La computadora analiza las oraciones proporcionadas, en el sentido morfológico y sintáctico, es decir, si las frases contienen palabras compuestas por morfemas y si la estructura de las oraciones es correcta.
  3. El siguiente paso es analizar las oraciones semánticamente, es decir, saber cuál es el significado de cada oración, y asignar el significado de éstas a expresiones lógicas (cierto o falso).
  4. Una vez realizado el paso anterior, ahora podemos hacer el análisis pragmático de la instrucción, es decir, una vez analizadas las oraciones, ahora se analizan todas juntas, tomando en cuenta la situación de cada oración. Una vez realizado este paso, la computadora ya sabe qué es lo que va a hacer, es decir, ya tiene la expresión final.
  5. Una vez obtenida la expresión final, el siguiente paso es la ejecución de ésta, para obtener así el resultado y poder proporcionárselo al usuario.

Aplicaciones

Habiendo visto cómo se desarrolla el procesamiento de lenguaje natural, podemos deducir, por tanto, algunas de sus múltiples aplicaciones, entre las cuales se encuentran las siguientes:

Personal-Profesional
  • Gestión del tiempo
  • Control de estrés
  • Toma de decisiones
  • Etc.
Salud
  • Estrés
  • Adicciones
  • Miedos y traumas
  • Etc.
Educación
  • Resolver situaciones difíciles
  • Estrategias eficaces para el aprendizaje
  • Enseñar con éxito
  • Etc.

Algunas aplicaciones más concretas del PLN son: análisis y síntesis de voz, traducción automática, revisión lingüística, recuperación de la información, respuesta a preguntas, extracción de la información, reconocimiento del habla, entre otras.

Como se ve, el PLN está presente en nuestra vida diaria mucho más de lo que nos creemos, es por ello que desde hace pocos años se haya vuelto tan crucial para distintos ámbitos en los que nos movemos, haciéndolo herramienta indispensable para las empresas a la hora de obtener información y utilizándola a su favor.

big-data

La información es el bien más costoso y preciado del mundo, es por ello que el crecimiento de la aplicación del Big Data está siendo exponencial. Ya no hablamos únicamente de su aplicación, sino también de su diversificación.

El concepto de análisis de datos no sólo deberá estar presente en el campo de comunicación y administrativo de una empresa, si no que deberá estarlo en todos y cada uno de sus diferentes departamentos.

Estos datos, utilizados en su conjunto, servirán para aumentar la eficiencia, el crecimiento y la productividad de todos los sectores de la empresa. Revelarán en qué punto se debe mejorar, y en qué punto se está haciendo lo correcto.

La analítica inicialmente reporta datos de tipo cuantitativo pero, actualmente, se busca también que proporcione datos cualitativos y, en definitiva, del comportamiento humano. Para que esto sea posible, y también para mejorar los datos que ya ofrece, el Big Data presenta una serie de tendencias:

  1. CAMBIO DE MENTALIDAD
  • De ser una prioridad, a ser fundamental. Las empresas anteriormente consideraban la aplicación del Big Data como algo extra. Era una herramienta que te daba ese plus sobre la competencia. Pero hoy en día ya no es así. La aplicación del Big Data y su consiguiente análisis de datos es fundamental, y si no lo haces estas quedando en desventaja respecto a tus competidores.
  1. CAMBIO CULTURAL
  • Sencillez. Si tu objetivo obtener unos datos útiles en el día a día estos tienen que ser de fácil y rápida comprensión. Se debe optimizar el tiempo dedicado para ello.
  • Flexibilidad. Si se busca conseguir datos cualitativos se tiene que aumentar la flexibilidad en el proceso de recopilación. Así cómo estar preparado para el análisis de datos más variados. Es un elemento clave para afrontar con éxito esta actual tendencia.  Otro aspecto muy importante aquí es la constante evolución a la que está sometida esta herramienta, adaptándose constantemente a los cambios que se le exigen.
  • Economizar. Este es un objetivo principal de cualquier departamento empresarial y aquí no iba a ser menos.
  • Inteligencia artificial. Este aspecto cobrará mucha importancia en el proceso productivo con el claro objetivo de aumentar la productividad y reducir y facilitar el trabajo manual.
  1. AUMENTO DE LA SEGURIDAD (ciberseguridad)

La ciberseguridad es uno de los aspectos que más preocupa a toda organización empresarial.
Estas preocupaciones se dividen en dos tipos; los descuidos humanos así como su posible desconocimiento,  y los posibles ataques cibernéticos que se pudiesen producir.

Debido a esto, la inversión de las empresas en este campo aumentará muy significativamente.

  1. PUESTOS DE TRABAJO

Ante esta corriente de utilización del Big Data, dos tipos de profesionales de diferentes especialidades que antes no se habían visto unidos, ven como sus caminos se cruzan en busca de la consecución de un mismo objetivo.

Estos dos profesionales son:

  • Ingenieros informáticos
  • Especialistas de marketing en estrategia digital

La contratación de ambos ha crecido muchísimo en este último año, y las empresas desean que ambos trabajen juntos, cooperando en busca del mismo objetivo.

El que dará el primer paso será el especialista en marketing. Este será el encargado de la creación de la estrategia a seguir y cómo llevarla a cabo. Es decir, es el encargado del diseño del plan de acción. Pero para la recopilación de estos datos será necesaria la ayuda de profesionales del mundo de la informática. Estos aportarán el trabajo de campo, y pondrán todos los datos requeridos por los especialistas de marketing a su disposición.

  1. CREACIÓN NUEVAS EMPRESAS Y MERCADO DE LA INFORMACIÓN

Existen dos tipos de empresas si diferenciamos el uso que le dan al Big Data. La primera sería la empresa que utiliza esta herramienta para un uso propio y para la mejora de su rendimiento personal. Y por otro lado encontramos a las empresas que la utilizan para vender posteriormente la información recopilada.

Es por ello que, con la utilización del Big Data se crea una nueva oportunidad de negocio, y existen ya una multitud de empresas que tienen como objetivo la compra y venta de la información.

Son muchas las empresas que por sí mismas no se pueden permitir un uso constante de dicha herramienta, así que contratan los servicios de empresas externas para momentos determinados.

De esta forma vemos como se crea un nuevo mercado, el mercado de la información. En dicho mercado la competencia es enorme, y las empresas que se empiezan a destacar son aquellas que además de ofrecer los datos cuantitativas, ofrecen también los tan deseados cualitativos.

ceei

Durante cuatro días, seis empresas se darán cita la última semana del mes de junio para hablar de softwares, aplicaciones y Big Data. La Semana del software se centrará en diversas ponencias y desayunos Networking, tendrá lugar en el Centro Europeo de Empresas e Innovación de la Bahía de Cádiz, del 27 al 30 de junio, en horario de mañana.

Entre sus ponentes se encuentra, Mario Rivas, Ingeniero de I+D+i de ITELLIGENT con su ponencia sobre “Sistemas de Inteligencia basados en el procesamiento masivos de datos”. Bajo este título el próximo 30 de junio, M.Rivas centrará su comunicación en la descripción de diversos servicios y aplicaciones basados en la obtención masiva de datos y su procesamiento con técnicas de Inteligencia Artificial.

¿Te lo vas a perder? Puedes inscribirte totalmente gratis desde la web de CEEI Bahía de Cádiz.

El resto de ponentes son:

  • Miguel LLorca de QUONEXT: “Soluciones Microsoft para la Gestión Empresarial y Productividad”. Martes, 27 de junio a las 10.00 horas.
  • Julio García de Travelinnova: “Procesos de movilidad para las empresas”. Miércoles, 28 de junio a las 10.00 horas.
  • Virginia Dominguez de Ibersogas: “Gestión integral”. Miércoles, 28 de junio a las 10.30 horas.
  • Jose Luis del Pozo de FIX Webs & Apps: “Aplicaciones Cloud”. Jueves, 29 de junio a las 10.00 horas.
  • Rafael Vega de Verjim Animation Studio:  “Verjim Animation y el uso de Toon Boom Harmony”. Jueves, 29 de junio a las 10.30 horas.
  • Mario Rivas de ITELLIGENT: “Sistemas  de Inteligencia basados en el procesamiento masivos de datos”. Viernes, 30 de junio a las 10.00 horas.

Semana del Software_CEEI Bahia-itelligent

¿Quereis más información? Os dejamos algunos enlaces de interés: