Big Data, Internet de las Cosas, QuantifiedSelf

¿Qué es Big Data?

Todos formamos parte de ese gran crecimiento de datos

Introducción:

Debido al gran avance que existe día con día en las tecnologías de información, las organizaciones se han tenido que enfrentar a nuevos desafíos que les permitan analizar, descubrir y entender más allá de lo que sus herramientas tradicionales reportan sobre su información, al mismo tiempo que durante los últimos años el gran crecimiento de las aplicaciones disponibles en internet han sido parte importante en las decisiones de negocio de las empresas. El presente artículo tiene como propósito introducir al lector en el concepto de Big Data y describir algunas características de los componentes principales que constituyen una solución de este tipo.

¿QUÉ ES BIG DATA?

En términos generales podríamos referirnos como a la tendencia en el avance de la tecnología que ha abierto las puertas hacia un nuevo enfoque de entendimiento y toma de decisiones, la cual es utilizada para describir enormes cantidades de datos (estructurados, no estructurados y semi estructurados) que tomaría demasiado tiempo y sería muy costoso cargarlos a un base de datos relacional para su análisis. De tal manera que, el concepto de Big Data aplica para toda aquella información que no puede ser procesada o analizada utilizando procesos o herramientas tradicionales. Sin embargo, Big Data no se refiere a alguna cantidad en específico, ya que es usualmente utilizado cuando se habla en términos de petabytes y exabytes de datos. Entonces ¿Cuánto es demasiada información de manera que sea elegible para ser procesada y analizada utilizando Big Data? Analicemos primeramente en términos de bytes:

Gigabyte = 109 = 1,000,000,000
Terabyte = 1012 = 1,000,000,000,000
Petabyte = 1015 = 1,000,000,000,000,000
Exabyte = 1018 = 1,000,000,000,000,000,000

Además del gran volumen de información, esta existe en una gran variedad de datos que pueden ser representados de diversas maneras en todo el mundo, por ejemplo de dispositivos móviles, audio, video, sistemas GPS, incontables sensores digitales en equipos industriales, automóviles, medidores eléctricos, veletas, anemómetros, etc., los cuales pueden medir y comunicar el posicionamiento, movimiento, vibración, temperatura, humedad y hasta los cambios químicos que sufre el aire, de tal forma que las aplicaciones que analizan estos datos requieren que la velocidad de respuesta sea lo demasiado rápida para lograr obtener la información correcta en el momento preciso. Estas son las características principales de una oportunidad para Big Data.

¿De dónde proviene toda esa información?

Los seres humanos estamos creando y almacenando información constantemente y cada vez más en cantidades astronómicas. Se podría decir que si todos los bits y bytes de datos del último año fueran guardados en CD’s, se generaría una gran torre desde la Tierra hasta la Luna y de regreso.

Esta contribución a la acumulación masiva de datos la podemos encontrar en diversas industrias, las compañías mantienen grandes cantidades de datos transaccionales, reuniendo información acerca de sus clientes, proveedores, operaciones, etc., de la misma manera sucede con el sector público. En muchos países se administran enormes bases de datos que contienen datos de censo de población, registros médicos, impuestos, etc., y si a todo esto le añadimos transacciones financieras realizadas en línea o por dispositivos móviles, análisis de redes sociales (en Twitter son cerca de 12 Terabytes de tweets creados diariamente y Facebook almacena alrededor de 100 Petabytes de fotos y videos), ubicación geográfica mediante coordenadas GPS, en otras palabras, todas aquellas actividades que la mayoría de nosotros realizamos varias veces al día con nuestros “smartphones”, estamos hablando de que se generan alrededor de 2.5 quintillones de bytes diariamente en el mundo.

1 quintillón = 10 30 = 1,000,000,000,000,000,000,000,000,000,000

¿Qué tipos de datos debo explorar?

Muchas organizaciones se enfrentan a la pregunta sobre ¿qué información es la que se debe analizar?, sin embargo, el cuestionamiento debería estar enfocado hacia ¿qué problema es el que se está tratando de resolver?. Si bien sabemos que existe una amplia variedad de tipos de datos a analizar, una buena clasificación nos ayudaría a entender mejor su representación, aunque es muy probable que estas categorías puedan extenderse con el avance tecnológico.

Figura 1. Tipos de datos de Big Data

Big-Data-Types

Web and Social Media: Incluye contenido web e información que es obtenida de las redes sociales como Facebook, Twitter, LinkedIn, etc, blogs.

Machine-to-Machine (M2M): M2M se refiere a las tecnologías que permiten conectarse a otros dispositivos. M2M utiliza dispositivos como sensores o medidores que capturan algún evento en particular (velocidad, temperatura, presión, variables meteorológicas, variables químicas como la salinidad, etc.) los cuales transmiten a través de redes alámbricas, inalámbricas o híbridas a otras aplicaciones que traducen estos eventos en información significativa.

Big Transaction Data: Incluye registros de facturación, en telecomunicaciones registros detallados de las llamadas (CDR), etc. Estos datos transaccionales están disponibles en formatos tanto semiestructurados como no estructurados.

Biometrics: Información biométrica en la que se incluye huellas digitales, escaneo de la retina, reconocimiento facial, genética, etc. En el área de seguridad e inteligencia, los datos biométricos han sido información importante para las agencias de investigación.

Human Generated: Las personas generamos diversas cantidades de datos como la información que guarda un call center al establecer una llamada telefónica, notas de voz, correos electrónicos, documentos electrónicos, estudios médicos, etc.

Información Completa


Internet de las cosas: preparando la próxima revolución

Hoy, solo el 1% de los objetos del mundo está conectado, pero la revolución está a la vuelta de la esquina. Veamos las posibilidades y los problemas de esta hiperconexión. 

El futuro tiene un nombre poético: el Internet de las cosas. The Internet of Things, como dicen los anglosajones, es una tendencia que moverá en las próximas décadas cantidades ingentes de dinero e ingenio. Detrás de este pastel, van a estar las grandes operadoras, pues el tráfico se multiplica; y los fabricantes de dispositivos de acceso y de red, pues se requerirán más ancho de banda e infraestructuras para hacerlo posible, además de miles de millones de sensores y aparatitos con capacidad de conexión.

También están muy expectantes los fabricantes de coches, los gestores del sector sanitario, las empresas de logística o de seguridad e incluso los políticos. Y es que el Internet de las cosas cambiará la faz de los hogares y permitirá tener información al minuto del transporte y de nuestros movimientos por la ciudad en la que vivimos, o de nuestras constantes vitales.

Objetos con una IP

Básicamente, esta hiperconexión consiste en que cada dispositivo que exista a nuestro alrededor vaya dotado de una dirección de Internet, y por tanto de capacidad para comunicarse con otros objetos. Es decir, Internet saldrá del redil de la informática y colonizará cualquier cacharrito que se nos ocurra, y otros que ni imaginamos.

Esa comunicación se hará por muchos medios: WiFi, WiMax, RFID, 3G, LTE,Bluetooth, NFC… «No solo hablamos de dispositivos que hoy ya tienen electrónica, como pueden ser una lavadora o un frigorífico, sino de otros que hasta ahora no la tenían, como una bombilla, un interruptor, un termostato, e incluso dispositivos mecánicos», dice Jordi Palet, CEO de la empresa Consulintel y experto en elprotocolo IPv6, que será el que haga realidad este mundo hiperconectado.

Según Palet, el Internet de las cosas hará las delicias del más sibarita, permitiendo, por ejemplo, que la iluminación de la casa se adapte al programa de televisión que vemos sin que nosotros tengamos que mover un dedo. O detectando nuestro estado de ánimo y cansancio y seleccionando la música más apropiada, o incluso proponiendo los ingredientes de la cena según la actividad y consumo calórico del día.

«Controlar qué tenemos en la nevera desde el supermercado, iniciar una lavadora desde la oficina o activar el aire acondicionado cuando estamos en el coche, camino a casa, son solo algunas de las cosas que ya se pueden ver», asegura José María Zamora, director de mercadotecnia de LG, un fabricante que en el pasado CES de Las Vegas deslumbró con muchos de estos electrodomésticos inteligentes.

Comunicación M2M

El desarrollo del Internet de las cosas implica también que cada vez más las conexiones a Internet serán entre máquinas, y no entre personas que se mandan un mensaje por correo electrónico o mensajería instantánea. Es lo que en el sector se conoce como comunicación M2M (machine to machine, máquina a máquina), y que hará posible que cientos, miles de millones de sensores y chips repartidos por todos sitios comuniquen los datos que registran, ayudando así a regular el tráfico de las ciudades, a medir el consumo de energía del alumbrado público o a controlar los niveles de humedad en los bosques.

Información Completa


La autocuantificación: el emergente yo cuantificado en los procesos vitales

La autocuantificación o el yo cuantificado (también auto-cuantificación o como término epistémico: el yo cuantificado) es un movimiento para incorporar la tecnología en la adquisición de datos sobre aspectos de la vida diaria de una persona en términos deinsumos (por ejemplo, alimentos consumidos, la calidad del aire ambiente), los estados (por ejemplo, el estado de ánimo, la excitación, los niveles de oxígeno en la sangre) y el desempeño ( de manera mental y físico). En la educación también será integrado por medio de la cuantificación del propio conocimiento con interface de web cuantificadas como nos demuestra R. Craig en este vídeo.

El movimiento fue iniciado por la revista Wired, con los editores Gary Wolf y Kevin Kelly en el año 2007, definiéndolo como “una colaboración de los usuarios y fabricantes de herramientas que comparten un interés en el autoconocimiento a través del autotracking. En 2010, Wolf habló sobre la autocuantificación en un TED (mayo de 2011). La  primera conferencia internacional sobre el tema se celebró en Mountain View, California.
La metodología principal de la auto-cuantificación es la recopilación de datos, seguido de la visualización, las referencias cruzadas y el descubrimiento de correlaciones.

Gráfico de Kevin Kelly al respecto:

 20120916-closing-plenary-Kevin-Kelly-1024x640

Información Completa

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s