¿Qué es Big data?
Cuando hablamos de Big Data nos referimos a conjuntos de datos o combinaciones de conjuntos de datos cuyo tamaño, complejidad y velocidad de crecimiento dificultan su captura, gestión, procesamiento o análisis mediante tecnologías y herramientas convencionales, tales como bases de datos relacionales y estadísticas convencionales o paquetes de visualización, dentro del tiempo necesario para que sean útiles.
Tipos de big data
1. Estructurados
Cualquier dato que se pueda almacenar, acceder y procesar en formato fijo recibe el nombre de dato «estructurado». Durante este periodo de tiempo, el talento en la informática ha logrado mejores resultados en el desarrollo de técnicas de trabajo con ese tipo de datos (donde ya se conoce el formato) y se ha derivado valor.
2. No estructurados
Son cualquier dato de forma desconocida o cuya estructura se clasifica como un dato no estructurado. Además, de ser enorme en tamaño, los datos no estructurados plantean múltiples desafíos con respecto a su procesamiento para derivar valor de ellos.
Un ejemplo típico de datos no estructurados son las fuentes de datos heterogéneos que contienen una combinación de archivos de texto simples, imágenes, videos, entre otros.
3. Semiestructurados
Los datos semiestructurados pueden contener ambos tipos de datos. Suelen tener un formato que se puede definir, pero el usuario no lo puede comprender fácilmente y requiere el uso de reglas complejas que ayuden a determinar cómo leer cada pieza de la información. Un ejemplo de un dato semiestructurado es un dato representado en un archivo XML.
Las 3 V del big data
1. Volumen
La cantidad de datos importa. Con el big data, tendrás que procesar grandes volúmenes de datos no estructurados de baja densidad. Pueden ser datos de valor desconocido, como los canales de datos de Twitter, rastros de clics en una página web o en una aplicación de celular o equipos con sensores habilitados.
2. Velocidad
La velocidad es el ritmo acelerado en el que se reciben y procesan los datos. Por lo general, la más alta velocidad de datos fluye directamente a la memoria en vez de escribirse en el disco. Algunos productos inteligentes con acceso a internet operan en tiempo real y requerirán evaluación y acción en tiempo real.
3. Variedad
La variedad se refiere a los distintos tipos de datos que se encuentran disponibles. Los tipos de datos tradicionales se estructuraron y adaptaron perfectamente en una base de datos relacional. Con el incremento de datos masivos, estos vienen en nuevos tipos de datos no estructurados.
0 comentarios:
Publicar un comentario