jueves, 23 de noviembre de 2017

10 tecnologías de Big Data que debes conocer

A medida que el mercado del análisis de Big Data se expande rápidamente para incluir a los principales clientes, es importante conocer las tecnologías de Big Data que realmente importan.




Todo el mundo habla de la ciencia de datos, con su modelo predictivo, minería de datos y aprendizaje automático (Machine Learning). Pero la mayor parte de esto no sería posible, especialmente a gran escala, sin ingeniería de datos. A continuación se enumeran algunas tecnologías de Big Data que todo ingeniero de datos debe conocer.

1. Análisis predictivo: Esta tecnología, que incluye soluciones de hardware y software, ayudará a su empresa a descubrir, evaluar, optimizar y desplegar modelos predictivos. Esto lo hace mediante el análisis de fuentes de Big Data, mejorando así el rendimiento comercial o mitigando el riesgo.

2. NoSQL Base de datos: En comparación con sus contrapartes RDBMS, las bases de datos NoSQL están disfrutando de un crecimiento exponencial. El tipo de base de datos NoSQL ofrece un diseño de esquema dinámico, que otorga la posibilidad de una mayor personalización, flexibilidad y escalabilidad, que es muy necesario cuando se almacenan grandes volúmenes de Big Data.

3. Descubrimiento de búsqueda y conocimiento: Necesita conocer estas herramientas y tecnologías para la auto extracción de información. El descubrimiento de búsqueda y conocimiento consiste en obtener nuevos entendimientos de grandes repositorios de datos estructurados y no estructurados que residen en fuentes, como sistemas de archivos, flujos de datos, bases de datos, APIs (Application Programming Interface) y otras plataformas y aplicaciones.

4. Análisis de flujo: Necesita agregar, filtrar, enriquecer y analizar un alto rendimiento de datos. El análisis de flujo examina los datos que provienen de fuentes de datos múltiples, dispares, en vivo y en distintos formatos.

5. Tejido de datos en memoria: Esta tecnología proporciona acceso de baja latencia y le permite procesar grandes cantidades de datos. Distribuye datos a través de la memoria de acceso aleatorio dinámica (DRAM), SSD o Flash de un sistema informático distribuido.

6. Almacenes de archivos distribuidos: Una red informática que almacena datos en más de un nodo, a menudo de forma replicada, para ofrecer redundancia y rendimiento.

7. Virtualización de datos: Si necesita información entregada desde varios orígenes de Big Data, como Hadoop y tiendas de datos distribuidos, en tiempo real y casi en tiempo real, la virtualización de datos es su tecnología.

8. Integración de datos: La integración de datos se trata de herramientas que permiten la orquestación de datos en soluciones como Apache Hive, Apache Pig, Amazon Elastic Map Reduce (EMR), Hadoop, Couchebase, MongoDB, Apache Spark, etc.

9. Preparación de datos: Para aliviar la carga de dar forma, limpiar, buscar y compartir conjuntos de datos desordenados y diversos que aceleran la utilidad de los datos para el análisis.

10. Calidad de datos: La tecnología que lleva a cabo la limpieza y el enriquecimiento de datos en grandes conjuntos de datos de alta velocidad. Utiliza operaciones paralelas en bases de datos distribuidas y almacenes de datos.

Tecnologías de Big Data: A tener en cuenta

Todas estas herramientas contribuyen a la comprensión en tiempo real, predictiva e integrada; y es exactamente lo que Big Data quiere de los clientes ahora. Para obtener la ventaja competitiva que ofrece Big Data, debe infundir análisis en todas partes, explotar el valor en todos los tipos de datos y hacer un diferenciador de velocidad. Todo esto requiere una infraestructura que pueda administrar y procesar volúmenes masivos de datos estructurados y no estructurados. Las tecnologías de Big Data deben admitir los servicios de búsqueda, gobierno, desarrollo y análisis de datos que abarcan desde datos de transacciones y aplicaciones hasta datos de máquinas y sensores, datos geo espaciales, sociales y de imágenes.



Fuente: Naveen Joshi. Fundador y CEO de Allerin. Experto en Big Data, IoT, AI y Blockchain.