martes, 10 de febrero de 2015

Sin analítica, Big Data no es más que ruido.


Cada segundo que pasa crece la cantidad de datos en el mundo, Además estos datos pueden ser estructurados, desestructurados, estar en movimiento o almacenados.
Pero sin analítica, Big Data no es más que ruido.  Por eso en este post me gustaría hablar de soluciones para BigData Analytics
En esta ocasión vamos a nombra las 16 más conocidas dentro de esta avalancha de datos en las organizaciones.

Hortonworks
Hive  y Hbase para soportar SQL directamente Hadoop;
Análisis de datos en memoria con Apache Spark;
Ofrece versiones de su distribución Hadoop (Hortonworks Data Platform) para Windows y una versión de entorno Sandbox de nodo que incluye tutoriales; Procesamiento de de streaming via Storm;
Opciones de appliance de HP, Teradata y otros.
 
Cloudera
HBASE para almacenar datos, con soporte a consultas SQL para Hadoop vía Impala; Análisis de datos en memoria con Apache Spark; Distribuciones de código abierto (CDH) y el comercial Hadoop; Procesamiento de streaming via Storm;
Proporciona también en formato de appliance mediante socios tales como Cisco, Dell, IBM, NetApp y otros.
 
MapR
Proporciona el HBase y soporta el Drill, Hive, Impala, Shark y otras opciones para las consultas SQL al Hadoop; Análisis de datos en memoria a través de Drill e Shark;
Distribución de Hadoop (M3, M5 y M7);
Procesamiento de streaming via Storm;
Recomendaciones de hardware mediante socios tales como Cisco, HP, IBM y NetApp.
 
IBM PureData
DB2 y Netezza para almacenamiento y análisis de datos;
Datos en memoria mediante BLU Acceleration y solidDB (DB2);
Distribución Hadoop Infosphere BigInsights; Procesamiento de streaming via Infosphere Streams;
También incluye cómo las soluciones de Cognos BI, y cuenta con la cartera más grande en el mercado.
 
Microsoft HDInsight
SQL Server 2012 Parallel Data Warehouse (PDW);Análisis de datos en memoria mediante SQL Server 2014 En memoria OLTP (versión final de 2014); Distribución Hadoop propia (HDInsight) basado en Plataforma de datos Hortonworks;
Versión de appliance via Dell y HP, en la nube a través de Windows Azure, así como appliance virtual opción para descargar;
 
Amazon
Redshift (DW basado en ParAccel) para almacenamiento y análisis de datos en la nube; Soporta almacenamiento en memoria de terceros (Altibase, SAP Hana, ScaleOut); Distribución Hadoop Amazon Elastic MapReduce; Amazon Kinesis para procesamiento de streaming;
 
HP HAVEn
Vertica Analytics Platform (base de datos en columnas para procesamiento en paralelo); No incluye distribución Hadoop, sino que ofrece la arquitectura de hardware de referencia para las principales distribuciones; No ofrece procesamiento de streaming.
 
SAP
Análisis de los datos mediante SAP Hana y SAP IQ; Análisis de datos en memoria a través de SAP Hana;
Procesamiento de Streaming mediante SAP Event Stream Processing;
Soporta Hadoop de Hortonworks, Intel, Cloudera y MapR; Opciones de hardware mediante Cisco, IBM, Fujitsu, Hitachi, Dell, HP y otros.
 
Pivotal
Análisis de los datos Pivotal Greenplum Database;
Análisis de datos en memoria a través de GemFire y SQLFire, además de la HAWQ; Procesamiento de streaming en desarrollo, vía GemFire y SQLFire;
Distribución propia de Hadoop Pivotal HD; Opción de hardware Pivotal Data Computing
 
Oracle
Base de datos Oracle, MySQL y Essbase para almacenamiento y análisis de datos;Análisis de datos en memoria con TimesTen y Oracle Database 12C In-memory option;
Procesamiento de streaming mediante Oracle Event Processing;
Es compatible con la versión Enterprise de la distribución de Cloudera;
Opciones de appliance de Exadata, Exalytics Oracle Big Data
 
Actian (e.g. Ingres)
Actian Matrix (anteriormente ParAccel) y Actian Vector (anteriormente Vectorwise)-componentes BD y Analytics; Actian Matrix In-memory option ((almacén de datos en memoria); No incluye distribución Hadoop, pero es compatible con las distribuciones de Apache, Hortonworks, Cloudera, etc.;
Independiente del hardware;
 
1010Data
Base de datos en columnas, soporta SQL propio que permite consultas más sofisticadas, especialmente relacionados con gráficos y series de tiempo; Soporta datos semiestructurados (redes sociales, etc.);
Centrado en las nubes privadas, puede incluir otros componentes para análisis, visualización de datos y máquina de aprendizaje;
 
InfiniDB
Conocido por el nombre de compañía, Calmont, el InfiniDB es una base de datos en columnas para procesamiento paralelo; No incluye una distribución Hadoop, ni soporte a streaming;
Es una nueva solución.
 
Infobright
Base de datos en columnas para el análisis de hasta 50
TB por servidor; Centrado en los servidores multiprocesadores y no en procesamiento en paralelo;
No incluye distribución Hadoop o soporte a streaming;
 
Kognitio
La plataforma analítica de Kognitio se centra en el análisis de datos en memoria;
Disponible en formato de appliance y en la nube; Cuenta con integración con la distribución de Hadoop de Hortonworks.
 
Teradata
Análisis de los datos vía Teradata Teradata, Aster;
No ofrece análisis de datos en memoria, pero puede mover datos más accedidos para los dispositivos de acceso más rápidos, incluyendo RAM y SSD;No soporta streaming;
Solución de hardware mediante appliance y configuraciones de hardware optimizado de Dell.

No hay comentarios.:

Publicar un comentario