Cada segundo que pasa crece la cantidad de
datos en el mundo, Además estos datos pueden ser estructurados,
desestructurados, estar en movimiento o almacenados.
Pero sin analítica, Big Data no es más que
ruido. Por eso en este post me gustaría
hablar de soluciones para BigData Analytics
En esta ocasión vamos a nombra las 16 más
conocidas dentro de esta avalancha de datos en las organizaciones.
Hortonworks
Hive y Hbase para soportar SQL
directamente Hadoop;
Análisis de datos en memoria con Apache Spark;
Ofrece versiones de su distribución Hadoop (Hortonworks Data Platform)
para Windows y una versión de entorno Sandbox de nodo que incluye tutoriales; Procesamiento
de de streaming via Storm;
Opciones de appliance de HP, Teradata y otros.
Cloudera
HBASE para almacenar datos, con soporte a consultas SQL para Hadoop vía
Impala; Análisis de
datos en memoria con Apache Spark; Distribuciones de código abierto (CDH) y el comercial Hadoop; Procesamiento de streaming via Storm;
Proporciona también en formato de appliance mediante socios tales como
Cisco, Dell, IBM, NetApp y otros.
MapR
Proporciona el HBase y soporta el Drill, Hive, Impala, Shark y otras
opciones para las consultas SQL al Hadoop; Análisis de datos en memoria a
través de Drill e Shark;
Distribución de Hadoop (M3, M5 y M7);
Procesamiento de streaming via Storm;
Recomendaciones de hardware mediante socios tales como Cisco, HP, IBM y
NetApp.
IBM PureData
DB2 y Netezza para almacenamiento y análisis de datos;
Datos en memoria mediante BLU Acceleration y solidDB (DB2);
Distribución Hadoop
Infosphere BigInsights; Procesamiento de streaming via Infosphere
Streams;
También incluye cómo las soluciones de Cognos BI, y cuenta con la
cartera más grande en el mercado.
Microsoft HDInsight
SQL Server 2012 Parallel Data Warehouse (PDW);Análisis de datos en memoria mediante SQL Server 2014 En memoria OLTP (versión final de 2014); Distribución Hadoop propia (HDInsight) basado en
Plataforma de datos Hortonworks;
Versión de appliance via Dell y HP, en la nube a través de Windows
Azure, así como appliance virtual opción para descargar;
Amazon
Redshift (DW basado en ParAccel) para almacenamiento y análisis de datos
en la nube; Soporta
almacenamiento en memoria de terceros (Altibase, SAP Hana, ScaleOut); Distribución Hadoop Amazon Elastic MapReduce;
Amazon Kinesis para procesamiento de streaming;
HP HAVEn
Vertica Analytics Platform (base de datos en columnas para procesamiento
en paralelo); No incluye
distribución Hadoop, sino que ofrece la arquitectura de hardware de referencia
para las principales distribuciones; No ofrece procesamiento de streaming.
SAP
Análisis de los datos mediante SAP Hana y SAP IQ; Análisis de datos en memoria a través de SAP
Hana;
Procesamiento de
Streaming mediante SAP Event Stream Processing;
Soporta Hadoop de Hortonworks, Intel, Cloudera y MapR; Opciones de
hardware mediante Cisco, IBM, Fujitsu, Hitachi, Dell, HP y otros.
Pivotal
Análisis de los datos Pivotal Greenplum Database;
Análisis de datos en memoria a través de GemFire y SQLFire, además de la
HAWQ; Procesamiento de streaming en desarrollo, vía GemFire y SQLFire;
Distribución propia de Hadoop Pivotal HD; Opción de hardware Pivotal Data Computing
Oracle
Base de datos Oracle, MySQL y Essbase para almacenamiento y análisis de
datos;Análisis de datos en memoria con TimesTen y Oracle Database 12C In-memory
option;
Procesamiento de streaming mediante Oracle Event Processing;
Es compatible con la versión Enterprise de la distribución de Cloudera;
Opciones de appliance de Exadata, Exalytics Oracle Big Data
Actian (e.g. Ingres)
Actian Matrix (anteriormente ParAccel) y Actian Vector (anteriormente
Vectorwise)-componentes BD y Analytics; Actian Matrix In-memory option ((almacén
de datos en memoria); No incluye distribución Hadoop, pero es compatible con
las distribuciones de Apache, Hortonworks, Cloudera, etc.;
Independiente del hardware;
1010Data
Base de datos en columnas, soporta SQL propio que permite consultas más
sofisticadas, especialmente relacionados con gráficos y series de tiempo;
Soporta datos semiestructurados (redes sociales, etc.);
Centrado en las nubes privadas, puede incluir otros componentes para
análisis, visualización de datos y máquina de aprendizaje;
InfiniDB
Conocido por el nombre de compañía, Calmont, el InfiniDB es una base de
datos en columnas para procesamiento paralelo; No incluye una distribución
Hadoop, ni soporte a streaming;
Es una nueva solución.
Infobright
Base de datos en columnas para el análisis de hasta 50
TB por servidor; Centrado en los servidores multiprocesadores y no en
procesamiento en paralelo;
No incluye distribución Hadoop o soporte a streaming;
Kognitio
La plataforma analítica de Kognitio se centra en el análisis de datos en
memoria;
Disponible en formato de appliance y en la nube; Cuenta con integración
con la distribución de Hadoop de Hortonworks.
Teradata
Análisis de los datos vía Teradata Teradata, Aster;
No ofrece análisis de datos en memoria, pero puede mover datos más
accedidos para los dispositivos de acceso más rápidos, incluyendo RAM y SSD;No
soporta streaming;
Solución de hardware mediante appliance y configuraciones de hardware
optimizado de Dell.
No hay comentarios.:
Publicar un comentario