Bases de datos en AWS

 

Bases de datos en AWS

Bases de datos relacionales (RDS)

Una base de datos relacional es un tipo de base de datos. Utiliza una estructura que nos permite identificar y acceder a datos en relación con otro dato en la base de datos. A menudo, los datos de una base de datos relacional se organizan en tablas. Tiene los siguientes componentes básicos: Base de datos, Tablas, Filas y Campos (columnas).

Las bases de datos relacionales (RDS) soportadas en AWS son las siguientes:

  • SQL Server
  • Oracle
  • MySQL
  • PostgreSQL
  • Aurora
  • MariaDB

RDS en AWS tiene dos características clave:

  • Multi-AZ (para recuperación de desastres): Cuando se aprovisiona una instancia de base de datos Multi-AZ, Amazon RDS crea automáticamente una instancia de base de datos principal y otra instancia de reserva, en la que se replican sincrónicamente los datos, en una zona de disponibilidad (AZ) diferente. Esto permite que en caso de que la base de datos principal quede fuera de linea entra la base de datos secundaria a reemplazarla.
  • Read replicas (para rendimiento): Las réplicas de lectura de Amazon RDS ofrecen mayor desempeño y durabilidad para instancias de base de datos (DB) RDS. Las réplicas facilitan el escalado de manera elástica más allá de las limitaciones de capacidad de una única instancia de base de datos para cargas de trabajo de base de datos con uso elevado de las lecturas.

La base de datos no relacional de Amazon se llama DynamoDB, Amazon DynamoDB es una base de datos de clave-valor y documentos que ofrece rendimiento en milisegundos de un solo dígito a cualquier escala. Se trata de una base de datos completamente administrada, duradera, multiactiva y de varias regiones que cuenta con copia de seguridad, restauración y seguridad integradas, así como almacenamiento de caché en memoria para aplicaciones a escala de Internet. DynamoDB puede gestionar más de 10 billones de solicitudes por día y puede admitir picos de más de 20 millones de solicitudes por segundo. 
Características de DynamoDB:
  •  Completamente administrado Altamente disponible con replicación en 3 zonas de disponibilidad.
  •  Base de datos NoSQL: es una base de datos no relacional.
  •  Escala a cargas de trabajo masivas, base de datos distribuida "sin servidor".
  •  Millones de solicitudes por segundo, billones de filas, cientos de TB de almacenamiento.
  •  Rápido y consistente en desempeño.
  •  Latencia de milisegundos de un solo dígito: recuperación de baja latencia.
  •  Integrado con IAM para seguridad, autorización y administración.
  •  Capacidades de escalamiento automático y de bajo costo.



La base de datos de Datawarehouse de AWS es Redshift, la cual tiene las siguientes características:

• Redshift se basa en PostgreSQL, pero no se usa para OLTP.
• Es OLAP: procesamiento analítico en línea (análisis y almacenamiento de datos).
• Carga de datos una vez cada hora, no cada segundo.
• Rendimiento 10 veces mejor que otros almacenes de datos, escala a PB de datos.
• Almacenamiento de datos en columnas (en lugar de basado en filas).
• Ejecución de consultas masivamente paralelas (MPP), de alta disponibilidad.
• Pago por uso según las instancias aprovisionadas.
• Tiene una interfaz SQL para realizar las consultas.
• Las herramientas de BI como AWS Quicksight o Tableau se integran con él.



AWS EMR

  • EMR significa "Elastic MapReduce".
  • EMR ayuda a crear clústeres de Hadoop (Big Data) para analizar y procesar gran cantidad de datos.
  • Los clústeres pueden estar formados por cientos de instancias EC2.
  • También es compatible con Apache Spark, HBase, Presto, Flink ...
  • EMR se encarga de todo el aprovisionamiento y la configuración.
  • Auto escalamiento e integración con instancias de spot.
  • Casos de uso: procesamiento de datos, aprendizaje automático, indexación web, big data…


Comentarios

Entradas más populares de este blog

Mejores practicas para migración de datos a Salesforce

AWS Lambda

Modelado de datos en Salesforce