1/78
Looks like no tags are added yet.
Name | Mastery | Learn | Test | Matching | Spaced | Call with Kai |
|---|
No analytics yet
Send a link to your students to track their progress
Definición de Computación Cloud
Es la provisión de recursos (apps, infraestructura) como servicio, bajo demanda, con capacidad elástica y a través de Internet[cite: 16, 17].
Utility Computing (John McCarthy, 1961)
Idea temprana de organizar la computación como un servicio público, similar al sistema telefónico[cite: 20].
The network is the computer
Eslogan popularizado por Sun Microsystems que anticipaba la era del Cloud[cite: 21].
Paradigma Mainframe
Recursos centralizados privativos optimizados para máximo rendimiento, pero con alto coste de hardware y software[cite: 22, 23].
Paradigma Cliente/Servidor
Recursos distribuidos basados en sistemas abiertos, que ofrecen mayor agilidad y costes más bajos incrementales[cite: 24].
Paradigma Cloud
Recursos centralizados agrupados que unen rendimiento y agilidad bajo un modelo de pago por uso[cite: 25].
Modelo Económico del Cloud
Evoluciona los gastos de capital (CAPEX) a gastos operativos (OPEX)[cite: 26].
NIST: Autoservicio bajo demanda
El consumidor puede aprovisionar capacidades de forma automática, sin interacción humana[cite: 30].
NIST: Acceso amplio a la red
Las capacidades están disponibles en red mediante mecanismos estándar para cualquier dispositivo[cite: 31].
NIST: Agrupación de recursos (Resource Pooling)
Los recursos se agrupan para servir a múltiples consumidores bajo un modelo multiusuario o multi-tenant[cite: 32].
NIST: Elasticidad rápida
Capacidad de aprovisionar y liberar recursos instantáneamente para escalar según la demanda[cite: 33].
NIST: Servicio medido
El uso se monitoriza, controla y reporta, permitiendo una facturación precisa[cite: 34].
Máquinas Virtuales (VMs)
Representación de hardware que ejecuta un SO completo mediante un hipervisor
Hipervisores Tipo 1 y Tipo 2
Tipo 1 o Bare metal (ej. VMware ESXi, KVM) y Tipo 2 (ej. VirtualBox)[cite: 39].
Contenedores (Virtualización de SO)
Alternativa ligera que comparte el kernel del SO base, arranca casi instantáneamente y no penaliza el rendimiento (ej. Docker, LXC)[cite: 42, 43].
MicroVMs
Máquinas virtuales ultraligeras que combinan la seguridad/aislamiento de una VM con la velocidad de un contenedor (ej. Firecracker)[cite: 44].
Problema de Rendimiento en Virtualización
Las operaciones de E/S (red/disco) sufren sobrecarga porque el hipervisor debe capturar y emular las instrucciones del SO mediante hypercalls[cite: 47].
Paravirtualización (ej. VirtIO)
Técnica donde los controladores del SO virtualizado saben que están en una VM y se comunican casi directamente con el hardware[cite: 50].
IOMMU y SR-IOV (Device Passthrough)
Tecnologías de hardware que permiten a la VM acceder directamente a una tarjeta física (ej. red), saltando al hipervisor para tener rendimiento nativo[cite: 51].
Kubernetes
Herramienta convertida en el estándar moderno para la orquestación y gestión de miles de contenedores[cite: 53].
SDN
Redes Definidas por Software (Software Defined Networks) empleadas para alta velocidad[cite: 54].
SOA (Arquitectura Orientada a Servicios)
Arquitectura de aplicaciones modernas con interfaces ligeras basadas en protocolos REST o gRPC[cite: 55].
IaC (Infraestructura como Código)
Despliegue de infraestructura mediante código, utilizando soluciones como Terraform[cite: 55].
PUE (Power Usage Effectiveness)
Métrica de eficiencia energética de un Data Center (Energía total del edificio dividida entre la energía usada por los servidores). Lo ideal es que esté cerca de 1.0[cite: 60, 61, 62].
Autonomic Computing
Iniciado por IBM (2001), sistemas que se gestionan solos sin intervención humana mediante autoconfiguración, autoprotección, autooptimización y autorreparación[cite: 63, 64].
Ciclo MAPE-K
Ciclo de la computación autónoma: Monitorizar, Analizar, Planificar, Ejecutar (sobre una base de Conocimiento)[cite: 64].
IaaS (Infrastructure as a Service)
Aprovisionamiento de infraestructura virtual donde el usuario gestiona el SO y las apps. Permite escalado horizontal y vertical[cite: 67, 68].
PaaS (Platform as a Service)
Plataformas listas para implementar código sin que el desarrollador gestione los servidores subyacentes[cite: 69].
SaaS (Software as a Service)
Aplicaciones totalmente gestionadas listas para el uso del consumidor final[cite: 70].
Computación Serverless
Concepto que desvincula completamente la administración y gestión del servidor del usuario final[cite: 72, 73].
FaaS (Function as a Service)
Ejecución de funciones en respuesta a eventos pagando solo por los milisegundos usados (ej. AWS Lambda, Cloud Run Functions)[cite: 74, 75].
BaaS (Backend as a Service)
Provisión automática de bases de datos y backend para aplicaciones (ej. Firebase)[cite: 76].
Big Data: Las 3 Vs
Volumen (TB a ZB), Velocidad (flujos continuos vs lotes) y Variedad (estructurados y no estructurados)[cite: 78].
Enfoque de procesamiento Big Data
Para evitar cuellos de botella de red, se usa procesamiento distribuido donde las tareas se envían a los nodos que ya albergan los datos[cite: 79].
Procesamiento por Lotes (Batch)
Trabaja con datos limitados/históricos, hace lectura global y busca maximizar la productividad (ej. Hadoop, Spark Batch)[cite: 80].
Procesamiento de Flujos (Stream)
Trabaja con datos ilimitados/continuos, lee por ventanas temporales y busca minimizar la latencia (ej. Storm, Flink, Kafka)[cite: 80].
Data Warehouse
Almacén de datos estructurados orientados a Inteligencia de Negocios (BI) usando BBDD relacionales por columnas y procesos ETL[cite: 83, 84].
Data Lake
Lago de datos brutos a masiva escala y menor coste usando procesos ELT (ej. HDFS, Amazon S3)[cite: 85, 86].
Lakehouse
Arquitectura que combina la gobernanza/transaccionalidad de un Warehouse sobre el almacenamiento barato de un Lake (ej. Delta Lake)[cite: 87].
ETL (Extracción, Transformación, Carga)
Proceso clásico de Data Warehouse donde los datos se transforman en un servidor intermedio antes de cargarlos. Más lento y rígido[cite: 90, 91, 92].
ELT (Extracción, Carga, Transformación)
Paradigma moderno de Data Lakes donde se carga el dato en bruto y se transforma a posteriori solo cuando se necesita consultar[cite: 93, 94, 95].
Formato Parquet y ORC
Formatos binarios columnares eficientes, que evitan a las consultas leer columnas que no han solicitado[cite: 100].
Formato Avro
Formato binario de serialización basado en filas, ideal para procesos de streaming[cite: 101].
Formato Sequence
Formato básico de pares clave-valor fundamental en MapReduce[cite: 102].
HPC / HTC (Big Compute)
Computación intensiva en cálculo puro. Su cuello de botella es el procesador. Usa paralelismo de grano fino o grueso[cite: 105].
Big Data (vs HPC)
Computación intensiva en Entrada/Salida. Su cuello de botella es el disco y movimiento de datos. Usa paralelismo de grano grueso (Map/Reduce)[cite: 105].
Concepto de Región
Área geográfica independiente (ej. europe-southwest1 en Madrid)[cite: 111].
Concepto de Zona
Área de despliegue dentro de una región que funciona como un dominio único de fallo (ej. europe-west2-a)[cite: 112, 113].
Alta Disponibilidad y Disaster Recovery
Los servicios críticos se despliegan en múltiples zonas (resisten caídas locales) o regiones (resisten catástrofes a gran escala)[cite: 114].
Puntos de Presencia (PoPs)
Más de 200 puntos de borde de Google que conectan el tráfico del usuario a la red privada lo más cerca posible, mejorando latencia y seguridad[cite: 115, 116].
Tecnología Base: Jupiter
Arquitectura de red interna de los centros de datos de Google (hasta 400 Gb/s)[cite: 120].
Tecnología Base: Colossus
Sistema de almacenamiento distribuido masivo de Google (sucesor de GFS)[cite: 121].
Tecnología Base: Spanner
Base de datos relacional globalmente consistente usando relojes atómicos (sucesora de Bigtable)[cite: 123, 163].
Tecnología Base: Borg
Orquestador interno de contenedores de Google del que nació el estándar Kubernetes[cite: 124].
Jerarquía de recursos: Proyecto
Base lógica donde se habilitan servicios, APIs y facturación. Tiene nombre, ID único y número[cite: 127, 128].
IAM (Identity and Access Management)
Sistema de control de accesos basado en el principio de mínimo privilegio[cite: 129, 130].
IAM: Principal (Identidad)
Usuario final o Cuenta de Servicio (identidad para que apps/VMs interactúen sin humanos)[cite: 131].
IAM: Roles
Conjuntos de permisos. Pueden ser Básicos (muy amplios, no recomendados), Predefinidos (granulares) o Personalizados[cite: 132, 133, 134, 135].
IAM: Política
Regla final que vincula a un Principal con un Rol sobre un Recurso concreto[cite: 136].
Compute Engine (IaaS)
Servicio para levantar máquinas virtuales. Pueden ser de propósito general, memoria, computación o con GPUs[cite: 139, 140, 141].
MIGs (Grupos de Instancias Gestionados)
Grupo de VMs idénticas que se autoescalan según la carga de trabajo garantizando alta disponibilidad[cite: 142].
Spot VMs (VMs de acceso puntual)
Máquinas muy baratas pero efímeras (Google puede quitártelas), ideales para procesos que pueden retomarse si fallan[cite: 143, 144].
GKE (Google Kubernetes Engine)
Servicio CaaS gestionado de Kubernetes. Tiene modo Standard (gestionas nodos) y Autopilot (Google gestiona todo, pagas por pods)[cite: 145, 146].
Cloud Run (Serverless)
Plataforma para contenedores sin estado que responde a tráfico HTTP, escala a cero y cobra por milisegundos[cite: 147, 148].
Cloud Run Functions (FaaS)
Ejecuta fragmentos de código (funciones) en respuesta a eventos sin gestionar servidores ni contenedores[cite: 149, 150, 151].
Cloud Storage
Almacenamiento de objetos inmutables en "Buckets" ideal para datos no estructurados[cite: 153, 154, 155].
Cloud Storage: Clases de almacenamiento
Standard (acceso frecuente), Nearline/Coldline (backups, poco frecuente) y Archive (retención legal a largo plazo)[cite: 156, 157, 158, 159].
Cloud SQL vs Spanner
Ambas relacionales. Cloud SQL es para MySQL/PostgreSQL con escala regional. Spanner es para escala masiva global[cite: 160, 162, 163].
Firestore (NoSQL)
BD orientada a documentos (JSON) ideal para apps móviles/web con sincronización en tiempo real[cite: 167].
Bigtable (NoSQL)
BD de columnas anchas (Wide-column), ultrarrápida, ideal para IoT, telemetría y series temporales[cite: 168, 169].
BigQuery
Data Warehouse gestionado, serverless y columnar (Capacitor) con motor Dremel. Permite SQL sobre petabytes e integra ML[cite: 171, 172].
Red VPC en Google Cloud
Son redes globales (no atadas a una región) que permiten conectar máquinas en distintos continentes bajo una sola red corporativa[cite: 174, 175, 176].
Cloud Load Balancing
Balanceador global con IP "Anycast" única. Enruta el tráfico al servidor sano más cercano. Opera en Capa 7 (HTTP) o Capa 4 (TCP/UDP)[cite: 177, 178, 179, 180].
Pub/Sub
Middleware asíncrono de mensajería masiva (Publicador/Suscriptor) que sustituye a Kafka[cite: 182, 183].
Eventarc
Enrutador que captura +130 tipos de eventos y los dirige a Cloud Run o Funciones[cite: 184].
Dataproc (Batch)
Servicio gestionado para Hadoop y Spark. Permite encender un clúster masivo, procesar y apagarlo pagando solo por el uso[cite: 187, 188, 189].
Dataflow (Batch y Stream)
Servicio gestionado de Apache Beam para tuberías ETL complejas y unificadas[cite: 190, 191, 192].
Dataproc vs Dataflow
Dataproc levanta clústeres efímeros de Hadoop/Spark. Dataflow crea tuberías unificadas serverless basadas en Apache Beam.
Arquitecturas: Warehouse, Lake y Lakehouse
Warehouse: Datos limpios para BI (BigQuery). Lake: Datos brutos baratos (Storage+Dataproc). Lakehouse: Combina ambos[cite: 195, 196, 197].