> **📝 Exame de Especialización: Cloud, Automatización e Big Data** # Pregunta 1 (Tema 24: Cloud Computing) En el marco de la "Estrategia Cloud" de las Administraciones Públicas, ¿qué se entiende por una "Nube Híbrida" y qué ventaja principal ofrece a un Concello? - A) Es una nube que combina servicios de proveedores públicos (como AWS o Azure) con infraestructura privada del propio Concello, permitiendo mayor escalabilidad sin renunciar al control de datos sensibles. - B) Es una infraestructura que utiliza exclusivamente software libre y propietario de forma alterna para evitar el "vendor lock-in" (dependencia del proveedor). - C) Es un modelo donde los ciudadanos pueden subir sus propios datos a los servidores municipales para colaborar en la gestión pública de forma bidireccional. - D) Se refiere al uso simultáneo de redes Wifi y cableado de fibra óptica para acceder a los servicios de vCenter desde fuera de la red corporativa. ## Respuesta Esta la voy a responder a ciegas pues si mal no me acuerdo, tenemos Infraestructura de Nube Pública donde hay proveedores con acceso general como servicio y tambié Infraestructura de Nube Privada cuando dichos recursos se encuentran en el entorno cerrado y limitado de una entidad. Como es mjy difícil tener una infraestructura 100% en uno de esos lados existe el concepto de Infraestructura de Nube Híbrida donde se juntan servicios contratados en la nube así como un sistema cerrado de nube sobre los servidores internos de la entidad. Por tanto, y bajo este concepto, la respuesta correcta diría que es la `A`. ## Corrección **A**. Impecable. Has captado la esencia: aprovechar la potencia de la pública sin soltar el control de lo crítico en la privada. # Pregunta 2 (Tema 25: Automatización e Orquestación) Que significa que unha ferramenta de automatización como Ansible sexa "Declarativa" fronte a unha "Imperativa"? - A) Que o programador debe definir paso a paso cada comando que o sistema operativo ten que executar, incluíndo o manexo de erros manual. - B) Que o programador define o "estado desexado" (ex: "o paquete Apache debe estar instalado") e a ferramenta encárgase de realizar as accións necesarias para chegar a ese estado. - C) Que a ferramenta require unha declaración formal ante o Rexistro da Propiedade Intelectual por ser software libre distribuído baixo licenza GPL. - D) Que só pode utilizarse mediante sentenzas SQL de tipo DECLARE para interactuar coas bases de datos do inventario. ## Resposta Esta vouna responder a cegas tamén polo que me poda soar, e diría que unha automatización declarativa viría sobre un ámbito onde se desclaran os aspectos que se queren levar a cabo e cómo, pero de forma simple e directa como con linguaxes de marcas ou de formatos como pode ser JSON ou YALM; mentres que unha automatización imperativa partiría de terse que programa cunha linguaxe que tire máis a complexa como pode ser o caso de LUA entre outros. Por tanto, en base a isto diría que a resposta correcta é a `B` por mor de que con linguaxes como YALM non podes establecer condicións, só un resultado desexado, a diferencia de LUA. ## Corrección **B**. Has dado en el clavo. Solo un matiz técnico para tu "mochila": en YAML/Ansible sí se pueden poner condiciones (con la cláusula `when`), pero sigue siendo **declarativo** porque tú le dices "instala esto *si* pasa aquello", pero no programas el "cómo" se instala el bit a bit. # Pregunta 3 (Tema 26: Big Data) Dentro de una arquitectura de Big Data, ¿cuál es la función específica de la capa de "Ingesta" de datos? - A) Realizar el análisis estadístico avanzado y la creación de gráficos de Business Intelligence para los concejales. - B) Recopilar y trasladar los datos desde las diversas fuentes originales (sensores, bases de datos, logs) hacia el sistema de almacenamiento (Data Lake). - C) Cifrar la información mediante algoritmos de clave pública para cumplir con el Esquema Nacional de Seguridad antes de su borrado definitivo. - D) Eliminar automáticamente todos los datos que no sean de tipo relacional (SQL) para optimizar el espacio en disco del servidor. ## Respuesta De esta no tengo ni idea pero por lógica diría que la ingesta de datos es la fase en la que el proceso de almacenamiento en un entorno accesible para luego dar legibilidad a los datos y mantenerlos a lo largo del tiempo, ha de haber un movimiento de datos hacia el Data Lake para poder pasar en un futuro a una legibilidad de los datos cara un Data Warehouse. En este caso, la ingesta sería sobre las distintas fuentes de datos donde éstos irían a parar al Data Lake. Con esta premisa diría que es la `B` porque: - A) Aquí hablamos de un tratamiento Post Warehouse donde se hace una presentación de los datos procesados y ordenados. - B) Dicta lo que dije. - C) Esto no tiene nada que ver con este tema. - D) Esto tampoco tiene nada que ver pues cualquier dato es ordenable y procesable si éste es de interés, independientemente de su naturaleza. ## Corrección **B**. Tu lógica de descarte fue perfecta. La ingesta es la "puerta de entrada" a la arquitectura. # Pregunta 4 (Tema 24: Cloud Computing) Segundo o modelo de servizos na nube, se o Concello de Ferrol contrata un servizo de correo electrónico onde só xestiona as contas de usuario pero non o software nin os servidores, ante que tipo de servizo estamos? - A) IaaS (Infrastructure as a Service). - B) PaaS (Platform as a Service). - C) SaaS (Software as a Service). - D) DaaS (Data as a Service). ## Resposta Velaquí falo conseguridade de dicir que é a `C`. ## Corrección **C**. Sin duda. Es el modelo de "consumo" puro. # Pregunta 5 (Tema 25: Automatización - Ferramentas Libres) En Ansible, para que serve o ficheiro coñecido como "Inventory" (Inventario)? - A) Para listar todos os compoñentes de hardware (CPU, RAM, Disco) que teñen os servidores do Concello para o seu seguro anual. - B) Para definir as máquinas destino (nodos xestionados) nas que se van aplicar os Playbooks, permitindo animalas en grupos (ex: [webservers], [dbservers]). - C) Para gardar os contrasinais cifrados dos usuarios root mediante a ferramenta Ansible Vault. - D) É un log onde se anotan todas as accións fallidas durante a execución dunha tarefa de orquestación. ## Resposta Esta é sinxela agora que me estou a familiarizar con estes termos, e viría a ser a `B` por mor de ser o qué identifica ás máquinas que ten que afectar cara as ordes que ten no YALM concreto para cada máquina ou conxunto de máquinas. ## Corrección **B**. Exacto. Es el mapa de carreteras de Ansible. # Pregunta 6 (Tema 26: Big Data e Análise) ¿Qué diferencia fundamental existe entre un "Data Lake" y un "Data Warehouse" en la gestión de datos públicos? - A) El Data Lake almacena datos estructurados listos para informes, mientras que el Data Warehouse guarda archivos PDF y vídeos sin procesar. - B) El Data Lake es un depósito de datos en bruto (estructurados y no estructurados), mientras que el Data Warehouse almacena datos ya procesados y optimizados para el análisis. - C) No existe diferencia; son términos sinónimos que se utilizan para referirse a la misma base de datos SQL Server del Concello. - D) El Data Warehouse es obligatorio por ley para municipios de más de 50.000 habitantes, mientras que el Data Lake es solo para la administración autonómica. ## Respuesta Esta es fácil y la expliqué antes en otra respuesta, y vendría a ser la `B`. ## Corrección **B**. Ya lo tienes dominado: Bruto vs. Cocinado. # Pregunta 7 (Tema 25: Orquestación) No proceso de orquestación de sistemas, que entendemos polo concepto de "Idempotencia"? - A) A capacidade do sistema de executar moitas tarefas ao mesmo tempo (procesamento en paralelo) para aforrar tempo. - B) A propiedade de que o resultado dunha operación sexa o mesmo independentemente de cantas veces se execute, sen causar efectos secundarios non desexados. - C) Un protocolo de cifrado de seguridade que impide que os administradores de sistemas accedan aos datos dos cidadáns sen permiso. - D) O proceso de eliminar as máquinas virtuais que levan máis de 30 días sen utilizarse no clúster de virtualización. ## Resposta Esta foi unha das cousas que máis caña lle dimos para entender esta parte e viría a ser a `B`. ## Corrección **B**. La palabra mágica de la automatización. Ya no se te olvida. # Pregunta 8 (Tema 24: Cloud e ENS) ¿Qué requisito esencial establece el Esquema Nacional de Seguridad (ENS) para el uso de servicios de nube pública en la Administración Pública española? - A) Que el proveedor de servicios de nube debe estar certificado en el ENS y que los datos sensibles (nivel alto) deben almacenarse preferentemente en territorio de la UE. - B) Que el coste del servicio de nube debe ser inferior al coste de mantener un CPD físico propio para garantizar la eficiencia presupuestaria. - C) Que el administrador de la nube pública debe ser un funcionario de carrera del subgrupo A1 con titulación en ingeniería informática. - D) Está estrictamente prohibido usar nubes públicas; la ley solo permite el uso de servidores físicos situados físicamente dentro de la casa consistorial. ## Respuesta Aquí voy a responder por descarte pues la verdad que ni idea si no tuviera estas opciones, y diría que la `A`, pero vamos, sólo usando la lógica, pero de saber, pues 0. ¡Jajajaja! ## Corrección **A**. ¡Incluso a ciegas has acertado! El ENS exige que los proveedores de nube para la administración estén certificados (aparecen en el catálogo del CCN-PYC) y la soberanía de datos en la UE es un pilar fundamental. # Pregunta 9 (Tema 26: BI e Analítica) Cal é a finalidade principal do proceso "ETL" nun proxecto de análise de datos? - A) Enviar correos electrónicos automáticos aos cidadáns cando teñen un recibo pendente de pago (Email To Local). - B) Extraer datos de fontes heteroxéneas, Transformalos para a súa análise e Cargalos nun destino (como un Data Warehouse). - C) Eliminar Temporalmente os Logs do sistema para liberar espazo en disco durante os procesos de backup nocturno. - D) Traducir automaticamente os documentos de castelán a galego utilizando algoritmos de procesamento de linguaxe natural (NLP). ## Resposta El ETL es el proceso para transformar los datos del Data Lake al formato o formatos necesarios para tener el Data Warehouse mediante la extracción, transformación y carga de los mismos. En este caso sería la `B`. ## Corrección **B**. Proceso clave para que el Big Data sea útil. # Pregunta 10 (Tema 25: Automatización) En el contexto de "Infraestructura como Código" (IaC), ¿cuál es la ventaja de usar un sistema de control de versiones como Git para gestionar los archivos de Ansible o Terraform? - A) Permite que el sistema operativo se actualice solo cada vez que se detecta un cambio en el código fuente. - B) Facilita la trazabilidad, permitiendo saber quién hizo qué cambio en la infraestructura, cuándo y permitiendo volver a una versión anterior en caso de error. - C) Aumenta la velocidad de conexión a internet de los servidores municipales al comprimir los archivos de configuración. - D) Es un requisito del fabricante VMware para poder integrar vCenter con herramientas de terceros de forma legal. ## Respuesta Aquí diré que como cualquier otro proyecto de programación, sería la `B`, sin embargo, sí permitiría que el Ansible esté actualizado si se automatiza el Pull, y por tanto, aplicable como actualización a los Sistemas Operativos a los que afecte, así que ojo con esa `A`. ## Corrección **B**. Has detectado la "trampa". Dices que "ojo con la A" porque se podría automatizar el `pull`. Tienes razón en el mundo real (se llama **GitOps** o **CI/CD**), pero en un examen de oposición: 1. **Git** por sí mismo es solo el almacén de versiones. 2. La **trazabilidad** y el **rollback** (volver atrás) son las funciones "core" que el tribunal quiere oír. 3. La opción A ("se actualiza solo") depende de herramientas externas (como Jenkins, GitLab CI o GitHub Actions). **Consejo**: En el examen, si ves "Trazabilidad" o "Auditoría" junto a Git, esa es la respuesta ganadora el 99% de las veces.