10 KiB
Pregunta 1
No contexto do Big Data na Administración Pública, cal das seguintes opcións describe correctamente o concepto de 'Veracidade' (unha das famosas 5 V)?
Resposta
Vou soltar a cegas qué é para min a veracidade no caso do Big Data. Tras unha análise dos datos, a extracción dos mesmos sexan reais conforme aos datos orixinais. Por outra banda, se o Big Data non se refire a traballo de datos masivos non relacionados, sinón a xestión de datos en xeral como poden ser as publicacións e contorno dos datos expostos, documentos internos, etc. A veracidade indicaríanos que de verdade son datos oficiais. Isto último pode darse a partires de sistemas de validación como ligazón e Hashes ou sistemas de verificación como CSV, etc.
Agora, voy miralas opcións e responder a éstas a cegas, a ver qué sae:
A necesidade de garantir que os datos masivos recollidos sexan precisos, fiables e de calidade para poder tomar decisións gobernamentais correctas e xustas.
Esta atañe a ámbolos puntos de vista expostos anteriormente. Se a extracción de datos concisos non se correspondnte cos datos orixinais oou non teñen que ver co que se está a expor, isto xera un problema de veracidade.
A veracidade refírese á velocidade coa que a Administración Pública é capaz de publicar absolutamente todos os datos recadados nun portal de transparencia, sen importar se conteñen erros de formato ou se están incompletos, priorizando sempre a inmediatez cidadá sobre calquera tipo de calidade técnica e rigor informático na base de datos.
Isto non ten sentido algún cara a veracidade, e posiblemente con nada.
A obriga legal de que os cidadáns xuren dicir a verdade antes de introducir calquera dato nun formulario web.
Isto é un formalisto conforme dícese a verdade, pero non garante de dita veracidade, polo que non ten que ver. Calquera pode mentir no xurado, ou sen esperar malicia, trabucarse ou errar nos datos facilitados.
A capacidade de xerar un volume inmenso de datos reais en tempo real mediante sensores IoT.
Isto depende da veracidade concretamente, para poder coller eses datos e podelos operar feacentemente, polo tanto, tampouco é veracidade.
Corrección
- Concepto: ¡Correcto! Al descartar diste en el clavo. La "veracidad" en Big Data no es que el dato sea un documento compulsado oficial, sino que el conjunto de datos esté limpio, sea preciso y fiable (sin ruido ni errores) para que el algoritmo no arroje conclusiones absurdas.
- Lingüística (Galego) - ¡Alerta roja repetida! 🚨
- Volveches usar "a partires de". ¡Témolo que desterrar! O correcto é sempre "a partir de".
- Acentuación: "qué é", "éestas", "qué sae" -> Os pronomes interrogativos levan til en preguntas directas, pero aquí algúns sobran ou teñen erros de formato. "Estas" nunca leva til.
- Ortografía: "sinón" -> senón. "oou" -> ou. "formalisto" -> formalismo. "dícese" -> dise ou se di.
- Vocabulario: "feacentemente" é un castelanismo (fehacientemente). En galego o ideal é "de xeito fidedigno".
Pregunta 2
Al aplicar técnicas de Big Data sobre expedientes sanitarios o tributarios, ¿cuál es la diferencia fundamental entre anonimización y seudonimización según el RGPD?
Respuesta
Respondiendo a ciegas, diría que la anonimización es el ocultar el autor origen de los datos mientras que la seudonimización es la forma de garantizar una identificación de autoría u origen de dichos datos protegiendo la privacidad del mismo.
Corrección
- Concepto: Lo has entendido a la perfección. La clave diferencial es la reversibilidad.
- Lingüística (Castellano): Impecable. Respuesta directa y clara.
Pregunta 3
É común confundir 'Big Data' con 'Open Data' (Datos Abertos). Cal das seguintes afirmacións establece a diferenza principal entre ambos no sector público?
Resposta
O Big Data e un conxunto de datos sen relación entre eles, para fins diversos, mentres que o Open Data son datos abertos ao público en xeral. O Big Data pode estar nun entorno privado non compartido por niveis de confidencilidade ao que pode pertencer mentres que o Open Data non tería estes límites.
Corrección
- Concepto: Bien deducido. El límite de la confidencialidad es la clave práctica en la Administración.
- Lingüística (Galego): Un par de tecleos rápidos: "e un conxunto" -> é un conxunto. "confidencilidade" -> confidencialidade.
Pregunta 4
Dentro de la gestión pública, ¿qué busca principalmente la 'analítica predictiva' cuando se aplican algoritmos de Big Data?
Respuesta
Hablando un poco a ciegas y partiendo del Big Data y la tendencia a sistemas de Deep Learning como las IAs actuales, la analística predictiva busca la mayor probabilidad cara un posible resultado futuro a partir de los datos actuales en el cómputo del Big Data que tenga en análisis.
Corrección
- Concepto: Exacto. Es jugar con las probabilidades de futuro basándose en los datos pasados.
- Lingüística (Castellano): "analística" -> analítica.
Pregunta 5. En castellano
Teniendo en cuenta el uso intensivo de datos (Big Data) en las "Smart Cities" (Ciudades Inteligentes) para gestionar desde cámaras de tráfico hasta contenedores de basura, ¿qué riesgos éticos y de privacidad identificarías, y cómo los mitigarías desde el diseño?
Respuesta
Nestes casos atopámonos unha marea de riscos brutal, cada vez maior e con máis descontrol pese ás normativas que intentan restrinxir. Unha normativa non impide físicamente, soamente moral e logixamente polo que calquera, ou incluso un automatismo, podería facer uso destes datos, xa sexa por intrusión, exposición, etc. As cámaras de vixilancia requiren de conexións e Software para poder facer monitorización nun ámbito de rede, xa sexa por Intranet (Un sistema pechado) como por Internet(Independentemente de que sexan sistemas abertos ou que requiren de acceso e/ou control remoto); así como os sistemas de identificación por NFC para os contedores, entre outros moitos.
Para poder solventar todos estes problemas, por exemplo, cara as cámaras, diferenciar ven se son de ámbito público ou privado, sendo as segundas vinculantes a unha rede pechada e privada, a poder ser por cable e sen nodos inalámbricos. No caso dos NFC pouco se pode facer máis que poñer trabas criptográficas, pero o sistema en cuestión limítase pola súa natureza.
Corrección
- ¡Atención al formato del examen! Te pedí la respuesta en castellano y la has escrito en galego. En una oposición, no seguir las instrucciones de formato o idioma en una prueba de desarrollo es un cero directo en esa pregunta. ¡Mucha atención a los enunciados!
- Razonamiento Técnico: Te has centrado mucho en la ciberseguridad (hackeos, redes wifi vs cable, NFC). Está bien, pero la pregunta incidía en los riesgos éticos y de privacidad. Aquí el tribunal espera que hables de:
- Riesgos: Vigilancia masiva ciudadana, discriminación algorítmica (ej. el sistema de basura penaliza más a un barrio que a otro), pérdida de anonimato en la vía pública.
- Solución desde el diseño: Debes mencionar obligatoriamente el principio de "Privacidad desde el Diseño" (Privacy by Design) del RGPD: minimizar la recogida de datos (que las cámaras cuenten coches, pero borren las matrículas al instante si no hay infracción), anonimizar en origen y no guardar datos innecesarios.
- Lingüística (Galego):
- ¡Segunda alerta roja repetida! 🚨 Escribiches "físicamente" e "loxicamente". Lembra a regra de ouro que vimos onte: en galego, os adverbios rematados en "-mente" NUNCA levan til. O correcto é fisicamente e loxicamente.
- "inalámbricos" -> mellor "sen fíos".
- "ven se son" -> "ben se son".
Pregunta 6. En galego
Imaxina que a Axencia Tributaria decide aplicar ferramentas de Big Data para cruzar automaticamente datos de redes sociais públicas, movementos bancarios e consumo eléctrico co fin de detectar posibles patróns de fraude fiscal. É legal realizar este tipo de "perfilaxe" (profiling) automatizada cidadá? Que dereitos asisten ao cidadán neste caso segundo o RXPD e a LOPDGDD?
Resposta
Falando a cegas, dicir que estaría totalmente prohibido por mor de ser unha vulneración da privacidade e da intimidade das persoas, ademais que a maioría de procedementos requiren dun consentemento por parte do interesado, pese a que este sexa un afectado neste caso.
Mirando a lexislación atopámonos que a busca de datos facilitada por un terceiro non pode exceder da identificación do interesado en cuestión, salvo que sexa no interés ou protección do interesado en cuestión. Isto o temos navegando como base na LOPDGDD, no seu artigo 11, da Transparencia e Información ao Afectado, do Capítulo I, de Transparencia e Información, do Título III, dos Dereitos das Persoas, concretamente no seu Apartado 3, que nos leva ao RXPD, concretamente ao seu artigo 14, onde se nos di que a recolecta de datos vai condicionada entre outras ao establecido no Artigo 10, do Tratamento de Datos Persoais Relativos a Condenas e Infracciones Penais, o cal condiciona estes aos datos que nos permite o Artigo 6, con dita base.
Corrección
- Razonamiento Técnico / Legal (¡Ojo aquí!): Tu deducción lógica te dice que está totalmente prohibido por falta de consentimiento. Trampa mortal de oposición. * La Administración Pública no necesita el consentimiento del ciudadano si el tratamiento es necesario para el cumplimiento de una misión realizada en interés público o el ejercicio de poderes públicos (Art. 6.1.e del RGPD). Evitar el fraude fiscal es un poder público.
- Lo que sí protege al ciudadano en este escenario de Big Data es el Art. 22 del RGPD: el derecho a no ser objeto de una decisión basada únicamente en el tratamiento automatizado. Es decir, el algoritmo puede levantar la bandera roja y perfilarte como sospechoso, pero la multa o el embargo final tiene que firmarlo y revisarlo un inspector humano.
- Lingüística (Galego):
- "interés" -> interese.
- Sintaxis un poco enredada al final mencionando artículos. Es mejor ir al grano con el concepto jurídico que hacer una ensalada de números si no estás 100% seguro del número exacto de cada apartado.