1/101
Flashcards de preguntas y respuestas para el certamen 3 de Data Science.
Name | Mastery | Learn | Test | Matching | Spaced |
---|
No study sessions yet.
¿Qué es la gestión de proyectos?
Proceso de planificación, organización y control de recursos para alcanzar un objetivo dentro de un plazo definido.
¿Cuáles son los propósitos de la gestión de proyectos?
Asegurar cumplimiento de plazos, presupuesto y calidad; optimizar recursos; controlar riesgos; mejorar la toma de decisiones.
¿Cómo son las fases en proyectos tradicionales?
Fases secuenciales (inicio → planificación → ejecución → cierre).
¿Cómo es el ciclo en proyectos de Data Science?
Ciclo iterativo (recolección de datos → análisis → validación → implementación).
¿Cuál es el enfoque de la metodología Waterfall?
Enfoque secuencial y lineal.
¿Cuál es la primera fase de Waterfall?
Definir alcance y objetivos.
¿Cuáles son las ventajas de Waterfall?
Claridad, estructura, buena documentación.
¿Cuáles son las desventajas de Waterfall?
Rigidez ante cambios, errores tempranos impactan gravemente.
¿Cuál es el enfoque de la metodología Agile?
Enfoque iterativo con entregas parciales frecuentes (sprints).
¿Cuáles son los principios de Agile?
Adaptabilidad, entregas constantes de valor, colaboración continua.
¿Cuáles son las ventajas de Agile?
Flexibilidad, entregas rápidas, mejora continua.
¿Cuáles son las desventajas de Agile?
Riesgo de desvíos, dependencia del feedback, necesidad de mucha comunicación.
¿Qué es Scrum?
Framework ágil basado en sprints (1 a 4 semanas).
¿Cuál es el rol del Product Owner en Scrum?
Prioriza tareas.
¿Cuál es el rol del Scrum Master?
Elimina obstáculos.
¿Cuál es el rol del Equipo Scrum?
Ejecuta tareas y entrega producto funcional.
¿Qué es el Product Backlog?
Lista priorizada de tareas.
¿Qué es el Sprint Backlog?
Tareas del sprint actual.
¿Qué es el Increment en Scrum?
Entregable funcional.
¿Cuál es el enfoque de Lean?
Enfoque en maximizar valor y minimizar desperdicios.
¿Cuáles son los principios de Lean?
Identificación de valor, eliminación de desperdicios, mejora continua (Kaizen).
¿Cuáles son algunas herramientas de Lean?
Value Stream Mapping, 5S.
¿Qué es Kanban?
Metodología visual con tableros (To Do, In Progress, Done).
¿Cuáles son los elementos de Kanban?
Tarjetas Kanban, límites WIP (Work in Progress).
¿Cuáles son las ventajas de Kanban?
Identificación de cuellos de botella, flujo de trabajo claro.
¿Cuál es la importancia de la planificación en Data Science?
Define objetivos claros, optimiza tiempo y recursos, controla riesgos y progreso.
¿Qué es un Diagrama de Gantt?
Cronograma visual con dependencias.
¿Cómo se usa Kanban en la planificación?
Gestión diaria y detección de bloqueos.
¿Para qué se usa Asana?
Proyectos complejos, cronogramas, dashboards.
¿Qué ofrece Trello?
Flujo visual, integración con Slack, GDrive.
¿Qué ofrece Monday?
Automatización, gestión de recursos.
¿Qué son los KPIs?
Indicadores para medir desempeño de proyectos.
¿Cuáles son ejemplos de KPIs técnicos?
Precisión, F1 Score, RMSE, MAE.
¿Cuáles son ejemplos de KPIs de tiempo?
Cumplimiento de plazos, duración de ejecución.
¿Cuáles son ejemplos de KPIs de calidad de datos?
Completitud, consistencia, precisión.
¿Cuáles son ejemplos de KPIs financieros?
ROI, costos vs. beneficios.
¿Qué significa SMART en KPIs?
Específicos, Medibles, Alcanzables, Relevantes, Temporales.
¿Cómo equilibrar plazo y calidad?
Dividir en fases, revisiones periódicas, ajustes ágiles.
¿Cuáles son riesgos comunes en proyectos?
Falta de datos, problemas técnicos, cambios de requisitos.
¿Qué incluyen los planes de contingencia?
Recursos extra, canales de comunicación claros, estrategias preventivas.
¿Por qué es importante hablar de ética en Data Science?
Uso acelerado de datos y decisiones automatizadas que afectan vidas reales.
¿Qué es la ética en el contexto de Data Science?
Principios que guían el uso responsable de datos.
¿Cuáles son las preguntas clave al considerar la ética en datos?
¿Puedo hacerlo? (capacidad técnica y legal) y ¿Debo hacerlo? (responsabilidad moral).
¿Cuáles son los principios fundamentales de la ética en datos?
Beneficencia, no maleficencia, justicia, autonomía, responsabilidad.
¿Cómo abordar un algoritmo de contratación que discrimina por género?
Balancear los datos, implementar métricas de equidad, establecer supervisión humana.
¿Cuáles son los dos primeros principios fundamentales de ética en datos?
Beneficencia – Hacer el bien, maximizar beneficios; No maleficencia – Evitar causar daño
¿Cuáles son el tercer y cuarto principio fundamentales de ética en datos?
Justicia – Distribución equitativa de beneficios y cargas; Autonomía – Respetar capacidad de decisión de las personas
¿Qué técnicas se pueden usar para la protección de la privacidad?
anonimización, minimización de datos, cifrado y controles de acceso
¿Cuáles son los efectos del sesgo algorítmico?
Decisiones injustas y perpetuación de desigualdades.
¿Cuáles son las fuentes comunes del sesgo?
Datos históricos, diseño del modelo y uso de variables proxy.
¿Qué falló en el caso del algoritmo de contratación que discriminaba por género?
Tener datos de entrenamiento sesgados, falta de supervisión humana y ausencia de pruebas de equidad.
¿Qué es Fairness en Data Science?
Que un modelo o sistema automatizado no discrimine ni favorezca injustamente por raza, género, edad, etc.
¿Cómo se aborda el problema de fairness en Data Science?
Analizando sesgos en los datos, evaluando métricas de equidad, ajustando modelos e incorporando diversidad.
¿Qué es COMPAS?
Sistema para predecir reincidencia criminal en acusados del sistema judicial estadounidense.
¿Qué ocurrió en el caso de Cambridge Analytica?
Recolección no autorizada de datos de Facebook mediante una aplicación de test de personalidad.
¿Cuál fue el problema con el algoritmo de contratación de Amazon?
El modelo penalizaba sistemáticamente los CV de mujeres para roles técnicos.
¿Cómo se puede incorporar la diversidad y la ética desde el diseño?
Analizar sesgos en los datos y evaluar métricas de equidad
¿Qué diferencia clave hay entre ética y cumplimiento legal?
Cumplir la ley es necesario, pero la responsabilidad ética va más allá de los requisitos mínimos legales.
¿Por qué es crucial detectar a tiempo los problemas éticos?
Detectar problemas éticos de forma temprana permite corregir el rumbo antes de que ocurran consecuencias graves.
¿Qué regula la legislación de protección de datos?
Regula la recolección, procesamiento y almacenamiento de datos personales.
¿Cuáles son los principios clave del GDPR?
Consentimiento informado y explícito, derecho al olvido, portabilidad de datos, privacidad por diseño.
¿Cuáles son tres implicancias prácticas del GDPR?
Tiempo para reportar brechas de seguridad (72h), multa máxima del volumen de negocio global (4%) y Consentimiento explícito.
¿Qué regula la Ley N° 19.628 en Chile?
Rige el tratamiento de datos personales por organismos públicos y privados en Chile.
¿Cuáles son los principios rectores de la Ley 19.628?
Licitud, finalidad, calidad y seguridad.
¿Cuáles son los derechos de los titulares según la Ley 19.628?
Acceso, rectificación, cancelación y oposición.
¿Cuál es el objetivo de la Agencia de Protección de Datos creada por la Ley 21.719?
Objetivo: proteger la vida privada y los datos, y supervisar y fiscalizar el cumplimiento de la ley.
¿Cuáles son los nuevos derechos del titular según la Ley 21.719?
Acceso, rectificación, supresión, oposición, portabilidad y bloqueo.
¿Cuáles son los principios del Tratamiento de Datos según la Ley 21.719?
Licitud y lealtad, finalidad, proporcionalidad, calidad, responsabilidad, seguridad, transparencia e información y confidencialidad.
¿Cuáles son las multas máximas según el nivel de infracción?
Hasta 1.000 UTM para leves, hasta 10.000 UTM para graves y hasta 20.000 UTM para gravísimas.
¿Cuándo se produce el sesgo de selección?
Se produce cuando los datos recolectados NO representan adecuadamente a toda la población objetiva.
¿Cuándo ocurre el sesgo de confirmación?
Ocurre cuando el analista busca evidencia que confirma sus creencias o hipótesis previas, ignorando datos que la contradicen.
¿Cuándo surge el sesgo de Medición?
Surge por inconsistencias o errores en cómo se recolectan los datos.
¿Cuándo se presenta el sesgo de exclusión?
Se presenta cuando ciertos grupos, variables o registros son omitidos sin justificación metodológica.
¿Cuándo sucede el sesgo algorítmico?
Sucede cuando un algoritmo réplica o amplifica desigualdades existentes en los datos de entrenamiento.
¿Cuáles son tres preguntas sobre la responsabilidad del científico de datos?
¿Qué tan representativos son los datos?, ¿A quién puede beneficiar o perjudicar este modelo? y ¿Se informó a las personas afectadas?
¿Qué implica la responsabilidad ética del científico de datos?
Cuestionar el contexto, comunicar riesgos y participar en decisiones con conciencia social.
¿Qué dos herramientas se pueden usar para identificar y corregir sesgos en la recolección?
Diseño de muestreo inclusivo y revisar preguntas o variables que puedan contener errores.
¿Qué dos herramientas se pueden usar para identificar y corregir sesgos en el modelamiento?
Ponderar o balancear clases y aplicar fairness.
¿Qué dos herramientas se pueden usar para identificar y corregir sesgos en la evaluación?
Métricas como disparate impact equality of opportunity y evaluación por subgrupos sensibles.
¿Qué implica el consentimiento informado?
Las personas deben saber qué datos se recolectan y para qué.
¿Qué implica el balance entre utilidad y privacidad?
Toda recolección de datos implica una decisión: ¿vale la pena el riesgo?
¿Qué debe acompañar a la capacidad técnica en la ciencia de datos según la reflexión final?
En ciencia de datos, la capacidad técnica debe ir acompañada de criterios éticos sólidos.
¿Qué significa Privacy by Design?
En lugar de agregar medidas de privacidad después, se incorporan desde el primer momento, durante el diseño, planificación y desarrollo.
¿Cuál es la mejor práctica número 1 para comunicar datos?
Comienza con el “por qué”: plantea el problema antes de mostrar números
¿Cuál es la mejor práctica número 3 para comunicar datos?
Usa menos texto, más visuales: los datos deben verse, no recitarse.
¿Cuál es la mejor práctica número 7 para comunicar datos?
Sé breve, pero no superficial: profundiza sin abrumar.
¿Cuál es la mejor práctica número 4 para comunicar datos?
Testear la presentación con alguien ajeno al tema: si la entiende, vas por buen camino
¿Cuál es la mejor práctica número 6 para comunicar datos?
No mientas por omisión: los datos deben estar acompañados de su incertidumbre y limitaciones
¿Cómo se deben comunicar los datos?
Ser breve pero no superficial; profundizar sin abrumar
¿Qué garantiza el k-anonimato?
Garantiza que un individuo no puede ser distinguido de al menos k-1 otros.
¿Qué hace la differential privacy?
Introduce ruido estadístico para ocultar contribuciones individuales.
¿Qué prácticas clave se usan en la seguridad de los datos?
Control de acceso, cifrado y auditorías.
¿Qué debe acompañar a la capacidad técnica en la ciencia de datos según la reflexión final?
La capacidad técnica debe ir acompañada de criterios éticos sólidos.
¿Qué aprendimos sobre Comunicación en Data Science en la recapitulación?
Aprendimos la importancia de adaptar el lenguaje, el nivel técnico y el enfoque según el público objetivo.
¿Qué vimos sobre la Visualización de datos en la recapitulación?
Vimos que la visualización es más que estética: debe ser funcional, clara y contextual.
¿Qué incorporamos sobre Storytelling con datos en la recapitulación?
Incorporamos el concepto de narrar con propósito. La historia no es solo el “envoltorio” del dato, sino el canal para conectar con la audiencia.
¿Qué empresas protagonizaron el enfrentamiento?
IBM y Apple a mediados de los 80s
¿Cuáles son los elementos de una historia?
Contexto, problema/desafío, exploración y resolución
¿Qué implica mostrar datos?
Presentar números crudos y sin contexto claro
¿Cuáles son las características del buen uso del color?
Propósito funcional, consistencia, accesibilidad y simplicidad