Resumen de Data Science

0.0(0)
studied byStudied by 0 people
learnLearn
examPractice Test
spaced repetitionSpaced Repetition
heart puzzleMatch
flashcardsFlashcards
Card Sorting

1/101

flashcard set

Earn XP

Description and Tags

Flashcards de preguntas y respuestas para el certamen 3 de Data Science.

Study Analytics
Name
Mastery
Learn
Test
Matching
Spaced

No study sessions yet.

102 Terms

1
New cards

¿Qué es la gestión de proyectos?

Proceso de planificación, organización y control de recursos para alcanzar un objetivo dentro de un plazo definido.

2
New cards

¿Cuáles son los propósitos de la gestión de proyectos?

Asegurar cumplimiento de plazos, presupuesto y calidad; optimizar recursos; controlar riesgos; mejorar la toma de decisiones.

3
New cards

¿Cómo son las fases en proyectos tradicionales?

Fases secuenciales (inicio → planificación → ejecución → cierre).

4
New cards

¿Cómo es el ciclo en proyectos de Data Science?

Ciclo iterativo (recolección de datos → análisis → validación → implementación).

5
New cards

¿Cuál es el enfoque de la metodología Waterfall?

Enfoque secuencial y lineal.

6
New cards

¿Cuál es la primera fase de Waterfall?

Definir alcance y objetivos.

7
New cards

¿Cuáles son las ventajas de Waterfall?

Claridad, estructura, buena documentación.

8
New cards

¿Cuáles son las desventajas de Waterfall?

Rigidez ante cambios, errores tempranos impactan gravemente.

9
New cards

¿Cuál es el enfoque de la metodología Agile?

Enfoque iterativo con entregas parciales frecuentes (sprints).

10
New cards

¿Cuáles son los principios de Agile?

Adaptabilidad, entregas constantes de valor, colaboración continua.

11
New cards

¿Cuáles son las ventajas de Agile?

Flexibilidad, entregas rápidas, mejora continua.

12
New cards

¿Cuáles son las desventajas de Agile?

Riesgo de desvíos, dependencia del feedback, necesidad de mucha comunicación.

13
New cards

¿Qué es Scrum?

Framework ágil basado en sprints (1 a 4 semanas).

14
New cards

¿Cuál es el rol del Product Owner en Scrum?

Prioriza tareas.

15
New cards

¿Cuál es el rol del Scrum Master?

Elimina obstáculos.

16
New cards

¿Cuál es el rol del Equipo Scrum?

Ejecuta tareas y entrega producto funcional.

17
New cards

¿Qué es el Product Backlog?

Lista priorizada de tareas.

18
New cards

¿Qué es el Sprint Backlog?

Tareas del sprint actual.

19
New cards

¿Qué es el Increment en Scrum?

Entregable funcional.

20
New cards

¿Cuál es el enfoque de Lean?

Enfoque en maximizar valor y minimizar desperdicios.

21
New cards

¿Cuáles son los principios de Lean?

Identificación de valor, eliminación de desperdicios, mejora continua (Kaizen).

22
New cards

¿Cuáles son algunas herramientas de Lean?

Value Stream Mapping, 5S.

23
New cards

¿Qué es Kanban?

Metodología visual con tableros (To Do, In Progress, Done).

24
New cards

¿Cuáles son los elementos de Kanban?

Tarjetas Kanban, límites WIP (Work in Progress).

25
New cards

¿Cuáles son las ventajas de Kanban?

Identificación de cuellos de botella, flujo de trabajo claro.

26
New cards

¿Cuál es la importancia de la planificación en Data Science?

Define objetivos claros, optimiza tiempo y recursos, controla riesgos y progreso.

27
New cards

¿Qué es un Diagrama de Gantt?

Cronograma visual con dependencias.

28
New cards

¿Cómo se usa Kanban en la planificación?

Gestión diaria y detección de bloqueos.

29
New cards

¿Para qué se usa Asana?

Proyectos complejos, cronogramas, dashboards.

30
New cards

¿Qué ofrece Trello?

Flujo visual, integración con Slack, GDrive.

31
New cards

¿Qué ofrece Monday?

Automatización, gestión de recursos.

32
New cards

¿Qué son los KPIs?

Indicadores para medir desempeño de proyectos.

33
New cards

¿Cuáles son ejemplos de KPIs técnicos?

Precisión, F1 Score, RMSE, MAE.

34
New cards

¿Cuáles son ejemplos de KPIs de tiempo?

Cumplimiento de plazos, duración de ejecución.

35
New cards

¿Cuáles son ejemplos de KPIs de calidad de datos?

Completitud, consistencia, precisión.

36
New cards

¿Cuáles son ejemplos de KPIs financieros?

ROI, costos vs. beneficios.

37
New cards

¿Qué significa SMART en KPIs?

Específicos, Medibles, Alcanzables, Relevantes, Temporales.

38
New cards

¿Cómo equilibrar plazo y calidad?

Dividir en fases, revisiones periódicas, ajustes ágiles.

39
New cards

¿Cuáles son riesgos comunes en proyectos?

Falta de datos, problemas técnicos, cambios de requisitos.

40
New cards

¿Qué incluyen los planes de contingencia?

Recursos extra, canales de comunicación claros, estrategias preventivas.

41
New cards

¿Por qué es importante hablar de ética en Data Science?

Uso acelerado de datos y decisiones automatizadas que afectan vidas reales.

42
New cards

¿Qué es la ética en el contexto de Data Science?

Principios que guían el uso responsable de datos.

43
New cards

¿Cuáles son las preguntas clave al considerar la ética en datos?

¿Puedo hacerlo? (capacidad técnica y legal) y ¿Debo hacerlo? (responsabilidad moral).

44
New cards

¿Cuáles son los principios fundamentales de la ética en datos?

Beneficencia, no maleficencia, justicia, autonomía, responsabilidad.

45
New cards

¿Cómo abordar un algoritmo de contratación que discrimina por género?

Balancear los datos, implementar métricas de equidad, establecer supervisión humana.

46
New cards

¿Cuáles son los dos primeros principios fundamentales de ética en datos?

Beneficencia – Hacer el bien, maximizar beneficios; No maleficencia – Evitar causar daño

47
New cards

¿Cuáles son el tercer y cuarto principio fundamentales de ética en datos?

Justicia – Distribución equitativa de beneficios y cargas; Autonomía – Respetar capacidad de decisión de las personas

48
New cards

¿Qué técnicas se pueden usar para la protección de la privacidad?

anonimización, minimización de datos, cifrado y controles de acceso

49
New cards

¿Cuáles son los efectos del sesgo algorítmico?

Decisiones injustas y perpetuación de desigualdades.

50
New cards

¿Cuáles son las fuentes comunes del sesgo?

Datos históricos, diseño del modelo y uso de variables proxy.

51
New cards

¿Qué falló en el caso del algoritmo de contratación que discriminaba por género?

Tener datos de entrenamiento sesgados, falta de supervisión humana y ausencia de pruebas de equidad.

52
New cards

¿Qué es Fairness en Data Science?

Que un modelo o sistema automatizado no discrimine ni favorezca injustamente por raza, género, edad, etc.

53
New cards

¿Cómo se aborda el problema de fairness en Data Science?

Analizando sesgos en los datos, evaluando métricas de equidad, ajustando modelos e incorporando diversidad.

54
New cards

¿Qué es COMPAS?

Sistema para predecir reincidencia criminal en acusados del sistema judicial estadounidense.

55
New cards

¿Qué ocurrió en el caso de Cambridge Analytica?

Recolección no autorizada de datos de Facebook mediante una aplicación de test de personalidad.

56
New cards

¿Cuál fue el problema con el algoritmo de contratación de Amazon?

El modelo penalizaba sistemáticamente los CV de mujeres para roles técnicos.

57
New cards

¿Cómo se puede incorporar la diversidad y la ética desde el diseño?

Analizar sesgos en los datos y evaluar métricas de equidad

58
New cards

¿Qué diferencia clave hay entre ética y cumplimiento legal?

Cumplir la ley es necesario, pero la responsabilidad ética va más allá de los requisitos mínimos legales.

59
New cards

¿Por qué es crucial detectar a tiempo los problemas éticos?

Detectar problemas éticos de forma temprana permite corregir el rumbo antes de que ocurran consecuencias graves.

60
New cards

¿Qué regula la legislación de protección de datos?

Regula la recolección, procesamiento y almacenamiento de datos personales.

61
New cards

¿Cuáles son los principios clave del GDPR?

Consentimiento informado y explícito, derecho al olvido, portabilidad de datos, privacidad por diseño.

62
New cards

¿Cuáles son tres implicancias prácticas del GDPR?

Tiempo para reportar brechas de seguridad (72h), multa máxima del volumen de negocio global (4%) y Consentimiento explícito.

63
New cards

¿Qué regula la Ley N° 19.628 en Chile?

Rige el tratamiento de datos personales por organismos públicos y privados en Chile.

64
New cards

¿Cuáles son los principios rectores de la Ley 19.628?

Licitud, finalidad, calidad y seguridad.

65
New cards

¿Cuáles son los derechos de los titulares según la Ley 19.628?

Acceso, rectificación, cancelación y oposición.

66
New cards

¿Cuál es el objetivo de la Agencia de Protección de Datos creada por la Ley 21.719?

Objetivo: proteger la vida privada y los datos, y supervisar y fiscalizar el cumplimiento de la ley.

67
New cards

¿Cuáles son los nuevos derechos del titular según la Ley 21.719?

Acceso, rectificación, supresión, oposición, portabilidad y bloqueo.

68
New cards

¿Cuáles son los principios del Tratamiento de Datos según la Ley 21.719?

Licitud y lealtad, finalidad, proporcionalidad, calidad, responsabilidad, seguridad, transparencia e información y confidencialidad.

69
New cards

¿Cuáles son las multas máximas según el nivel de infracción?

Hasta 1.000 UTM para leves, hasta 10.000 UTM para graves y hasta 20.000 UTM para gravísimas.

70
New cards

¿Cuándo se produce el sesgo de selección?

Se produce cuando los datos recolectados NO representan adecuadamente a toda la población objetiva.

71
New cards

¿Cuándo ocurre el sesgo de confirmación?

Ocurre cuando el analista busca evidencia que confirma sus creencias o hipótesis previas, ignorando datos que la contradicen.

72
New cards

¿Cuándo surge el sesgo de Medición?

Surge por inconsistencias o errores en cómo se recolectan los datos.

73
New cards

¿Cuándo se presenta el sesgo de exclusión?

Se presenta cuando ciertos grupos, variables o registros son omitidos sin justificación metodológica.

74
New cards

¿Cuándo sucede el sesgo algorítmico?

Sucede cuando un algoritmo réplica o amplifica desigualdades existentes en los datos de entrenamiento.

75
New cards

¿Cuáles son tres preguntas sobre la responsabilidad del científico de datos?

¿Qué tan representativos son los datos?, ¿A quién puede beneficiar o perjudicar este modelo? y ¿Se informó a las personas afectadas?

76
New cards

¿Qué implica la responsabilidad ética del científico de datos?

Cuestionar el contexto, comunicar riesgos y participar en decisiones con conciencia social.

77
New cards

¿Qué dos herramientas se pueden usar para identificar y corregir sesgos en la recolección?

Diseño de muestreo inclusivo y revisar preguntas o variables que puedan contener errores.

78
New cards

¿Qué dos herramientas se pueden usar para identificar y corregir sesgos en el modelamiento?

Ponderar o balancear clases y aplicar fairness.

79
New cards

¿Qué dos herramientas se pueden usar para identificar y corregir sesgos en la evaluación?

Métricas como disparate impact equality of opportunity y evaluación por subgrupos sensibles.

80
New cards

¿Qué implica el consentimiento informado?

Las personas deben saber qué datos se recolectan y para qué.

81
New cards

¿Qué implica el balance entre utilidad y privacidad?

Toda recolección de datos implica una decisión: ¿vale la pena el riesgo?

82
New cards

¿Qué debe acompañar a la capacidad técnica en la ciencia de datos según la reflexión final?

En ciencia de datos, la capacidad técnica debe ir acompañada de criterios éticos sólidos.

83
New cards

¿Qué significa Privacy by Design?

En lugar de agregar medidas de privacidad después, se incorporan desde el primer momento, durante el diseño, planificación y desarrollo.

84
New cards

¿Cuál es la mejor práctica número 1 para comunicar datos?

Comienza con el “por qué”: plantea el problema antes de mostrar números

85
New cards

¿Cuál es la mejor práctica número 3 para comunicar datos?

Usa menos texto, más visuales: los datos deben verse, no recitarse.

86
New cards

¿Cuál es la mejor práctica número 7 para comunicar datos?

Sé breve, pero no superficial: profundiza sin abrumar.

87
New cards

¿Cuál es la mejor práctica número 4 para comunicar datos?

Testear la presentación con alguien ajeno al tema: si la entiende, vas por buen camino

88
New cards

¿Cuál es la mejor práctica número 6 para comunicar datos?

No mientas por omisión: los datos deben estar acompañados de su incertidumbre y limitaciones

89
New cards

¿Cómo se deben comunicar los datos?

Ser breve pero no superficial; profundizar sin abrumar

90
New cards

¿Qué garantiza el k-anonimato?

Garantiza que un individuo no puede ser distinguido de al menos k-1 otros.

91
New cards

¿Qué hace la differential privacy?

Introduce ruido estadístico para ocultar contribuciones individuales.

92
New cards

¿Qué prácticas clave se usan en la seguridad de los datos?

Control de acceso, cifrado y auditorías.

93
New cards

¿Qué debe acompañar a la capacidad técnica en la ciencia de datos según la reflexión final?

La capacidad técnica debe ir acompañada de criterios éticos sólidos.

94
New cards

¿Qué aprendimos sobre Comunicación en Data Science en la recapitulación?

Aprendimos la importancia de adaptar el lenguaje, el nivel técnico y el enfoque según el público objetivo.

95
New cards

¿Qué vimos sobre la Visualización de datos en la recapitulación?

Vimos que la visualización es más que estética: debe ser funcional, clara y contextual.

96
New cards

¿Qué incorporamos sobre Storytelling con datos en la recapitulación?

Incorporamos el concepto de narrar con propósito. La historia no es solo el “envoltorio” del dato, sino el canal para conectar con la audiencia.

97
New cards

¿Qué empresas protagonizaron el enfrentamiento?

IBM y Apple a mediados de los 80s

98
New cards

¿Cuáles son los elementos de una historia?

Contexto, problema/desafío, exploración y resolución

99
New cards

¿Qué implica mostrar datos?

Presentar números crudos y sin contexto claro

100
New cards

¿Cuáles son las características del buen uso del color?

Propósito funcional, consistencia, accesibilidad y simplicidad