🎓 Вступ до Статистики

0.0(0)
studied byStudied by 0 people
0.0(0)
full-widthCall Kai
learnLearn
examPractice Test
spaced repetitionSpaced Repetition
heart puzzleMatch
flashcardsFlashcards
GameKnowt Play
Card Sorting

1/122

flashcard set

Earn XP

Description and Tags

Study Analytics
Name
Mastery
Learn
Test
Matching
Spaced

No study sessions yet.

123 Terms

1
New cards

Як називається розділ статистики, що займається організацією та узагальненням даних?

Описова статистика (descriptive statistics).

2
New cards

"Як називаються формальні методи для висновків на основі ""хороших"" даних, що використовують теорію ймовірностей?"

Індуктивна статистика (inferential statistics).

3
New cards

Дані, що є результатом категоризації або опису атрибутів, називаються _____ даними.

якісними (qualitative) або категоріальними

4
New cards

Дані, що є результатом підрахунку або вимірювання, називаються _____ даними.

кількісними (quantitative)

5
New cards

Кількісні дані, які можуть приймати лише певні числові значення (результат підрахунку), називаються _____.

кількісними дискретними даними (quantitative discrete data)

6
New cards

Кількісні дані, які можуть включати дроби, десяткові дроби або ірраціональні числа (результат вимірювань), називаються _____.

кількісними неперервними даними (quantitative continuous data)

7
New cards

Що таке сукупність (population) у статистичному дослідженні?

Це повний набір усіх осіб, об'єктів або подій, що є предметом дослідження.

8
New cards

Що таке вибірка (sample) у статистиці?

Це підмножина сукупності, яка відбирається для дослідження.

9
New cards

Числова характеристика всієї сукупності називається _____.

параметром (parameter)

10
New cards

Числова характеристика, обчислена на основі даних вибірки, називається _____.

статистикою (statistic)

11
New cards

Що таке змінна (variable) у статистиці?

Це характеристика або вимір, що може бути визначений для кожного члена сукупності.

12
New cards

У якому методі вибірки кожен член сукупності спочатку має однакові шанси бути відібраним?

У методі випадкової вибірки (random sampling).

13
New cards

Як називається метод вибірки, при якому будь-яка група з $n$ індивідів має однакові шанси бути обраною?

Проста випадкова вибірка (simple random sample).

14
New cards

Опишіть метод стратифікованої вибірки (stratified sample).

Сукупність ділиться на групи (страти), і з кожної страти береться пропорційна кількість членів.

15
New cards

Опишіть метод кластерної вибірки (cluster sample).

Сукупність ділиться на групи (кластери), випадковим чином обираються цілі кластери, і всі члени обраних кластерів включаються у вибірку.

16
New cards

Опишіть метод систематичної вибірки (systematic sample).

Вибирається випадкова початкова точка, а потім відбирається кожен $k$-й член сукупності.

17
New cards

Який метод вибірки використовується, коли вибираються легкодоступні індивіди, що може призвести до упереджених даних?

Зручна вибірка (convenience sampling).

18
New cards

Дані, які не можна впорядкувати та використовувати в обчисленнях, відповідають _____ рівню вимірювання.

номінальному (nominal scale)

19
New cards

Дані, які можна впорядкувати, але різницю між якими неможливо виміряти, відповідають _____ рівню вимірювання.

порядковому (ordinal scale)

20
New cards

Дані з певним порядком, де різницю можна виміряти, але немає справжньої нульової точки, відповідають _____ рівню вимірювання.

інтервальному (interval scale)

21
New cards

Дані з початковою точкою, які можна впорядкувати, а різниці та відношення мають сенс, відповідають _____ рівню вимірювання.

відносному (ratio scale)

22
New cards

Додаткові змінні, які можуть заплутати дослідження, називаються _____.

прихованими змінними (lurking variables)

23
New cards

Як називається змінна, яка спричиняє зміну в іншій змінній?

Пояснювальна змінна (explanatory variable).

24
New cards

Як називається змінна, на яку впливає пояснювальна змінна?

Змінна-відгук (response variable).

25
New cards

Що таке сліпий метод (blinding) в експерименті?

Це коли учасник не знає, чи отримує він активне лікування чи плацебо.

26
New cards

Кількість разів, коли зустрічається певне значення даних, називається _____.

частотою (frequency)

27
New cards

Графік, на якому категорії даних представлені клинами в колі, пропорційними до їх відсотків, називається _____.

круговою діаграмою (pie chart)

28
New cards

Графік, що складається з суміжних прямокутників, де горизонтальна вісь представляє дані, а вертикальна — частоту, називається _____.

гістограмою (histogram)

29
New cards

Який тип графіка використовує стовпці, відсортовані за розміром категорії від найбільшого до найменшого?

Діаграма Парето (Pareto chart).

30
New cards

Значення, яке є медіаною нижньої половини впорядкованого набору даних, називається _____.

першим квартилем (First Quartile)

31
New cards

Що таке міжквартильний розмах (IQR)?

Це різниця між третім квартилем ($Q_3$) і першим квартилем ($Q_1$).

32
New cards

Значення, яке може бути значно віддалене від решти даних у наборі, називається _____.

викидом (outlier)

33
New cards

Графік, який дає швидке уявлення про середні 50% даних, використовуючи мінімум, перший квартиль, медіану, третій квартиль і максимум, називається _____.

"коробковим графіком (box plot) або діаграмою ""ящик з вусами"""

34
New cards

Що таке Z-оцінка (z-score)?

Це міра того, на скільки стандартних відхилень певне значення даних віддалене від середнього.

35
New cards

Яка формула для Z-оцінки для вибіркових даних?

$z = \frac{x - \bar{x}}{s}$

36
New cards

Яка формула для Z-оцінки для даних сукупності?

$z = \frac{x - \mu}{\sigma}$

37
New cards

Математичний інструмент, що використовується для вивчення випадковості, називається _____.

ймовірністю (probability)

38
New cards

Що таке простір елементарних подій (sample space) в експерименті?

Це множина всіх можливих наслідків експерименту.

39
New cards

Якщо події A і B не можуть відбутися одночасно, тобто $P(A \text{ AND } B) = 0$, то вони називаються _____.

взаємовиключними (mutually exclusive)

40
New cards

Якщо настання події A не впливає на ймовірність настання події B, то ці події називаються _____.

незалежними (independent)

41
New cards

Яке правило додавання ймовірностей для двох будь-яких подій A і B?

$P(A \text{ OR } B) = P(A) + P(B) - P(A \text{ AND } B)$

42
New cards

Яке правило множення ймовірностей для двох будь-яких подій A і B?

$P(A \text{ AND } B) = P(A|B)P(B)$

43
New cards

Якщо події A і B є незалежними, як спрощується правило множення $P(A \text{ AND } B)$?

$P(A \text{ AND } B) = P(A)P(B)$

44
New cards

Що таке умовна ймовірність $P(A|B)$?

Це ймовірність настання події A за умови, що подія B вже відбулася.

45
New cards

Яка формула для умовної ймовірності $P(A|B)$?

$P(A|B) = \frac{P(A \text{ AND } B)}{P(B)}$

46
New cards

Що таке доповнення події A (позначається як A')?

Це подія, що складається з усіх наслідків, які не належать до A.

47
New cards

Згідно із Законом великих чисел, що відбувається з відносною частотою події при збільшенні кількості випробувань?

Вона наближається до теоретичної ймовірності цієї події.

48
New cards

Як називається змінна, значення якої є числовим результатом випадкового явища?

Випадкова величина (random variable).

49
New cards

"Середнє значення або ""довгострокове середнє"" дискретної функції розподілу ймовірностей називається _____."

математичним сподіванням (expected value) $\mu$

50
New cards

Яка формула для математичного сподівання $\mu$ дискретної випадкової величини X?

$\mu = \sum [x \cdot P(x)]$

51
New cards

Назвіть три умови біноміального експерименту.

1. Фіксована кількість випробувань ($n$). 2. Лише два можливі наслідки (успіх/невдача). 3. Незалежні випробування з однаковою ймовірністю успіху ($p$).

52
New cards

Яка формула для середнього значення ($μ$) біноміального розподілу?

$\mu = np$

53
New cards

Яка формула для стандартного відхилення ($σ$) біноміального розподілу?

$\sigma = \sqrt{npq}$

54
New cards

Який розподіл використовується для моделювання кількості випробувань до першого успіху в серії незалежних випробувань Бернуллі?

Геометричний розподіл (Geometric Distribution).

55
New cards

Який розподіл описує ймовірність заданої кількості подій, що відбуваються у фіксованому інтервалі часу або простору, якщо ці події відбуваються з відомою середньою швидкістю?

Розподіл Пуассона (Poisson Distribution).

56
New cards

Яка головна характеристика неперервної функції густини ймовірності (pdf)?

Загальна площа під кривою дорівнює одиниці.

57
New cards

У рівномірному розподілі $U(a, b)$, чому дорівнює функція густини ймовірності $f(x)$?

$f(x) = \frac{1}{b-a}$ для $a \le x \le b$

58
New cards

Яка формула для середнього значення ($μ$) рівномірного розподілу $U(a, b)$?

$\mu = \frac{a+b}{2}$

59
New cards

Яка формула для стандартного відхилення ($σ$) рівномірного розподілу $U(a, b)$?

$\sigma = \sqrt{\frac{(b-a)^2}{12}}$

60
New cards

Який розподіл часто використовується для моделювання часу між подіями у процесі Пуассона?

Експоненціальний розподіл (Exponential Distribution).

61
New cards

"Що означає властивість ""відсутності пам'яті"" (memoryless property) експоненціального розподілу?"

Минулий час не впливає на майбутні ймовірності; ймовірність того, що подія відбудеться в наступному інтервалі, не залежить від того, скільки часу вже минуло.

62
New cards

Який розподіл характеризується дзвоноподібною, симетричною кривою?

Нормальний розподіл (Normal Distribution).

63
New cards

Що таке стандартний нормальний розподіл?

Це нормальний розподіл із середнім значенням $\mu = 0$ і стандартним відхиленням $\sigma = 1$.

64
New cards

Сформулюйте Центральну граничну теорему для вибіркових середніх.

Якщо вибирати великі ($n \ge 30$) випадкові вибірки з сукупності з будь-яким розподілом, розподіл вибіркових середніх буде приблизно нормальним.

65
New cards

Згідно з Центральною граничною теоремою, чому дорівнює середнє значення розподілу вибіркових середніх $(\mu_{\bar{x}})$?

Воно дорівнює середньому значенню сукупності ($\mu$).

66
New cards

Згідно з Центральною граничною теоремою, чому дорівнює стандартне відхилення розподілу вибіркових середніх $(\sigma_{\bar{x}})$, також відоме як стандартна похибка середнього?

$\sigma_{\bar{x}} = \frac{\sigma}{\sqrt{n}}$

67
New cards

Єдине число, обчислене з вибірки і використане для оцінки параметра сукупності, називається _____.

точковою оцінкою (point estimate)

68
New cards

Інтервал значень, побудований на основі вибіркових даних так, що параметр сукупності, ймовірно, знаходиться в цьому інтервалі з певним рівнем довіри, називається _____.

довірчим інтервалом (confidence interval)

69
New cards

Що таке похибка (margin of error або error bound for a population mean, EBM)?

Це величина, яка додається та віднімається від точкової оцінки для побудови довірчого інтервалу.

70
New cards

Який розподіл використовується для побудови довірчих інтервалів для середнього значення сукупності, коли стандартне відхилення сукупності ($\sigma$) невідоме, а вибірка невелика?

t-розподіл Стьюдента (Student's t-distribution).

71
New cards

Як визначається кількість ступенів свободи ($df$) для t-розподілу при тестуванні одного середнього?

$df = n - 1$, де $n$ — розмір вибірки.

72
New cards

Припущення або твердження про параметр сукупності, яке перевіряється, називається _____.

нульовою гіпотезою ($H_0$)

73
New cards

Припущення, яке суперечить нульовій гіпотезі і приймається, якщо $H_0$ відхиляється, називається _____.

альтернативною гіпотезою ($H_a$)

74
New cards

Помилка, що полягає у відхиленні нульової гіпотези, коли вона насправді є істинною, називається _____.

помилкою першого роду (Type I error)

75
New cards

Помилка, що полягає у невідхиленні нульової гіпотези, коли вона насправді є хибною, називається _____.

помилкою другого роду (Type II error)

76
New cards

Ймовірність помилки першого роду позначається грецькою літерою _____ і також називається рівнем значущості.

$\alpha$ (альфа)

77
New cards

Що таке p-значення (p-value) в тестуванні гіпотез?

Це ймовірність отримати результат, настільки ж або більш екстремальний, ніж спостережуваний, за умови, що нульова гіпотеза є істинною.

78
New cards

Яке правило прийняття рішень використовується при порівнянні p-значення та рівня значущості $\alpha$?

Якщо $p$-значення $\le \alpha$, відхилити $H_0$. Якщо $p$-значення $> \alpha$, не відхиляти $H_0$.

79
New cards

Графічне представлення зв'язку між двома кількісними змінними називається _____.

діаграмою розсіювання (scatter plot)

80
New cards

Числова міра, що вказує на силу та напрямок лінійного зв'язку між двома змінними, називається _____.

коефіцієнтом кореляції (correlation coefficient), $r$

81
New cards

В яких межах завжди знаходиться значення коефіцієнта кореляції $r$?

Від -1 до +1 включно ($-1 \le r \le 1$).

82
New cards

Що означає значення $r$ близьке до 0?

Це вказує на відсутність або дуже слабкий лінійний зв'язок між змінними.

83
New cards

Рівняння, яке описує лінійний зв'язок між незалежною змінною $x$ та залежною змінною $y$, називається _____.

рівнянням регресії (regression equation)

84
New cards

Який вигляд має рівняння регресії найменших квадратів?

$\hat{y} = a + bx$

85
New cards

Що таке залишок (residual) у регресійному аналізі?

Це різниця між спостережуваним значенням $y$ та прогнозованим значенням $\hat{y}$ (тобто $y - \hat{y}$).

86
New cards

Який тест використовується для перевірки, чи відповідає спостережуваний розподіл даних очікуваному розподілу?

Тест узгодженості хі-квадрат (Chi-square goodness-of-fit test).

87
New cards

Який тест використовується для визначення, чи існує зв'язок між двома категоріальними змінними?

Тест незалежності хі-квадрат (Chi-square test of independence).

88
New cards

Який тест використовується для порівняння розподілів однієї категоріальної змінної у двох або більше різних сукупностях?

Тест однорідності хі-квадрат (Chi-square test of homogeneity).

89
New cards

Який статистичний метод використовується для порівняння середніх значень трьох або більше груп?

Однофакторний дисперсійний аналіз (One-way ANOVA).

90
New cards

Яка нульова гіпотеза в однофакторному ANOVA?

$H_0: \mu_1 = \mu_2 = \mu_3 = ... = \mu_k$ (середні значення всіх груп однакові).

91
New cards

Яка альтернативна гіпотеза в однофакторному ANOVA?

$H_a$: принаймні два середні значення груп не є однаковими.

92
New cards

Яка тестова статистика використовується в ANOVA?

F-статистика, яка є відношенням варіації між групами до варіації всередині груп.

93
New cards

Який тест використовується для порівняння дисперсій двох незалежних сукупностей?

Тест двох дисперсій (Test of Two Variances) з використанням F-розподілу.

94
New cards

Дослідник хоче перевірити, чи середній час реакції однаковий для чотирьох різних стимуляторів. Який статистичний тест є найбільш доречним для аналізу даних, де порівнюються середні значення чотирьох незалежних груп?

Однофакторний дисперсійний аналіз (ANOVA)

95
New cards

У контексті перевірки гіпотез, що означає помилка другого роду ($\beta$)?

Неспроможність відхилити нульову гіпотезу, коли вона насправді є хибною.

96
New cards

Час між послідовними прибуттями клієнтів у сервісний центр описується експоненціальним розподілом. Якщо відомо, що минуло 10 хвилин з моменту прибуття останнього клієнта, яка ймовірність того, що наступний клієнт прибуде протягом наступних 5 хвилин, порівняно з початковою ймовірністю прибуття клієнта протягом 5 хвилин?

Вона така сама

97
New cards

При побудові 99% довірчого інтервалу для середнього значення популяції, коли стандартне відхилення популяції ($\sigma$) невідоме, а розмір вибірки $n=15$, який розподіл слід використовувати для знаходження критичного значення?

t-розподіл Стьюдента з 14 ступенями свободи

98
New cards

У аналізі лінійної регресії точка даних має великий негативний залишок. Що це означає?

Лінія регресії значно переоцінює фактичне значення $y$ для цієї точки.

99
New cards

Яке твердження найкраще описує центральну граничну теорему?

Незалежно від розподілу популяції, розподіл вибіркових середніх буде наближатися до нормального, коли розмір вибірки стає достатньо великим.

100
New cards

У дослідженні порівнюють два методи навчання. Дослідники використовують тест хі-квадрат для гомогенності (однорідності), щоб проаналізувати результати, де результат є категоріальною змінною (напр., 'засвоїв', 'частково засвоїв', 'не засвоїв'). Яка нульова гіпотеза для цього тесту?

$H_0$: Розподіл результатів навчання є однаковим для обох методів.