1/122
Name | Mastery | Learn | Test | Matching | Spaced |
|---|
No study sessions yet.
Як називається розділ статистики, що займається організацією та узагальненням даних?
Описова статистика (descriptive statistics).
"Як називаються формальні методи для висновків на основі ""хороших"" даних, що використовують теорію ймовірностей?"
Індуктивна статистика (inferential statistics).
Дані, що є результатом категоризації або опису атрибутів, називаються _____ даними.
якісними (qualitative) або категоріальними
Дані, що є результатом підрахунку або вимірювання, називаються _____ даними.
кількісними (quantitative)
Кількісні дані, які можуть приймати лише певні числові значення (результат підрахунку), називаються _____.
кількісними дискретними даними (quantitative discrete data)
Кількісні дані, які можуть включати дроби, десяткові дроби або ірраціональні числа (результат вимірювань), називаються _____.
кількісними неперервними даними (quantitative continuous data)
Що таке сукупність (population) у статистичному дослідженні?
Це повний набір усіх осіб, об'єктів або подій, що є предметом дослідження.
Що таке вибірка (sample) у статистиці?
Це підмножина сукупності, яка відбирається для дослідження.
Числова характеристика всієї сукупності називається _____.
параметром (parameter)
Числова характеристика, обчислена на основі даних вибірки, називається _____.
статистикою (statistic)
Що таке змінна (variable) у статистиці?
Це характеристика або вимір, що може бути визначений для кожного члена сукупності.
У якому методі вибірки кожен член сукупності спочатку має однакові шанси бути відібраним?
У методі випадкової вибірки (random sampling).
Як називається метод вибірки, при якому будь-яка група з $n$ індивідів має однакові шанси бути обраною?
Проста випадкова вибірка (simple random sample).
Опишіть метод стратифікованої вибірки (stratified sample).
Сукупність ділиться на групи (страти), і з кожної страти береться пропорційна кількість членів.
Опишіть метод кластерної вибірки (cluster sample).
Сукупність ділиться на групи (кластери), випадковим чином обираються цілі кластери, і всі члени обраних кластерів включаються у вибірку.
Опишіть метод систематичної вибірки (systematic sample).
Вибирається випадкова початкова точка, а потім відбирається кожен $k$-й член сукупності.
Який метод вибірки використовується, коли вибираються легкодоступні індивіди, що може призвести до упереджених даних?
Зручна вибірка (convenience sampling).
Дані, які не можна впорядкувати та використовувати в обчисленнях, відповідають _____ рівню вимірювання.
номінальному (nominal scale)
Дані, які можна впорядкувати, але різницю між якими неможливо виміряти, відповідають _____ рівню вимірювання.
порядковому (ordinal scale)
Дані з певним порядком, де різницю можна виміряти, але немає справжньої нульової точки, відповідають _____ рівню вимірювання.
інтервальному (interval scale)
Дані з початковою точкою, які можна впорядкувати, а різниці та відношення мають сенс, відповідають _____ рівню вимірювання.
відносному (ratio scale)
Додаткові змінні, які можуть заплутати дослідження, називаються _____.
прихованими змінними (lurking variables)
Як називається змінна, яка спричиняє зміну в іншій змінній?
Пояснювальна змінна (explanatory variable).
Як називається змінна, на яку впливає пояснювальна змінна?
Змінна-відгук (response variable).
Що таке сліпий метод (blinding) в експерименті?
Це коли учасник не знає, чи отримує він активне лікування чи плацебо.
Кількість разів, коли зустрічається певне значення даних, називається _____.
частотою (frequency)
Графік, на якому категорії даних представлені клинами в колі, пропорційними до їх відсотків, називається _____.
круговою діаграмою (pie chart)
Графік, що складається з суміжних прямокутників, де горизонтальна вісь представляє дані, а вертикальна — частоту, називається _____.
гістограмою (histogram)
Який тип графіка використовує стовпці, відсортовані за розміром категорії від найбільшого до найменшого?
Діаграма Парето (Pareto chart).
Значення, яке є медіаною нижньої половини впорядкованого набору даних, називається _____.
першим квартилем (First Quartile)
Що таке міжквартильний розмах (IQR)?
Це різниця між третім квартилем ($Q_3$) і першим квартилем ($Q_1$).
Значення, яке може бути значно віддалене від решти даних у наборі, називається _____.
викидом (outlier)
Графік, який дає швидке уявлення про середні 50% даних, використовуючи мінімум, перший квартиль, медіану, третій квартиль і максимум, називається _____.
"коробковим графіком (box plot) або діаграмою ""ящик з вусами"""
Що таке Z-оцінка (z-score)?
Це міра того, на скільки стандартних відхилень певне значення даних віддалене від середнього.
Яка формула для Z-оцінки для вибіркових даних?
$z = \frac{x - \bar{x}}{s}$
Яка формула для Z-оцінки для даних сукупності?
$z = \frac{x - \mu}{\sigma}$
Математичний інструмент, що використовується для вивчення випадковості, називається _____.
ймовірністю (probability)
Що таке простір елементарних подій (sample space) в експерименті?
Це множина всіх можливих наслідків експерименту.
Якщо події A і B не можуть відбутися одночасно, тобто $P(A \text{ AND } B) = 0$, то вони називаються _____.
взаємовиключними (mutually exclusive)
Якщо настання події A не впливає на ймовірність настання події B, то ці події називаються _____.
незалежними (independent)
Яке правило додавання ймовірностей для двох будь-яких подій A і B?
$P(A \text{ OR } B) = P(A) + P(B) - P(A \text{ AND } B)$
Яке правило множення ймовірностей для двох будь-яких подій A і B?
$P(A \text{ AND } B) = P(A|B)P(B)$
Якщо події A і B є незалежними, як спрощується правило множення $P(A \text{ AND } B)$?
$P(A \text{ AND } B) = P(A)P(B)$
Що таке умовна ймовірність $P(A|B)$?
Це ймовірність настання події A за умови, що подія B вже відбулася.
Яка формула для умовної ймовірності $P(A|B)$?
$P(A|B) = \frac{P(A \text{ AND } B)}{P(B)}$
Що таке доповнення події A (позначається як A')?
Це подія, що складається з усіх наслідків, які не належать до A.
Згідно із Законом великих чисел, що відбувається з відносною частотою події при збільшенні кількості випробувань?
Вона наближається до теоретичної ймовірності цієї події.
Як називається змінна, значення якої є числовим результатом випадкового явища?
Випадкова величина (random variable).
"Середнє значення або ""довгострокове середнє"" дискретної функції розподілу ймовірностей називається _____."
математичним сподіванням (expected value) $\mu$
Яка формула для математичного сподівання $\mu$ дискретної випадкової величини X?
$\mu = \sum [x \cdot P(x)]$
Назвіть три умови біноміального експерименту.
1. Фіксована кількість випробувань ($n$). 2. Лише два можливі наслідки (успіх/невдача). 3. Незалежні випробування з однаковою ймовірністю успіху ($p$).
Яка формула для середнього значення ($μ$) біноміального розподілу?
$\mu = np$
Яка формула для стандартного відхилення ($σ$) біноміального розподілу?
$\sigma = \sqrt{npq}$
Який розподіл використовується для моделювання кількості випробувань до першого успіху в серії незалежних випробувань Бернуллі?
Геометричний розподіл (Geometric Distribution).
Який розподіл описує ймовірність заданої кількості подій, що відбуваються у фіксованому інтервалі часу або простору, якщо ці події відбуваються з відомою середньою швидкістю?
Розподіл Пуассона (Poisson Distribution).
Яка головна характеристика неперервної функції густини ймовірності (pdf)?
Загальна площа під кривою дорівнює одиниці.
У рівномірному розподілі $U(a, b)$, чому дорівнює функція густини ймовірності $f(x)$?
$f(x) = \frac{1}{b-a}$ для $a \le x \le b$
Яка формула для середнього значення ($μ$) рівномірного розподілу $U(a, b)$?
$\mu = \frac{a+b}{2}$
Яка формула для стандартного відхилення ($σ$) рівномірного розподілу $U(a, b)$?
$\sigma = \sqrt{\frac{(b-a)^2}{12}}$
Який розподіл часто використовується для моделювання часу між подіями у процесі Пуассона?
Експоненціальний розподіл (Exponential Distribution).
"Що означає властивість ""відсутності пам'яті"" (memoryless property) експоненціального розподілу?"
Минулий час не впливає на майбутні ймовірності; ймовірність того, що подія відбудеться в наступному інтервалі, не залежить від того, скільки часу вже минуло.
Який розподіл характеризується дзвоноподібною, симетричною кривою?
Нормальний розподіл (Normal Distribution).
Що таке стандартний нормальний розподіл?
Це нормальний розподіл із середнім значенням $\mu = 0$ і стандартним відхиленням $\sigma = 1$.
Сформулюйте Центральну граничну теорему для вибіркових середніх.
Якщо вибирати великі ($n \ge 30$) випадкові вибірки з сукупності з будь-яким розподілом, розподіл вибіркових середніх буде приблизно нормальним.
Згідно з Центральною граничною теоремою, чому дорівнює середнє значення розподілу вибіркових середніх $(\mu_{\bar{x}})$?
Воно дорівнює середньому значенню сукупності ($\mu$).
Згідно з Центральною граничною теоремою, чому дорівнює стандартне відхилення розподілу вибіркових середніх $(\sigma_{\bar{x}})$, також відоме як стандартна похибка середнього?
$\sigma_{\bar{x}} = \frac{\sigma}{\sqrt{n}}$
Єдине число, обчислене з вибірки і використане для оцінки параметра сукупності, називається _____.
точковою оцінкою (point estimate)
Інтервал значень, побудований на основі вибіркових даних так, що параметр сукупності, ймовірно, знаходиться в цьому інтервалі з певним рівнем довіри, називається _____.
довірчим інтервалом (confidence interval)
Що таке похибка (margin of error або error bound for a population mean, EBM)?
Це величина, яка додається та віднімається від точкової оцінки для побудови довірчого інтервалу.
Який розподіл використовується для побудови довірчих інтервалів для середнього значення сукупності, коли стандартне відхилення сукупності ($\sigma$) невідоме, а вибірка невелика?
t-розподіл Стьюдента (Student's t-distribution).
Як визначається кількість ступенів свободи ($df$) для t-розподілу при тестуванні одного середнього?
$df = n - 1$, де $n$ — розмір вибірки.
Припущення або твердження про параметр сукупності, яке перевіряється, називається _____.
нульовою гіпотезою ($H_0$)
Припущення, яке суперечить нульовій гіпотезі і приймається, якщо $H_0$ відхиляється, називається _____.
альтернативною гіпотезою ($H_a$)
Помилка, що полягає у відхиленні нульової гіпотези, коли вона насправді є істинною, називається _____.
помилкою першого роду (Type I error)
Помилка, що полягає у невідхиленні нульової гіпотези, коли вона насправді є хибною, називається _____.
помилкою другого роду (Type II error)
Ймовірність помилки першого роду позначається грецькою літерою _____ і також називається рівнем значущості.
$\alpha$ (альфа)
Що таке p-значення (p-value) в тестуванні гіпотез?
Це ймовірність отримати результат, настільки ж або більш екстремальний, ніж спостережуваний, за умови, що нульова гіпотеза є істинною.
Яке правило прийняття рішень використовується при порівнянні p-значення та рівня значущості $\alpha$?
Якщо $p$-значення $\le \alpha$, відхилити $H_0$. Якщо $p$-значення $> \alpha$, не відхиляти $H_0$.
Графічне представлення зв'язку між двома кількісними змінними називається _____.
діаграмою розсіювання (scatter plot)
Числова міра, що вказує на силу та напрямок лінійного зв'язку між двома змінними, називається _____.
коефіцієнтом кореляції (correlation coefficient), $r$
В яких межах завжди знаходиться значення коефіцієнта кореляції $r$?
Від -1 до +1 включно ($-1 \le r \le 1$).
Що означає значення $r$ близьке до 0?
Це вказує на відсутність або дуже слабкий лінійний зв'язок між змінними.
Рівняння, яке описує лінійний зв'язок між незалежною змінною $x$ та залежною змінною $y$, називається _____.
рівнянням регресії (regression equation)
Який вигляд має рівняння регресії найменших квадратів?
$\hat{y} = a + bx$
Що таке залишок (residual) у регресійному аналізі?
Це різниця між спостережуваним значенням $y$ та прогнозованим значенням $\hat{y}$ (тобто $y - \hat{y}$).
Який тест використовується для перевірки, чи відповідає спостережуваний розподіл даних очікуваному розподілу?
Тест узгодженості хі-квадрат (Chi-square goodness-of-fit test).
Який тест використовується для визначення, чи існує зв'язок між двома категоріальними змінними?
Тест незалежності хі-квадрат (Chi-square test of independence).
Який тест використовується для порівняння розподілів однієї категоріальної змінної у двох або більше різних сукупностях?
Тест однорідності хі-квадрат (Chi-square test of homogeneity).
Який статистичний метод використовується для порівняння середніх значень трьох або більше груп?
Однофакторний дисперсійний аналіз (One-way ANOVA).
Яка нульова гіпотеза в однофакторному ANOVA?
$H_0: \mu_1 = \mu_2 = \mu_3 = ... = \mu_k$ (середні значення всіх груп однакові).
Яка альтернативна гіпотеза в однофакторному ANOVA?
$H_a$: принаймні два середні значення груп не є однаковими.
Яка тестова статистика використовується в ANOVA?
F-статистика, яка є відношенням варіації між групами до варіації всередині груп.
Який тест використовується для порівняння дисперсій двох незалежних сукупностей?
Тест двох дисперсій (Test of Two Variances) з використанням F-розподілу.
Дослідник хоче перевірити, чи середній час реакції однаковий для чотирьох різних стимуляторів. Який статистичний тест є найбільш доречним для аналізу даних, де порівнюються середні значення чотирьох незалежних груп?
Однофакторний дисперсійний аналіз (ANOVA)
У контексті перевірки гіпотез, що означає помилка другого роду ($\beta$)?
Неспроможність відхилити нульову гіпотезу, коли вона насправді є хибною.
Час між послідовними прибуттями клієнтів у сервісний центр описується експоненціальним розподілом. Якщо відомо, що минуло 10 хвилин з моменту прибуття останнього клієнта, яка ймовірність того, що наступний клієнт прибуде протягом наступних 5 хвилин, порівняно з початковою ймовірністю прибуття клієнта протягом 5 хвилин?
Вона така сама
При побудові 99% довірчого інтервалу для середнього значення популяції, коли стандартне відхилення популяції ($\sigma$) невідоме, а розмір вибірки $n=15$, який розподіл слід використовувати для знаходження критичного значення?
t-розподіл Стьюдента з 14 ступенями свободи
У аналізі лінійної регресії точка даних має великий негативний залишок. Що це означає?
Лінія регресії значно переоцінює фактичне значення $y$ для цієї точки.
Яке твердження найкраще описує центральну граничну теорему?
Незалежно від розподілу популяції, розподіл вибіркових середніх буде наближатися до нормального, коли розмір вибірки стає достатньо великим.
У дослідженні порівнюють два методи навчання. Дослідники використовують тест хі-квадрат для гомогенності (однорідності), щоб проаналізувати результати, де результат є категоріальною змінною (напр., 'засвоїв', 'частково засвоїв', 'не засвоїв'). Яка нульова гіпотеза для цього тесту?
$H_0$: Розподіл результатів навчання є однаковим для обох методів.