Quiz Chapter 16 - Lineaire regressie MOD 8

0.0(0)
studied byStudied by 0 people
learnLearn
examPractice Test
spaced repetitionSpaced Repetition
heart puzzleMatch
flashcardsFlashcards
Card Sorting

1/34

encourage image

There's no tags or description

Looks like no tags are added yet.

Study Analytics
Name
Mastery
Learn
Test
Matching
Spaced

No study sessions yet.

35 Terms

1
New cards
<p><strong>Toetsvraag 2021-2022 - R</strong></p><p>Hieronder staat de output van R voor het overzicht (Engels: summary) van een lineair model. De gegevens waarop dit is gebaseerd, zijn het aantal advocaten en het aantal gestolen auto's in een bepaalde week voor 9 steden in het VK. Wat is de vergelijking voor de regressielijn?</p>

Toetsvraag 2021-2022 - R

Hieronder staat de output van R voor het overzicht (Engels: summary) van een lineair model. De gegevens waarop dit is gebaseerd, zijn het aantal advocaten en het aantal gestolen auto's in een bepaalde week voor 9 steden in het VK. Wat is de vergelijking voor de regressielijn?

 

voorspelde aantal gestolen auto's = -3.7231 + 1.9344 * aantal advocaten


2
New cards
<p><strong>Toetsvraag 2021-2022 - Oefeningen</strong></p><p>Een bioloog denkt dat er een lineair verband is tussen de hoeveelheid kunstmest die een tomatenplant krijgt, en de daaropvolgende opbrengst van tomaten. Hij selecteert willekeurig acht tomatenplanten en behandelt deze wekelijks met een oplossing van x gram kunstmest in een vaste hoeveelheid water. De opbrengst, y in kilogram tomaten, wordt neergeschreven. De correlatiecoëfficiënt <em>r</em> is 0.9444.</p><p>Gebaseerd op onderstaande info, met hoeveel kilogram stijgt de geschatte opbrengst per extra gram kunstmest in de oplossing? Tip: de berekening kan eenvoudig uitgevoerd worden zonder de waarden van de individuele observaties te gebruiken.</p><p></p>

Toetsvraag 2021-2022 - Oefeningen

Een bioloog denkt dat er een lineair verband is tussen de hoeveelheid kunstmest die een tomatenplant krijgt, en de daaropvolgende opbrengst van tomaten. Hij selecteert willekeurig acht tomatenplanten en behandelt deze wekelijks met een oplossing van x gram kunstmest in een vaste hoeveelheid water. De opbrengst, y in kilogram tomaten, wordt neergeschreven. De correlatiecoëfficiënt r is 0.9444.

Gebaseerd op onderstaande info, met hoeveel kilogram stijgt de geschatte opbrengst per extra gram kunstmest in de oplossing? Tip: de berekening kan eenvoudig uitgevoerd worden zonder de waarden van de individuele observaties te gebruiken.

 

Per extra gram kunstmest stijgt de verwachte opbrengst tomaten met 1.0810 kilogram


3
New cards

A sales manager claims that there is a relationship between college GPA and sales performance (number of units sold) among salespeople hired within the last year. Use the regression results shown below and set α = .05 to test his claim.


Predictor Coef SE Coef T P
Constant -0.484 3.256 -0.15 0.884
GPA 7.423 1.044 7.11 0.000

 

reject the null hypothesis and conclude that there is a significant relationship between GPA and sales performance


4
New cards

As the carbon content in steel increases, its ductility tends to decrease. A researcher at a steel company measures carbon content and ductility for a sample of 15 types of steel. Use the following regression results to find the 95% confidence interval for the slope of the regression equation.


Predictor Coef SE Coef T P
Constant 7.671 1.507 5.09 0.000
Carbon Content -3.296 1.097 -3.01 0.010

 

-5.666 to -0.926


5
New cards
<p><strong>Toetsvraag 2021-2022 - Oefeningen</strong></p><p>Gedurende 9 random dagen in augustus wordt het aantal uren zonneschijn gemeten. Een ijsverkoper noteert het aantal verkochte ijsjes op deze dagen. Wanneer we een lineair model opvragen van de data, geeft R onderstaande output. Wat is de P-waarde horend bij de richtingscoëfficiënt die de vraag beantwoordt of er een significant lineair verband bestaat tussen het aantal uren zonneschijn en het aantal verkochte ijsjes? Tip: test tweezijdig!</p>

Toetsvraag 2021-2022 - Oefeningen

Gedurende 9 random dagen in augustus wordt het aantal uren zonneschijn gemeten. Een ijsverkoper noteert het aantal verkochte ijsjes op deze dagen. Wanneer we een lineair model opvragen van de data, geeft R onderstaande output. Wat is de P-waarde horend bij de richtingscoëfficiënt die de vraag beantwoordt of er een significant lineair verband bestaat tussen het aantal uren zonneschijn en het aantal verkochte ijsjes? Tip: test tweezijdig!

 

De P-waarde is 0.0004 en dus kunnen we op significantieniveau 0.05 zeggen dat er een lineair verband is tussen het aantal uren zonneschijn en het aantal verkochte ijsjes


6
New cards

Which of the following does NOT affect the standard error of the regression slope?

 

Spread around the line: se

 

All of these affect the standard error.

 

Spread of x values: sx

 

Critical value: t*

 

Sample size: n

Critical value: t*

7
New cards
<p><strong>Toetsvraag 2021-2022 - Oefeningen</strong></p><p>Een boekhandel wil beoordelen of het hebben van meer verkopers per dag hun omzet zal verhogen. Ervan uitgaande dat aan de aannames en condities voor lineaire regressie is voldaan, wordt een lineaire regressie uitgevoerd op een steekproef (zie tabel) en is de richtingscoëfficiënt van de regressielijn 0.913 en het intercept 8.101. De standaarddeviatie van de residuen <em>s<sub>e</sub></em> is 1.477 en de standaardfout van de richtingscoëfficiënt is 0.0873.</p><p>Geef het 95%-betrouwbaarheidsinterval voor de werkelijke gemiddelde toename van de omzet voor iedere extra persoon die op die dag werkt.</p><p></p>

Toetsvraag 2021-2022 - Oefeningen

Een boekhandel wil beoordelen of het hebben van meer verkopers per dag hun omzet zal verhogen. Ervan uitgaande dat aan de aannames en condities voor lineaire regressie is voldaan, wordt een lineaire regressie uitgevoerd op een steekproef (zie tabel) en is de richtingscoëfficiënt van de regressielijn 0.913 en het intercept 8.101. De standaarddeviatie van de residuen se is 1.477 en de standaardfout van de richtingscoëfficiënt is 0.0873.

Geef het 95%-betrouwbaarheidsinterval voor de werkelijke gemiddelde toename van de omzet voor iedere extra persoon die op die dag werkt.

 

0.712 ; 1.114


8
New cards
<p>The World Happiness Report is a landmark survey of the state of global happiness. The report calculates a happiness score for each country in the world based on answers to main life evaluation question from nationally representative samples.</p><p>A researcher is using these happiness scores to determine which variables are able to explain the state of happiness of a country. Therefore, she has built the following linear model in R</p><p> <span>Given the linear model that this researcher has fit, which of the following statements is false?</span></p>

The World Happiness Report is a landmark survey of the state of global happiness. The report calculates a happiness score for each country in the world based on answers to main life evaluation question from nationally representative samples.

A researcher is using these happiness scores to determine which variables are able to explain the state of happiness of a country. Therefore, she has built the following linear model in R

Given the linear model that this researcher has fit, which of the following statements is false?

 

We can reject the null hypothesis that there is no linear association between the state of happiness of a country and its population on a significance of 5%.


9
New cards

Vraag 9

Cars from an online service were examined to see how fuel efficiency (highway mpg) relates to cost (in dollars). According to the regression equation, a used car that costs $13,000 is predicted to get about 30.24 miles per gallon. According to the data, the car got 35 miles per gallon. What is the value of the residual for this car?

 

+4.76


10
New cards

A researcher is interested in developing a model that can be used to distribute assistance to low income families for food costs. She used data from a national social survey to predict weekly amount spent on food using household income (in $1000). The resulting regression equation is

(Food$/wk) hat = 101.33 + 0.77HIncome.

How much money would be needed to feed a family for a week whose household income is $12,000?

 

$110.57


11
New cards
<p><strong>Toetsvraag 2021-2022 - Theorie</strong></p><p>Onderstaande figuur toont de residuen versus de voorspelde waarden van een lineaire regressie uitgevoerd voor 2 kwantitatieve variabelen. Welke conclusie omtrent de condities bij lineaire regressie kunnen we duidelijk trekken uit de plot?</p>

Toetsvraag 2021-2022 - Theorie

Onderstaande figuur toont de residuen versus de voorspelde waarden van een lineaire regressie uitgevoerd voor 2 kwantitatieve variabelen. Welke conclusie omtrent de condities bij lineaire regressie kunnen we duidelijk trekken uit de plot?

 

Gelijke spreiding conditie is niet voldaan


12
New cards

A sales manager was interested in determining if there is a relationship between college GPA and sales performance (number of units sold) among salespeople hired within the last year. From the regression results shown below, identify the residual standard deviation.

Predictor Coef SE Coef T P
Constant -0.484 3.256 -0.15 0.884
GPA 7.423 1.044 7.11 0.000

S = 1.57429 R-Sq = 78.3% R-Sq(adj) = 76.8%

 

1.574


13
New cards

just fout  

Het is belangrijk om de aannames in de juiste volgorde na te gaan: 1) Lineariteit 2) Onafhankelijkheid errors 3) Gelijke variantie rond de regressierechte 4) Normale verdeling errors per x-waarde


juist

14
New cards

juist fout

 

Om de aanname van Normale verdeling van de errors per x-waarde na te gaan moet je in de praktijk via een histogram nagaan of de x-variabele en y-variabele in de steekproef Normaal verdeeld zijn.


fout

15
New cards

juist fout

 

Wanneer aan de aanname van lineariteit voldaan is, dan is de aanname van gelijke variantie rond de regressierechte ook steeds voldaan.


fout

16
New cards

juist fout 4 

Om correcte inferentie te kunnen doen, is het voldoende indien aan de aanname van Normale verdeling van de errors per x-waarde is voldaan.


fout

17
New cards
<p>Een bioloog denkt dat er een lineair verband is tussen de hoeveelheid kunstmest die een tomatenplant krijgt, en de daaropvolgende opbrengst van tomaten. Hij selecteert willekeurig acht tomatenplanten en behandelt deze wekelijks met een oplossing van x gram kunstmest in een vaste hoeveelheid water. De opbrengst, y in kilogram tomaten, wordt neergeschreven. De correlatiecoëfficiënt r is 0.9444.</p><p>Gebaseerd op onderstaande info, welk percentage van de variabiliteit in de opbrengst wordt verklaard door de hoeveelheid kunstmest? Tip: de berekening kan eenvoudig uitgevoerd worden zonder de waarden van de individuele observaties te gebruiken.</p><p></p>

Een bioloog denkt dat er een lineair verband is tussen de hoeveelheid kunstmest die een tomatenplant krijgt, en de daaropvolgende opbrengst van tomaten. Hij selecteert willekeurig acht tomatenplanten en behandelt deze wekelijks met een oplossing van x gram kunstmest in een vaste hoeveelheid water. De opbrengst, y in kilogram tomaten, wordt neergeschreven. De correlatiecoëfficiënt r is 0.9444.

Gebaseerd op onderstaande info, welk percentage van de variabiliteit in de opbrengst wordt verklaard door de hoeveelheid kunstmest? Tip: de berekening kan eenvoudig uitgevoerd worden zonder de waarden van de individuele observaties te gebruiken.

 

89.19%


18
New cards
<p>Nasser organiseert een straatinzameling voor een liefdadigheidsinstelling voor geestelijke gezondheidszorg. De inzameling vindt plaats in een grote stad op een bepaalde zaterdag. Vrijwilligers staan ​​met verzamelblikken op drukke plekken en vragen voorbijgangers om donaties. De onderstaande tabel toont voor 10 vrijwilligers de tijden, x minuten, die ze hebben besteed aan het inzamelen, samen met de bedragen, y euro, die ze hebben ingezameld. Op basis van deze data stelt R een lineair model op. De output is de volgende:</p><p></p><p></p><p>&nbsp;</p><p>Geef een 95% betrouwbaarheidsinterval voor het <u>voorspelde gemiddelde</u> ingezamelde bedrag van vrijwilligers die 137 minuten besteden aan het verzamelen van donaties.</p><p>(2de fabeelding bij de antwoord nodig voor de oef) </p>

Nasser organiseert een straatinzameling voor een liefdadigheidsinstelling voor geestelijke gezondheidszorg. De inzameling vindt plaats in een grote stad op een bepaalde zaterdag. Vrijwilligers staan ​​met verzamelblikken op drukke plekken en vragen voorbijgangers om donaties. De onderstaande tabel toont voor 10 vrijwilligers de tijden, x minuten, die ze hebben besteed aan het inzamelen, samen met de bedragen, y euro, die ze hebben ingezameld. Op basis van deze data stelt R een lineair model op. De output is de volgende:

 

Geef een 95% betrouwbaarheidsinterval voor het voorspelde gemiddelde ingezamelde bedrag van vrijwilligers die 137 minuten besteden aan het verzamelen van donaties.

(2de fabeelding bij de antwoord nodig voor de oef)

 

29.2121 ; 38.9503


<p>&nbsp;</p><p>29.2121 ; 38.9503</p><p><br></p>
19
New cards

According to the plot of residuals versus fitted values below, which of the following is true?

 

linearity condition is not satisfied.

 

quantitative variables condition is not satisfied.

 

nearly normal condition is not satisfied.

 

equal spread condition is not satisfied.

 

equal spread condition is satisfied.

 

equal spread condition is not satisfied.


20
New cards
<p>The World Happiness Report is a landmark survey of the state of global happiness. The report calculates a happiness score for each country in the world based on answers to main life evaluation question from nationally representative samples.</p><p>A researcher is using these happiness scores to determine which variables are able to explain the state of happiness of a country. Therefore, she has built the following linear model in R:</p><p></p><p>Given the linear model that this researcher has fit, which of the following statements is false?</p><p></p><p>There is a positive correlation between the state of happiness of a country and its GDP per capita</p><p>&nbsp;</p><p>About 67.61% of the variation in hapiness of a country can be explained by its GDP per capita.</p><p>&nbsp;</p><p>We can reject the null hypothesis that there is no linear association between the state of happiness of a country and its GDP per capita on a significance of 5%.</p><p>&nbsp;</p><p>Data on 139 countries were used to fit this linear model.</p>

The World Happiness Report is a landmark survey of the state of global happiness. The report calculates a happiness score for each country in the world based on answers to main life evaluation question from nationally representative samples.

A researcher is using these happiness scores to determine which variables are able to explain the state of happiness of a country. Therefore, she has built the following linear model in R:

Given the linear model that this researcher has fit, which of the following statements is false?

There is a positive correlation between the state of happiness of a country and its GDP per capita

 

About 67.61% of the variation in hapiness of a country can be explained by its GDP per capita.

 

We can reject the null hypothesis that there is no linear association between the state of happiness of a country and its GDP per capita on a significance of 5%.

 

Data on 139 countries were used to fit this linear model.

 

About 67.61% of the variation in hapiness of a country can be explained by its GDP per capita.


21
New cards

The number of hours of training time received by employees and the time it took (in minutes) for them to trouble shoot their last process problem was estimated using a regression equation. The 95% prediction interval for trouble shooting time with 8 hours of training was determined to be 12.822 to 19.261. The correct interpretation is

 

We can be 95% confident that the trouble shooting time by a particular line worker who received 8 hours of training will be between 12.822 and 19.261 minutes.


22
New cards

A researcher gathers data on the length of essays (number of lines) and the SAT scores received for a sample of students enrolled at his university. Based on his regression results, the 95% confidence interval for the slope of the regression equation is -0.88 to 1.34. At α = 0.05, we can say

 

The slope of the regression equation is not significantly different from zero.


23
New cards
<p>Gebaseerd op de gegeven scatterplot voor x en y, wat is de meest plausibele waarde voor de correlatiecoëfficiënt <em>r</em>?</p><p>&nbsp;</p><p>0</p><p>&nbsp;</p><p>0.05</p><p>&nbsp;</p><p>-0.62</p><p>&nbsp;</p><p>0.96</p>

Gebaseerd op de gegeven scatterplot voor x en y, wat is de meest plausibele waarde voor de correlatiecoëfficiënt r?

 

0

 

0.05

 

-0.62

 

0.96

 

0.96


24
New cards

De hypothesetoets voor de richtingscoëfficiënt met H0: β1 = 0 bij lineaire regressie geeft je…

 

de exacte waarde van de richtingscoëfficiënt in de populatie

 

antwoord op de vraag of er een significant verschil is tussen 2 populatiegemiddeldes

 

antwoord op de vraag of er een statistisch significante lineaire associatie is tussen 2 kwantitatieve variabelen in de populatie

 

antwoord op de vraag of er een ander type van verband aanwezig is (niet-lineair, maar vb. exponentieel) tussen 2 kwantitatieve variabelen

 

antwoord op de vraag of er een statistisch significante lineaire associatie is tussen 2 kwantitatieve variabelen in de populatie


25
New cards
<p>Een boekhandel wil beoordelen of het hebben van meer verkopers per dag hun omzet zal verhogen. Ervan uitgaande dat aan de aannames en condities voor lineaire regressie is voldaan, wordt een lineaire regressie uitgevoerd op een steekproef (zie tabel) en is de richtingscoëfficiënt van de regressielijn 0.913 en het intercept 8.101. De standaarddeviatie van de residuen s<sub>e</sub> is 1.477 en de standaardfout van de richtingscoëfficiënt is 0.0873.</p><p>Geef het 95%-betrouwbaarheidsinterval voor de <span><u>voorspelde gemiddelde</u></span> omzet op dagen waarop 12 werknemers werken.</p><p></p>

Een boekhandel wil beoordelen of het hebben van meer verkopers per dag hun omzet zal verhogen. Ervan uitgaande dat aan de aannames en condities voor lineaire regressie is voldaan, wordt een lineaire regressie uitgevoerd op een steekproef (zie tabel) en is de richtingscoëfficiënt van de regressielijn 0.913 en het intercept 8.101. De standaarddeviatie van de residuen se is 1.477 en de standaardfout van de richtingscoëfficiënt is 0.0873.

Geef het 95%-betrouwbaarheidsinterval voor de voorspelde gemiddelde omzet op dagen waarop 12 werknemers werken.

 

17.932 ; 20.180


26
New cards

juist fout  

Een residu is het verschil tussen de geobserveerde y-waarde in de gegevens en de daarmee corresponderende y-waarde voorspeld door het regressiemodel


juist

27
New cards

juist fout   

De residuen kun je bepalen door de correlatiecoëfficiënt te berekenen


fout

28
New cards

juist fout   

Residuen zijn steeds positieve waarden


fout

29
New cards

juist fout   

Een residu is het verschil tussen de x-waarde en de voorspelde y-waarde


fout

30
New cards

Het betrouwbaarheidsinterval voor een voorspelde gemiddelde y-waarde bij een specifieke x-waarde…


is breder wanneer de standaarddeviatie van de residuen kleiner is (bij hetzelfde betrouwbaarheidsniveau)

 

is breder wanneer de x-waarde waarvoor je de voorspelling wil doen verder van de gemiddelde x-waarde ligt (bij dezelfde steekproefgegevens en betrouwbaarheidsniveau)

 

hangt enkel af van de steekproefgrootte en het gekozen betrouwbaarheidsniveau

 

is altijd breder dan het overeenkomstige predictie-interval voor een voorspelde individuele y-waarde

 

is breder wanneer de x-waarde waarvoor je de voorspelling wil doen verder van de gemiddelde x-waarde ligt (bij dezelfde steekproefgegevens en betrouwbaarheidsniveau)


31
New cards
<p>The World Happiness Report is a landmark survey of the state of global happiness. The report calculates a happiness score for each country in the world based on answers to main life evaluation question from nationally representative samples.</p><p>A researcher is using these happiness scores to determine which variables are able to explain the state of happiness of a country. Therefore, she has built the following linear model in R:</p><p>&nbsp;</p><p>Given the linear model that this researcher has fit, which of the following statements is false?</p><p></p><p>&nbsp;</p><p>We can reject the null hypothesis that there is no linear association between the state of happiness of a country and its urban population on a significance of 5%.</p><p>&nbsp;</p><p>About 47.62% of the variation in hapiness of a country can be explained by its urban population.</p><p>&nbsp;</p><p>There is a negative correlation between the state of happiness of a country and its urban population.</p><p>&nbsp;</p><p>Data on 139 countries were used to fit this linear model.</p>

The World Happiness Report is a landmark survey of the state of global happiness. The report calculates a happiness score for each country in the world based on answers to main life evaluation question from nationally representative samples.

A researcher is using these happiness scores to determine which variables are able to explain the state of happiness of a country. Therefore, she has built the following linear model in R:

 

Given the linear model that this researcher has fit, which of the following statements is false?

 

We can reject the null hypothesis that there is no linear association between the state of happiness of a country and its urban population on a significance of 5%.

 

About 47.62% of the variation in hapiness of a country can be explained by its urban population.

 

There is a negative correlation between the state of happiness of a country and its urban population.

 

Data on 139 countries were used to fit this linear model.

 

There is a negative correlation between the state of happiness of a country and its urban population.


32
New cards

juist fout  

Als de relatie tussen 2 kwantitatieve variabelen niet lineair is, maar een eerder gebogen positieve trend heeft, en je berekent toch de correlatiecoëfficiënt r dan heeft deze de waarde 0.00


fout

33
New cards

juist fout

 

Het heeft enkel zin de correlatiecoëfficiënt r te berekenen wanneer de 2 variabelen kwantitatief zijn én wanneer de relatie effectief ook lineair is


juist

34
New cards

juist fout  

Als het teken van de correlatiecoëfficiënt r negatief is dan zal ook het teken van de richtingscoëfficiënt b1 negatief zijn


juist

35
New cards

juist fout  

Een uitschieter kan er soms toe leiden dat een zwakke correlatie (r dicht bij 0 zonder de uitschieter) een hoge correlatiecoëfficiënt bekomt (r dichter bij 1 of -1, met de uitschieter)


juist