1/144
Looks like no tags are added yet.
Name | Mastery | Learn | Test | Matching | Spaced |
---|
No study sessions yet.
Vad är foskning?
Forskningens kunskapskrav:
- Systematiskt sökande efter kunskap eller förståelse för hur något är uppbyggt eller fungerar.
- Utgår ifrån en eller flera frågor, problem eller funderingar som initieras av forskaren.
- Att analysera, utvärdera och relatera information till tidigare resultat och teorier.
- Finna fakta som kan användas för att lösa problem som leder till nya kunskaper.
Vad är målet med vetenskap?
1. Beskriva beteende.
Kallas ofta på deskriptiv forskning.
Strävar inte efter att fastlägga kausala samband.
Ofta första steget när man närmar sig ett ämne som är väldigt outforskat.
2. Predicera beteende.
Om man identifierat att två händelser systematiskt relaterar till varandra blir det möjligt att göra prediktioner. Men även om prediktionen visar sig stämma så är det inte säkert att vi kan förklara varför den äger rum.
3. Kartlägga orsakssamband.
Ett tredje mål är att fastställa kausalitet. Orsak - verkan
4. Förklarande forskning.
Varför? KBT leder till minskad ångest, vilka komponenter i KBT är det som är verksamma? Om vi blir tvungna att dra ner på behandlingstiden, vilka delar kan vi då ta bort?
Kort om Grundforskning
Genomförs utan att ha ett tydligt syfte eller ändamål.
Systematiskt sökande efter ny kunskap.
Kan vara autonom, klassiskt exempel Einstein och hans arbete med relativitetsteorin.
Kan vara riktad, då förväntas resultatet få betydelse för olika samhällsområden.
Kort om Tillämpad forskning
Grundar sig i resultaten av grundforskningen och konkret vilken praktisk nytta den har.
Syftet är inte att öka kunskapen inom ett område utan att resultat ska kunna tillämpas.
Bedrivs vanligtvis inom företag och på forskningsinstitut exempel en klinisk studie som undersöker effekten av ett läkemedel.
Vad kännetecknar vetenskaplig förståelse?
- Demarkationskriterium = vad skiljer vetenskapligförståelse från annan förståelse
- Verifikationskriteriet = en utsaga ska man kunna hitta stöd för i empirin.
Karl Popper vände sig mot detta:
- Falsifiera = det ska gå att pröva teorin på ett sätt som gör att den går att avfärda.
Intern validitet
Man ska kunna vara säker på att det endast är OV som påverkar BV inget annat. Frånvaro av systematiska skillnader.
Extern validitet
Huruvida man kan göra generaliseringar från orsakssambandet till
1) Andra sätt att manipulera/mäta OV och BV
2) Till andra miljöer än den använda
3) Till andra personer än de undersökta
Vad påverkar extern/intern validitet
- Extern validitet: Randomisering, storlek på urvalsgrupp.
- Intern validitet: Deltagarna måste vara lika i alla relevanta avseenden så att endast OV påverkar BV (så att vi kan vara säkra på att vi mäter faktiskt är det vi vill mäta, alltså att det endast är OV som påverkar BV).
Vad kännertecknar Pseudovetenskap?
- Hypoteserna är ofta inte testbara
- Om man rapporterar statistiska tester är metoden inte vetenskaplig och validiteten av datan är tveksam.
- Evidensen är anekdotisk och vilar starkt på auktoriteter som är "så kallade" experter inom området.
- Påståenden ignorerar motstridande bevis.
- Påståenden anges med vad som låter som vetenskaplig terminologi.
- Påståenden är ofta vaga och revideras aldrig.
Vad är oberoende variabel & beroende variabel
- Oberoende variabel, OV: Orsaken, exponeringen.
OV är den variabel man kan manipulera.
- Beroende variabel, BV: Effekten, utfallet.
BV är den variabel man vill mäta.
Effekterna av denna variabel är beroende av OV.
Hur räknar man ut F-kvoten?
F-kvoten räknas ut genom att man dividerar MSB (Mean square between) med MSW (Mean sqaure within).
Vad anger den s.k. F-kvoten?
Hur stor sannolikheten är att H0 inte stämmer.
Om F-kvoten är större än den kritiska gränsen så kan vi förkasta nollhypotesen. Den kritiska gränsen är beroende av den alfanivå och frihetsgrader som vi använt oss av.
Hur ser förhållandet mellan F-kvoten och sannolikheten för att nollhypotesen stämmer?
Ju högre F-kvoten blir desto mindre är sannolikheten att H0 är sann.
Varför utförs s.k. Post Hoc test ofta i samband med variansanalys? Nämn namnet på minst två olika Post Hoc test.
För att ta reda på var skillnaderna finns mellan grupperna.
LSD: Som att utföra multipla T-test.
Tukey HSD: För varje jämförelse är risk för typ-1 fel högst den samma som den bestämda signifikansnivån.
Beskriv tre antaganden vid variansanalys.
1. Antagandet om normalfördelade populationer - för att få tillförlitliga resultat (alltså att typ-1 fel inte är större än den alfa-nivå man bestämt) måste stickproven vara representativa för resten av populationen om man ska kunna generalisera sitt resultat. Dock fungerar envägs oberoende ANOVA relativt bra även vid stora avvikelser från normalfördelningen.
2. Antagandet om homogena populationsvarianser - Vilket innebär att variansen på den aktuella variabeln är densamma i alla populationer.
3. Antagandet om att x-poängen ska vara oberoende över grupperna - det innebär att man inte ska mäta samma individer flera gånger och inte heller dela upp individerna med hjälp av någon bakgrundsvariabel och sedan gruppera individer med liknande värden på den bakgrundsvariabeln (såvida det inte just är effekten av denna bakgrundsvariabel man vill testa!).
Vad (ungefär) anger effektstorleken vid variansanalys? Ange två olika effektmått.
Hur mycket (i procent) av variansen mellan individer kan förklaras av vilken grupp de tillhör.
Effektmått:
Eta- squared (samma sak som R2 i regressionsanalys)
Omega- squared (mindre biased än föergående)
Vad menas med randomisering?
Med detta menas att slumpen avgör vilken betingelse varje undersökningsdeltagare ska hamna i. Annars kan man riskera att det uppstår en systematisk skillnad mellan grupperna.
Viktigt för den externa validiteten.
När används tvåvägs ANOVA?
Vid faktoriell design, där individer tillhör olika kombinationer av grupper på två olika oberoende variabler.
Vad brukar inträffa med F-kvoten för effekten av en viss oberoende variabel om man tar med ytterligare en oberoende variabel i analysen? Varför?
F-värdet brukar bli högre.
Varför? genom att ta hänsyn till ännu en oberoende variabel samt interaktionen mellan de oberoende variablerna så sjunker felvariansen (vi får lägre error vid tvåvägsanalys). Då blir F-värdet för effekten av behandling högre (Analysen får högre power)
Hur många effekter räknas fram vid en trevägs ANOVA?
Sju: Tre huvudeffekter och fyra interaktionseffekter (AxB, AxC, BxC, AxBxC)
När används ANOVA för beroende mätningar?
När man har en inomindividsdesign, det vill säga då vi mäter BV för samma individer vid flera tillfällen.
Vad är fördelen med upprepade mätningar?
Effekten av individuell variation kan beräknas, vilket minskar mätfel och därmed ökar powern. Om vi bara har ett värde per person vet vi inte om det har att göra med OV eller om personens generellt tenderar att ligga där. Om vi har flera värden för samma person kan vi räkna ut ett individuellt medelvärde över alla mätningar. Vi kan räkna bort individuell effekt från effekten av tid (behandling) och får då ett renare mått på effekten av behandling.
Alltså upprepade mätningar på samma person = du får reda på deras grundvärde.
Beskriv det "extra antagande" som gäller för ANOVA för beroende mätningar som inte gäller för ANOVA för oberoende mätningar.
Sfäricitet - homogena varianser för alla differenser. Alltså, värdena ska skilja sig ungefär lika mycket mellan mättillfällen för alla individer i populationen.
Kan testas t.ex. genom "Mauchly's Test of Sphericity" - testar om det finns en signifikant skillnad i varians för differenserna
När används Mixed ANOVA?
Används när vi har upprepade mättillfällen av BV hos samma personer OCH vi har en eller flera OV som varierar mellan personer (olika grupper). Både inomgrupps och mellangrupps design.
När används Multivariat ANOVA (MANOVA)?
När man har fler än en BV.
T.ex. upprepade mätningar av samma variabel eller flera indikatorer på en faktor.
Undersökningsdesign
Beskriv de tre olika typerna
- Experiment: Används för att undersöka kausala samband, alltså samband mellan orsak & verkan. Kännetecknas av randomisering av individer till betingelser och kontroll över OV
- Kvasi-experiment: Kännetecknas av att man har kontroll över OV men ingen randomisering.
- Korrelationsstudie (icke-experiment): Kännetecknas av att man varken har kontroll över OV eller randomisering av individer till betingelser. Enbart samvarians mellan variablerna kan undersökas.
Definiera Inomgruppsdesign
- Definition: Alla individer utsätts för alla betingelser. Här blir det alltså ingen randomisering.
Definiera Mellangruppsdesign
- Definition: Olika individer utsätts för olika betingelser.
Beskriv 4 Urvalsmetoder
1) Slumpmässigt urval: Alla har samma sannolikhet att komma med i urvalet. Urvalet bör bli en mindre kopia av populationen. Slumpen avgör.
2) Stratifierat urval: Populationen delas in i strata (subgrupper) t.ex. åldersgrupper. Kan användas då samtliga individer i en population är numrerade, exempelvis i ett register. Ex- alla "n" ingår i urvalet.
3) Klusterurval: Redan befintliga undergrupper i populationen ligger till grund för urvalet. Ex- från en förteckning av alla skolor i Sverige, väljer vi ut alla gymnasieskolor. Sen väljer vi ut alla samhällsprogram, och sist väljer vi ut några elever från varje samhällsklass.
4) Kvot urval: Bygger på idén att urvalet ska ha samma fördelning i urvalet som i populationen med avseende på vissa kända egenskaper.
Vad betyder Operationelisering?
Att man tar något abstrakt och diffust och gör det konkret och mätbart.
Definiera Reliabilitet
Tillförlitlighet. Frånvaro av slumpmässiga fel. Man ska kunna mäta flera ggr med samma individer och samma miljö och få samma resultat.
Replikerbarhet är viktigt för reliabiliteten.
Nämn alla Skalnivåer
- Kvotskala: Kontinuerlig varierande numerisk skala med absolut nollpunkt, tex lön. (Medelvärde Median Typvärde)
- Intervallskala: Skala som tilldelats variabelvärden utan absolut nollpunkt, tex temperatur. (Medelvärde Median Typvärde)
- Ordinalskala: Vi kan ordna variabelvärdena i något slags rangsystem, exempelvis att något är mer, större eller bättre än något annat, dock inte hur mycket bättre. (Median Typvärde)
- Nominalskala: Skalnivå som har varibelvärden som endast kan skiljas från varandra, tex
kön. (Typvärde)
Vad anger Centralmått?
Anger vad som är det normala, det typiska eller det genomsnittliga värdet för en viss variabel.
Vad anger Centralmått: Typvärde, för och nackdelar
Det mätvärde som har den högsta
frekvensen.
- Fördel: lättbegripligt, bra när variabeln i fråga bara kan anta ett fåtal olika värden.
- Nackdel: det vanligaste/mest
frekventa värdet varierar mycket från stickprov till stickprov.
Vad anger Centralmått: Median
Det mittersta värdet för en uppsättning siffror.
Medianen kallas "50:e percentilen" eller 2:a
kvartilen.
Medianen är särskilt lämplig när data är snedfördelad. OBS!
Vad anger Centralmått: Medelvärde
Räknas ut genom att ta summan av alla observationer och dela med antalet observationer.
Det mest använda centralmåttet.
Det påverkas av varje observation --> extremavvikare kan ge missvisande medelvärde.
Definiera Spridningsmått
Ett sammanfattande mått över hur mätvärdena är utspridda i datamängden
Vad anger Spridningsmått: Standardavvikelse
Observationernas genomsnittliga avstånd från medelvärdet.
Det talar alltså om hur mycket värdet för observationerna avviker från medelvärdet.
Vad anger Spridningsmått: Z-poäng
Talar om hur långt ifrån medelvärdet en observation befinner sig, i standardavvikelser räknat.
Om medelvärdet = 5cm
Standardavvikelsen = 2cm
Då är z-poäng = 1p = 7cm
Om z-poäng = -1p = 3cm
Att använda z-poäng som ett spridningsmått är effektivt om man exempelvis ska göra en jämförelse mellan variabler som mäts i olika enheter.
Beskriv Spridningsmått: Normalfördelning
En klockformad och symmetrisk kurva mellan två värden.
I en normalfördelad variabel återfinns alltid en bestämd proportion av alla observationer.
Normalfördelningskurvans utseende bestäms av medelvärdet och varians. Stor varians ger en bred normalfördelningskurva, medan liten varians ger en smal kurva.
Vid ±1 standardavvikelse befinner sig ≈68% (34,13% + 34,13%) av alla observationer.
Korrelation & Korrelationskoefficient (r)
-Korrelation definition: Ett mått på graden av samvariation mellan två variabler.
- Korrelationskoefficienten, r, talar om huruvida det är ett positivt eller negativt samband samt sambandets styrka. Korrelationskoefficienten antal alltid ett värde mellan 1 och -1. Desto närmare 0 ett värde är desto svagare korrelation.
Korrelationens riktning (positiv/negativ) samt styrka kan läsas av i ett punktdiagram där punkter som befinner sig samlat kring en (imaginär) 45-graders linje tyder på en stark korrelation (en korrelationskoefficient som antar ett värde nära ±1) medan punkter som är utspridda tyder på en svag relation (en korrelationskoefficient som antar ett värde nära noll)
Nollkorrelation: Det finns ingen korrelation. Stor och osammanhängande spridning mellan punkterna i ett punktdiagram.
Exempel:
r = 0,5 = stark positivt korrelation
r = 0,3 = medelstark positiv korrelation
r = - 0,1 = svag negativt korrelation
r = 0 = nollkorrelation
r = 2,7 = ej möjlig då värdet ligger utanför värdet som korrelationskoefficienten kan anta.
Inferentiell statistik - vad används det till?
Inferentiell statistik eller hypotesprövning handlar om att dra slutsatser om populationer utifrån observationer i stickprov.
Inferentiell statistik: Beskriv processen vid hypotesprövning
1) Man ställer upp en NOLLHYPOTES, H0, som säger att det INTE finns ett visst samband, skillnad eller effekt mellan variablerna.
2) Man ställer upp en ALTERNATIVHYPOTES, H1, som säger att det FINNS ett visst samband, skillnad eller effekt mellan två eller flera variabler.
3) Man utgår från att nollhypotesen är sann. Man samlar in data från ett stickprov och gör beräkningar på dessa data för att ta reda på om de är förenliga med nollhypotesen.
4) Om datan INTE är förenlig med nollhypotesen (alltså om p < alfa) förkastar man den och säger att man har STÖD för alternativhypotesen och säger att resultatet är statistiskt signifikant.
Inferentiell statistik: Statistisk signifikans
- Ett resultat anses vara statistiskt signifikant om p-värdet är mindre än < alfavärdet.
Exempel 1: P=0,03, alfa=0,05 --> H0 förkastas i.o.m. att 0,03<0,05 resultatet är statistiskt signifikant.
Exempel 2: P=0,275, alfa= 0,05 --> H0 behålls i.o.m. att 0,275>0,05 resultatet är inte statistiskt signifikant.
- Om ett resultat anses vara statistiskt signifikant innebär det att man förkastar nollhypotesen (alltså hypotesen om att det inte viss ett visst, samband, skillnad eller effekt mellan två eller fler variabler).
- Att ett resultat är statistiskt signifikant innebär att det troligen inte har uppkommit av en slump.
- För att bestämma exakt hur osannolikt resultatet ska vara för att man ska förkasta nollhypotesen bestäms ett alfavärde (normalt är alfavärdet = 0,05).
Inferentiell statistik: Typ 1- & Typ 2-fel
Typ 1-fel: Man förkastar nollhypotesen, H0, trots att den är sann. (Man hävdar alltså att det finns ett visst samband, skillnad eller effekt mellan två eller flera variabler trots att det inte gör det). Man får alltså en signifikans av en slump. Risken att man gör ett typ 1-fel är lika med alfa (alltså vanligtvis 5% risk). För att minska risken för att göra ett typ 1-fel bör man alltså ha ett lågt alfavärde.
Typ 2-fel: Man behåller nollhypotesen, H0, trots att den är falsk. (Man hävdar alltså att det inte finns en signifikant skillnad trots att det gör det). Sannolikheten för att göra ett typ 2-fel blir mindre om man har högre alfa, fler undersökningsdeltagare, starkare oberoende variabel, mindre felvarians och beroende mätningar i stället för oberoende mätningar.
Inferentiell statistik: Konfidensintervall, CI
Att man har ett 95% konfidensintervall innebär att
Ett intervall runt någon stickprovsegenskap, exempelvis medelvärdet, med en förbestämd konfidensgrad (oftast 95%).
Detta innebär att vi har 95% tilltro till att parametern man faktiskt vill mäta, exempelvis medelvärdet för populationen, finns inom intervallet.
Exempel: Om stickprovets (!!) medelvärde = 8,2 poäng, och 95% CI = 0,4 poäng innebär det att vi kan vara 95% säkra att den egentliga siffran för populationen (!!) ligger mellan 8,2p ±0,4 = 7,8p-8,6p.
Beskriv två Mätfel och vad de påverkar
- Slumpmässiga fel: Varierar slumpmässigt mellan mätningar, och påverkar mätningens reliabilitet (mätsäkerhet, tillförlitlighet)
- Systematiska fel: Är konstanta över upprepade mätningar och påverkar mätningens validitet (giltighet)
Definiera Kausalitet
Orsakssamband. Om kausalitet råder mellan två fenomen, kallas det ena orsak och det andra verkan.
Vilka är de 4 etiska kraven (NIKS!)
Nyttjandekravet: Uppgifter insamlade om enskilda personer får enbart användas för forskningsändamål.
Informationskravet:
forskarna ska informera de som deltar om forskningens syfte
Konfidentialitetskravet:
uppgifter om alla deltagare ska hållas konfidentiell och personliga uppgifter skall bevaras privat
Samtyckeskravet:
deltagarna har själva rätt att bestämma över sin medverkan
Varför är det viktigt att redovisa både deskriptiv statistik och inferensstatistik när man rapporterar resultaten från en studie? Vilken information får man av dem?
- Deskriptiv statistik ger oss information om just vår studie, vårt stickprov/urval och de data som vi har samlat in. Vi redovisar exempelvis centralmått (medelvärde, median) och spridningsmått (standardavvikelse) samt visar diagram och tabeller på just vårt stickprov.
-Inferensstatistik gör det möjligt för oss att just härleda resultatet i stickprovet till populationen, dvs den målgrupp som vi vill nå med vår undersökning, den grupp som undersökningen ska generaliseras till. Konfidensintervall och signifikansnivå på materialet bestämmer om vi kan uttala oss om det sanna värdet i populationen utifrån resultatet i vårt stickprov.
Hur kan man motverka ovidkommande variabler och därmed öka den interna validiteten?
Randomisering är ett utmärkt verktyg för att kontrollera ovidkommande variabler, då slumpeffekten anses ta hand om eventuella skillnader mellan olika försöksdeltagare.
Beskriv vilket roll teorier och hypoteser spelar i forksningsprocessen!
Hypotes: en preliminär förklaring/prediktion av ett fenomen. För att ha något att forska på måste du formulera en hypotes, då det är hypotesen du prövar i din forskningsprocess. Det ligger som underlag för att göra experiment, dvs att manipulera den oberoende variabeln och se hur den beroende variabeln påverkas. Här kommer alternativhypotes och nollhypotes in i bilden.
Teori: en teori är formella påstående som har för mål att förklara hur och varför något hänger ihop. Får du stöd för din hypotes i tillräckligt många experiment, så kan du sedan formulera en teori.
Varför är prediktioner viktiga inom vetenskapen?
En prediktion är ett försök att förutsäga ett visst resultat, på vilket man sedan grundar en hypotes. Man måste ha ett visst antagande för att kunna formulera en hypotes. Du ska inte kunna efterkonstruera svar. Förklaringar som ges post hoc måste göras nya studier på.
Fördelar och nackdelar av slumpmässigt urval
alla individer har samma sannolikhet att komma med i stickprovet.
Positivt: att det är helt randomiserat, så mest kontroll över ovidkommande variabler.
Negativt: undergrupper kanske inte representeras på ett bra sätt.
Beskriv vad som utmärker en exprimentiel design!
-manipulation (av den oberoende variabeln)
-kontroll (över ovidkommande variabler)
-randomisering (att slumpa fd i betingelser).
-utesluta ovidkommande variabler för att kunna dra kausala samband
Randomisering och slumpmässigt urval handlar om två olika saker. Förklara begreppen, så att du kan skilja dem åt!
1. Slumpmässigt urval handlar om själva processen att välja ett stickprov ur populationen
2. Randomisering innebär alltså i nästa steg att slumpa in det redan utvalda stickprovet i olika betingelser
Varför gör man gärna slumpmässigt urval och randomisering?
1. Undvika systematiska fel
2. Man vill få ett så pass representativt urval ur målpopulationen som möjligt. Slumpen är alltid bättre än forskaren själv på att få till ett representativt urval, då en mängd problem genast uppstår gällande urvalsprocessen och eventuella bias om forskaren själv manipulerar urvalet.
3. Randomisering kan bidra till att göra studien blind
4. Randomisering undviker de former av snedvridning som kan uppstå om försöksledare eller försökspersoner på egen hand bestämmer vilken försöksperson som ska hamna i vilken grupp (selection bias)
Det som du inte manipulerar i ett experiment vill du hålla konstant. Vad innebär det? Varför vill du det?
Så du kan veta att det verkligen är manipulationen av den oberoende variabeln som ger skillnaden. Man vill vara säker på att beroendevariabeln verkligen beror på den oberoende variabeln.
Statistisk signifikans
1. Ett hjälpmedel för att avgöra om resultatet i ett experiment kan tillskrivas någon betydelse eller om det enbart beror på slumpen
2. Om resultatet säger att risken för att skillnaden inte beror på en slump är tillräckligt liten >5% säger man att det är statistiskt signifikant.
Vad måste vi göra för att kunna generalisera utifrån stickprov?
Ha ett representativt stickprov för populationen man vill undersöka som återspeglar variationen inom målgruppen. Stickprovet ska likna målgruppen i relevanta egenskaper! Gruppen måste även vara tillräckligt stor (stickprovet alltså)
Svårigheter med experiment
1. En viktig begränsning är att stark
kontroll kan leda till problem med generaliserbarheten, om experimentmiljön skiljer sig mycket ifrån en naturlig" miljö
2. Att kontrollgruppen påverkas av forskarens närvaro
3. Risk för olika typer av tolkningar och bias
4. Svårt att utesluta alternativa förklaringar
5. Spontan tillfriskning
6. Uttröttning (löses med motbalansering)
Beskriv Tre typer av design
Beskrivande forskning (kvantitativ eller kvalitativ)
ex. fallstudie, naturalistisk observation, survey
(enkätstudie). Ex. "Hur ser det ut?", "Hur vanligt är
det?", "Hur upplevs det?"
• Sambandsstudier. Ex. "Finns det ett samband
mellan x och y?"
• Experiment. Ex. "Är x en orsak till y?", "Orsakar
en förändring i x en förändring i y?"
Vad beskriver ett korrelationsvärde?
Intensiteten och riktningen i en relation.
Förklara vad som menas med induktiv respektive deduktiv ansats
• Induktiv- upptäcktens väg, hypotesgenererande, utvecklar teori och går från det konkreta till det abstrakta
• Deduktiv- bevisandets väg, hypotesprövande, utgår från teori och från det generella till det konkreta.
Beskriv vilken roll a) teorier och b) hypoteser spelar i forskningsprocessen.
a. Teorier är generella påståenden och antaganden om ett visst fenomen, dvs abstraktaantaganden om varför och hur något är på ett visst sätt. En bra teori ska kunna ge förutsägelser och 1. Organisera information på ett strukturerat sätt2. Kan testas 3. Förutsägelser från teorin stöds av resultat från ny forskning 4. Law of pasimony: om två teorier ger en lika bra förklaring till ett fenomen ska alltid den enklaste teorin gälla.
b. Hypoteser är en specifik prediktion/förutsägelse om ett fenomen. Man formar "om-så"satser. (Ex; om jag gör på det sättet så kommer detta att inträffa). Det ligger som underlag för att göra experiment, dvs att manipulera den oberoende variabeln och se hur den beroende variabeln påverkas. Detta för att studera orsakssambandet, dvs kasualiteten. Först har man en alterantiv hypotes (exempelvis rökning leder till lungcancer), man formar en nollhypotes (rökning leder inte till lungcancer), man samlar in material (data) och gör beräkningar utifrån nollhypotesen, om resultatet från experiment med OV och BV är tillräckligt osannolika (dvs inte av en slump) så förkastar man nollhypotesen.
Förklara varför prediktioner är så viktiga inom vetenskapen.
Inom vetenskapen strävar man ofta efter att förutsäga resultat, utifrån kunskaper från tidigare observationer eller teorier. Förklaringar som däremot ges "post hoc" (i efterhand) behöver testas i en ny studie. Många olika resultat kan ges rimliga förklaringar i efterhand, efterhandskonstruktioner. Teoribildning är därför det starkaste testet för vetenskaplig förståelse. Förståelse genom förutsägelse, kontroll och teoribildning: Vad orsakar vad? Orsak-verkan. Vilken variabel är oberoende och vilken är beroende? Om vi kan kontrollera omständigheterna borde vi kunna skapa ett beteende. Dvs, om vi har kontroll över oberoende variabel så vet vi också vad som orsakar vad, vi får en god validitet och reliabilitet.
Beskriv fördelar och nackdelar med flera olika urvalsmetoder.
OSU: Alla kan bli valda. Nackdel; om det är ojämn fördelning i bakomliggande variabler som ex kön så kan det bli en skevhet i stickprovet, alltså ett systematiskt fel (bias)
Stratifierat: Bra om bakomliggandevariabler (tex storlek på företag och hur många dessa är) skiljer sig mycket.
Bekvämlighetsurval: Om man inte har någon annan möjlighet än att fråga frivilliga, för att ens kunna utföra sin undersökning och få deltagare. Kan dock ge en missvisande bild och bias i svar från deltagare som kanske är överoptimistiska och mer positivt inställda och intresserade än vad en OSU skulle ha varit.
Systematiskt: Bra om alla deltagare finns i ett register. Man väljer var n:te (ex var 14:e). Smidigt och snabbt. Nackdel: Det får inte finnas en systematik i materialet sedan innan, dvs en okänd periodicitet. Ex vecktidningar. Dumt att välja var 7:e tidning då vi bara kommer att få söndagstidngarna med i urvalet...
Klusterurval: Dela upp populationen i delpopulationer och dela upp dessa i delpopulationer och sedan ett slumpmässigt urval. Bra om det inte finns en urvalsram som begränsar population.
Snöbollsurval: Fråga en person som känner någon som känner någon. Man vill åt personer med unika kunskaper/information/egenskaper. Bra metod för att komma åt dessa. Ger dock en väldigt riktad och ej slumpmässigt urval. Bra vid exempelvis case studies....
Vad menar man när man säger att ett samband är kausalt?
En orsak-verkan mellan två variabler. Den oberoende variabeln påverkar den beroende variabel. När man manipulerar/påverkar den oberoende så ger det en förändring i den beroende variablen.
Vad menar man med påståendet att korrelationer inte säger något om kausalitet? Förklara.
Korrelation innebär samvariaton mellan två variabler. Denna samvariation behöver inte vara kausal utan kan bero på en tredje, bakomliggande variabel (faktor). Samvariation mellan x och y kan bero på z. Ex, om priset på villaolja stiger så ökar försäljningen av vinterjackor. Samma sak om priset på villaolja sjunker så minskar försäljningen av vinterjackor. Detta är ett skensamband. Den tredje, bakomliggande faktorn som påverkar både x och y är temperaturen (vädret) utomhus, dvs variabel z. Om det är varmt eller kallt påverkar både x och y. Detta är extra viktigt att tänka på vid korrelationsstudier (icke-experiment) då man alltså inte har kontroll över OV.
Vi kan prata om olika s.k. ovidkommande variabler (extraneous variables) såsom bakomliggande variabler och confounding variables. Vad är problemet med dessa ovidkommande variabler? Förklara.
Ovidkommande variabler (exempelvis värdet kallt eller varmt) kan göra så att det ser ut som att det finns ett kausalt samband mellan en OV och BV fast det egentligen bara är en korrelation (samvariation) mellan dessa. I själva verket så är det alltså en bakomliggande variabeln (tredje variabeln, z-variabeln) som gör att x (försäljning av villaolja) och y (försäljning av vinterjackor) samvarierar.
Beskriv Confounding of variables (Förväxling av variabler)
Två variabler är sammanflätade på ett sätt som gör att man inte vet vilken som har påverkat den beroende variabeln. Är det den oberoende eller är det en okontrollerad (z) som påverkar? Exempelvis en undersökning där man skulle studera vilket gödningsmedel som var bäst. Man provade olika medel på olika åkrar (mellanindividdesign). Risken finns här att resultatet kan tolkas fel, då olika åkrar kan ge olika utslag på olika medel. Det som tolkas som skillnad mellan olika gödningsmedel kan i själva verket vara skillnad mellan åkrarnas bördighet? Samma med bilens pris. Är det bilens ålder (x) som påverkar priset (y) eller är det också en bakomliggande faktor (z) som exempelvis hur många mil bilen har gått, i vilket skick bilen är, vilket märke det är på bilen, etc...
Vad innebär det att en studie har hög intern validitet? Beskriv flera olika hot mot den interna validiteten, och beskriv vad forskarna kan göra för att motverka dessa olika hot.
Att vi kan dra slutsatser om ett definitivt kausalt samband mellan oberoende variabel och beroende variabel i vår studie. Riktningsproblematiken är ett hot, dvs vilken variabel påverkar vilken? Påverkar x (självförtroende) y (prestation) eller påverkar y (prestation) x (självförtroende). Ett sätt att undvika detta är just att kontrollera en oberoende variabeln och manipulera endast den. Annat hot är bakomliggande faktorer /tredje variabel / z-variabel. Samma här, ha kontroll över OV samt randomisering av individer och betingelser.
intern validitet och hot mot den
handlar om att säkerställa att det var OV som påverkade BV och ingenting annat.
Hot:
Riktningsproblemet - Vad kom egentligen först (hönan eller ägget)? Stort problem vid icke-experiment, speciellt vid tvärsnittsstudie. Vid longitudinell går det att få kontroll över riktningsproblemet.
Inget problem vid de två andra experimenttyperna
bakomliggande-variabel-problemet - Vi har en OV och en BV men utöver det finns det ytterligare en variabel som påverkar dem, nämligen den bakomliggande. T.ex. temperatur när man mäter samband mellan olje (OV)- och jackförsäljning (BV)
Extern validitet och tre typer av generaliseringar
giltigheten av att göra generaliseringar av de samband som OV och BV skapar visar på.
- generaliseringar till andra sätt att manipulera/mäta OV och BV
- generaliseringar till andra miljöer än den använda
- Generaliseringar till andra individer än de använda
5 urvalsmetoder
- obundet slumpmässigt urval
- systematiskt urval
- stratifierat urval - Urvalsgruppen delas in i undergrupper, ofta pga att bakgrunden på individerna skiljer sig mycket åt. Man tar sedan stickprov från varje strata. Indelningen kan t.ex. vara ålder
- klusterurval - Indelningen finns redan. T.ex. skola, klass osv.
- bekvämlighetsurval - du undersöker personer som finns nära till hands
slumpmässiga / systematiska mätfel
slumpmässiga fel sker slumpmässigt på slumpmässigt antal mätningar och påverkar mätningens validitet medan systematiska fel sker varje gång på alla mätningar och påverkar validiteten
Normalfördelning
Då typvärdet, medianen och medelvärde hamnar på precis samma plats i mitten.
Positivt sned fördelning
En fördelning som har majoriteten av observationerna på vänstra sidan av mitten. Staplarna sluttar åt höger.
Negativt sned fördelning
En fördelning som har majoriteten av observationerna på högra sidan av mitten. Staplarna sluttar åt vänster.
z-poäng
Standardpoäng - ett sätt att jämföra värden på olika skalor till en gemensam norm i normalfördelningar.
Det som mäts är hur långt ifrån medelvärdet observationen befinner sig, räknat i standardavvikelser.
Ex. Johan är 195 cm. Medelvärdet i en population är 175, dvs Johans avstånd till medelvärdet är 20 cm. Vi delar då Johans avvikelse med populationens standardavvikelse (ex 10 cm), 20/10=2. Vi har då fått fram vårt z-värde. Johan är 2 standardavvikelser över medellängden.
Kurtosis (toppighet)
För att fördelningen skall vara normal kräver det att kurtosis, alltså toppigheten, = 0.
Om kurtosis är positiv så är stapeln i mitten "toppigare", medan det ser ut som en dal om kurtosis är negativ.
Vad är mellanindivisdesign (mellangrupp) respektive inomindividsdesign (inomgrupp)?
Mellangruppsdesign = Olika personer för varje försöksbetingelse
Inomgruppsdesign = Samma individer deltar i alla försöksbetingelser
Alternativhypotes H1
Steg ett i inferentiell statistik/hypotesprövning. Det man "tror på". Säger att det finns ett visst samband eller skillnad; effekt mellan två eller fler variabler.
Nollhypotes H0
Steg två i inferentiell statistik/hypotestprövning. Säger att det inte finns något samband, skillnad/effekt.
Steg tre i inferentiell statistik/hypotesprövning
Utgår i att nollhypotesen är sann. Samlar in data från ett stickprov och gör beräkningar på denna data och tar reda på om data är förenliga med nollhypotesen. Om förenlig så förkastas nollhypotesen. Då stämmer alternativhypotesen och denna får stöd.
Förkastad nollhypotes = signifikant resultat
Alfanivå
Innan hypotesprövningen ska man bestämma exakt hur osannolikt resultatet måsta vara för att man ska kunna förkasta nollhypotesen. Vanligast a = 0,05.
(Symbolen för alfanivå skrivs med grekiskt a)
Konfidensintervall
Konfidensintervall är inom vilket spann vi är säkra på att det sanna medelvärdet ligger inom. Spann inom vilket medelvärdet med 95% säkerhet skulle ligga om alla individer undersökts.
Siffran 95% kallas för konfidensgraden. Vi 95% konfidens kommer i genomsnitt 95 av 100 intervall som skapas runt stickprovsmedelvärden ur populationen att täcka populations medelvärdet.
Positiv korrelation
Ju mer av X, desto mer av Y. Ökning i OV ger ökning i BV.
T.ex. längd och vikt --> ju längre man är desto mer väger man
Negativt korrelation
Ju mer av X, desto mindre av U. Ökning i OV ger minskning i BV.
T.ex. ålder och syn.
Vad är korrelationskoefficient?
Korrelations styrka.
Kan anta värden mellan -1 (negativ korrelation) och +1 (positiv korrelation). Styrkan avtar ju närmare värdet är 0.
0 = noll korrelation
Cohens riktlinjer om r (Pearsons r)
r = 0,10/-0,10 är ett svagt samband
r = 0,30/-0,30 är medelstarkt samband
r = 0,50/-0,50 är starkt samband
Hur fungerar induktiv forskning?
Teorin är resultatet av en forskningsinsats (resultat -> teori)
Hur fungerar deduktiv forskning?
Teorin föregår den praktiska forskningen (teori -> resultat)
Vilka faktorer kan vara hot mot den interna validiteten?
- Historia
- Testning
- Mäteffekter
- Bortfall
- Mognad
- Urval
- Oklarhet när det gäller vad som är orsak och verkan
Vilka faktorer kan vara hot mot den externa validiteten?
- Samverkan mellan urval och behandling
- Samverkan mellan situation (miljö) och behandling (insats)
- Samverkan mellan historia och behandling (insats)
- Interaktiva effekter av den första mätningen
- Reak
Vad innebär ett systematiskt tillvägagångssätt?
- Strukturerat arbetssätt
- Vetenskapliga metoder vid datainsamling
- Replikerbart
Vad används Pearsons r till?
Att beräkna styrkan (med hjälp av SPSS) på sambandet mellan X och Y
Vad innebär informationskravet?
De man forskar på ska få information om studien man gör
Vad innebär samtyckeskravet?
De man forskar på måste samtycka till att delta i studien (svårt vid dolda observationer)
Vad innebär konfidentialitetskravet?
Man behandlar allt material på ett konfidentiellt sätt