Sisukord:

Mis on andmeanalüüsi kõrvalekalded?
Mis on andmeanalüüsi kõrvalekalded?

Video: Mis on andmeanalüüsi kõrvalekalded?

Video: Mis on andmeanalüüsi kõrvalekalded?
Video: Mis on Confirmation bias ja miks on raske ratsionaalselt infot analüüsida? 2024, Mai
Anonim

Statistikas on an kõrvalekalle on andmeid punkt, mis erineb oluliselt teistest vaatlustest. An kõrvalekalle võib olla tingitud mõõtmise varieeruvusest või viidata katseveale; viimased jäetakse mõnikord sellest välja andmeid seatud. An kõrvalekalle võib põhjustada tõsiseid probleeme statistilised analüüsid.

Kuidas seda arvestades andmetes kõrvalekaldeid leida?

Punkt, mis jääb väljaspoole andmeid komplekti sisetara on klassifitseeritud alaealiseks kõrvalekalle , samas kui üks, mis jääb väljapoole välispiirdeid, on klassifitseeritud suureks kõrvalekalle . Et leida omale sisemised piirded andmeid määrake esiteks korrutage kvartiilide vahemik 1,5-ga. Seejärel lisage tulemus Q3-le ja lahutage see Q1-st.

Kas ma peaksin lisaks ülaltoodule eemaldama oma andmetest kõrvalekalded? Sest a enamasti, kui teie andmed need äärmuslikud juhtumid teid mõjutavad saab köidetud a sisend ajaloolisele esindajale teie andmed mis välistab kõrvalekalded . Määrake iga juhtumi puhul eraldi, mida a mõju kõrvalekalded oli. Ja sealt edasi otsustage, kas soovite eemaldada , muuta või säilitada kõrvaline väärtused.

Kuidas käsitleb andmeanalüüs sellega seoses kõrvalekaldeid?

Siin on neli lähenemisviisi:

  1. Loobuge kõrvalekalletest. Bill Gatesi või mõne muu tõelise kõrvalekalde puhul on mõnikord kõige parem see kirje oma andmekogust täielikult eemaldada, et see inimene või sündmus teie analüüsi moonutaks.
  2. Piirake oma kõrvalekallete andmeid.
  3. Määrake uus väärtus.
  4. Proovige teisendust.

Mis on kõrvalekalde näide?

Outlier . more Väärtus, mis "asub väljaspool" (mis on palju väiksem või suurem kui) enamikku muudest andmekogumi väärtustest. Sest näide punktides 25, 29, 3, 32, 85, 33, 27, 28 on nii 3 kui 85 " kõrvalekalded ".

Soovitan: