Kuidas eemaldada R-st puuduvad väärtused?
Kuidas eemaldada R-st puuduvad väärtused?

Video: Kuidas eemaldada R-st puuduvad väärtused?

Video: Kuidas eemaldada R-st puuduvad väärtused?
Video: Kõik akutrellid purunevad seetõttu! Lõpeta selle vea tegemine! 2024, November
Anonim

Esiteks, kui tahame välistada puuduvad väärtused matemaatilistest tehtetest kasutage ei . rm = TÕENE argument. Kui te neid ei välista väärtused enamik funktsioone tagastab an NA . Samuti võime soovida oma alajaotust andmeid täielike vaatluste saamiseks need tähelepanekud (read) meie andmeid mis sisaldavad nr puuduvad andmed.

Lihtsalt nii, kuidas R käsitleb puuduvaid väärtusi?

sisse R a puuduvad väärtused on kodeeritud sümboliga NA . Andmestiku puudujääkide tuvastamiseks on funktsioon. ei (). Kui impordite andmestiku muudest statistikarakendustest puuduvad väärtused võib olla kodeeritud numbriga, näiteks 99. Selleks, et lasta R tean, et see on a puuduv väärtus peate selle uuesti kodeerima.

Lisaks, kuidas arvutada R-is puuduvad väärtused? Puuduvate andmete käsitlemine R-i abil

  1. colsum(is.na(andmeraam))
  2. summa(is.na(andmeraam$veeru nimi)
  3. Puuduvaid väärtusi saab ravida järgmiste meetoditega:
  4. Keskmine/režiim/mediaanimputatsioon: Imputatsioon on meetod puuduvate väärtuste täitmiseks hinnanguliste väärtustega.
  5. Ennustusmudel: ennustusmudel on üks keerukamaid meetodeid puuduvate andmete käsitlemiseks.

Seejärel võib ka küsida, kuidas eemaldada ridu, mis sisaldavad R-s NA väärtusi?

Funktsioon omt() tagastab loendi ilma ühegita read et sisaldavad na väärtusi . Andmeraami läbimine ei . Funktsioon omt() on lihtne viis mittetäielike kirjete eemaldamiseks analüüsist. See on tõhus viis na väärtuste eemaldamiseks r-st.

Kuidas eemaldada R-i andmekomplektist kõrvalekaldeid?

Konkreetseid pole R funktsioonid eemaldage kõrvalekalded . Kõigepealt peate välja selgitama, millised on tähelepanekud kõrvalekalded ja siis eemaldada need, st esimese ja kolmanda kvartiili (hinged) ning kvartiilidevahelise vahemiku leidmine sisemiste piirete arvuliseks määratlemiseks.

Soovitan: