Sisukord:

Kuidas suhtute R-i NA väärtustesse?
Kuidas suhtute R-i NA väärtustesse?

Video: Kuidas suhtute R-i NA väärtustesse?

Video: Kuidas suhtute R-i NA väärtustesse?
Video: ЛЮБОВЬ С ДОСТАВКОЙ НА ДОМ (2020). Романтическая комедия. Хит 2024, November
Anonim

Kui impordite andmestiku muudest statistikarakendustest puuduvad väärtused võib olla kodeeritud numbriga, näiteks 99. Selleks, et lasta R tean, et see on a puuduv väärtus peate selle uuesti kodeerima. Veel üks kasulik funktsioon R juurde tegelema puuduvate väärtustega on ei . omit(), mis kustutab mittetäielikud vaatlused.

Nii, kuidas sa NA-ga R-is hakkama saad?

NA valikud R-is

  1. jäta vahele ja ei. välista: tagastab eemaldatud vaatlustega objekti, kui need sisaldavad puuduvaid väärtusi; erinevusi NA-de väljajätmise ja välistamise vahel võib näha mõnes ennustus- ja jääkfunktsioonis.
  2. pass: tagastab objekti muutmata kujul.
  3. fail: tagastab objekti ainult siis, kui see ei sisalda puuduvaid väärtusi.

Samuti, kuidas käsitlete R-is puuduvaid kategoorilisi andmeid? Kategooriliste viiside puuduvate väärtuste käsitlemiseks on erinevaid viise.

  1. Ignoreerige puuduvate väärtuste vaatlusi, kui tegemist on suurte andmekogumitega ja vähemal arvul kirjetel puuduvad väärtused.
  2. Ignoreeri muutujat, kui see pole oluline.
  3. Töötage välja mudel puuduvate väärtuste ennustamiseks.
  4. Käsitle puuduvaid andmeid lihtsalt teise kategooriana.

Samamoodi võib küsida, kuidas määrata R-is puuduvad väärtused?

sisse R , puuduvad väärtused on tähistatud sümboliga NA (pole saadaval). Võimatu väärtused (nt nulliga jagamine) on tähistatud sümboliga NaN (mitte arv). Erinevalt SAS-ist R kasutab märgi ja numbri jaoks sama sümbolit andmeid . Lisateavet töötamise harjutamiseks puuduvad andmed , proovige seda puhastuskursust andmed kirjas R.

Mida tähendab Na Rm keeles R?

Andmeraami funktsiooni kasutamisel ei . rm sisse r viitab loogilisele parameetrile, mis ütleb funktsioonile, kas eemaldada või mitte NA väärtused arvutusest. See sõna otseses mõttes tähendab NA eemaldada. See ei ole funktsioon ega operatsioon. See on lihtsalt parameeter, mida kasutavad mitmed andmeraami funktsioonid.

Soovitan: