Kõrvalekalde eemaldamine Google'i arvutustabelites
Google'i Lehed Google Google Dokumendid Kangelane / / June 02, 2023
Avaldatud
Mõnikord võib teie arvutustabel sisaldada ebatavaliselt kõrgeid või madalaid väärtusi, mis moonutavad teie tulemusi. Siit leiate teavet selle kohta, kuidas Google'i arvutustabelites kõrvalekaldeid eemaldada.
Andmete analüüsimisel näete üks või kaks tulemust, mis võivad kõik endast välja viia. Andmepunktid, mis on suuremast osast teie andmetest oluliselt kõrgemad või madalamad, võivad märkimisväärselt moonutada selliseid näitajaid nagu keskmine keskmine. Mõnel juhul on parem eemaldada need kõrvalekalded oma andmetest enne analüüsi alustamist.
Kui teil on mõned andmepunktid, mis tegelikult ei sobi, vaadake allpool, kuidas eemaldada Google'i arvutustabelites kõrvalekaldeid.
Mis on Outlier?
Kõrvalväärtus on andmepunkt, mis on oluliselt suurem või väiksem kui enamik kogumi andmeid.
Näiteks kui mõõdate viie taime kasvu ja tulemused olid 5 cm, 7 cm, 6 cm, 7 cm ja 25 cm, siis oleks lõpptulemus kõrvalekalle. Enamik tulemusi on ligikaudu sama väärtusega ja lõpptulemus on oluliselt kõrgem kui ülejäänud.
On olemas meetodid, mille abil saate määrata, milliseid väärtusi peetakse kõrvalekalleteks, mis põhinevad teie andmete vahemikus või levikul.
Miks eemaldada kõrvalekalded?
Mõnel juhul võivad teie andmete kõrvalekalded andmete analüüsimisel tulemusi moonutada.
Näiteks ülaltoodud juhul, kui võtta kõigi viie taime keskmine kasvu keskmine, oleks see (5+7+6+7+25)/5 ehk 10 cm. Neli taime kasvasid sellest palju vähem, ainult üks taim kasvas oluliselt rohkem, nii et keskmine keskmine ei esinda tegelikult ühtegi andmepunkti.
Kui aga kõrvalekalduja eemaldada, oleks keskmine keskmine (5+7+6+7)/4 ehk 6,25. See esindab palju rohkem ülejäänud väärtusi ja annab andmetele täpsema peegelduse.
Mõnda statistikat, näiteks mediaani, kõrvalekalded ei mõjuta, kuid paljudel juhtudel võivad kõrvalekalded oluliselt mõjutada.
Kuidas leida kõrvalekallet
Andmete ulatuse või leviku põhjal on kõrvalekaldeid määrata mitmel viisil. Üks lihtsamaid hõlmab kasutamist interkvartiilne vahemik.
Kvartiil on lihtsalt andmepunkt, mis leitakse andmete jagamisel neljaks võrdseks osaks. Alumine kvartiil on arv, mis on veerand teie andmetest, kui need on loetletud järjestuses madalaimast kõrgeimani. Ülemine kvartiil on väärtus, mis moodustab kolm neljandikku teie andmete vahemaast.
Interkvartiilne vahemik on nende kahe väärtuse erinevus. Kuna see on erinevus alumise ja ülemise kvartiili vahel, jääb täpselt pool teie väärtustest sellesse kvartiilivahemikku.
Kõrvalväärtuste ülempiiri saate määrata, korrutades interkvartiili vahemiku 1,5-ga ja lisades tulemuse ülemise kvartiili väärtusele. Iga väärtus, mis on suurem sellest numbrist, on kõrvalekalle. Samamoodi saate kõrvalekallete alampiiri leida, korrutades kvartiilidevahelise vahemiku 1,5-ga ja lahutades selle alumise kvartiili väärtusest. Iga sellest väärtusest väiksem arv on kõrvalekalle.
Kuidas leida Google'i arvutustabelites kõrvalekallet
Kui kõik ülaltoodu tundub teile meeldiva matemaatikana, ärge kartke. Google'i arvutustabelid teeb kogu raske töö teie eest ära. See aitab teil arvutada teie andmete ülemise kvartiili, alumise kvartiili ja interkvartiili vahemiku ning seejärel saate luua valemi, et määrata, kas iga väärtus on kõrvalekalle või mitte.
Google'i arvutustabelites kõrvalekalde leidmiseks tehke järgmist.
- Valige lahter, kuhu soovite alumise kvartiili arvutada.
- Sisestage järgmised:
=QUARTILE(
- Valige kõik oma andmed.
- Sisestage koma ja seejärel 1, millele järgneb suletud sulg.
- Vajutage Sisenema ja alumine kvartiil arvutab.
- Valige järgmine lahter ja sisestage järgmine:
=QUARTILE(
- Valige kõik oma andmed.
- Sisestage koma, seejärel 3 ja seejärel suletud sulg.
- Vajutage Sisenema ja ülemine kvartiil arvutab.
- Valige järgmine rida allapoole ja tippige =, seejärel valige ülemist kvartiili sisaldav lahter.
- Tippige miinus (-) ja valige alumist kvartiili sisaldav lahter.
- Vajutage Sisenema ja interkvartiilne vahemik arvutatakse.
- Valige oma andmete ülemise lahtri kõrval olev lahter ja sisestage järgmine valem, asendades C3 ülemise andmelahtri asukohaga, $18 C$ lahtriga, mis sisaldab alumine kvartiil (veenduge, et panete tähe ja numbri ette $-märgi), $19 lahtriga, mis sisaldab teie ülemist kvartiili ja $20, kui lahtrit sisaldab teie interkvartiili vahemik:
=IF(C3$C$19+1.5*$C$20,"Outlier",""))
- Kui teie esimene andmepunkt on kõrvalekalle, tagastab valem teksti kõrvalekalde. Vastasel juhul jääb see tühjaks.
- Valemi rakendamiseks andmete teistele lahtritele klõpsake ja hoidke all lahtri allnurgas lohistamispidet.
- Lohistage alla lahtrite kohal, kuhu soovite valemit rakendada.
- Laske lahti ja teie valem kopeeritakse ja arvutatakse. Nüüd näete selgelt kõiki kõrvalekaldeid olevaid väärtusi.
Kõrvalekalde eemaldamine Google'i arvutustabelites
Nüüd teate, kuidas kõrvalekaldeid leida, aga kuidas on nende eemaldamisega?
Saame seda teha kasutades lihtsat KUI valem, mis eemaldab andmed kõigist lahtritest, mis on loetletud kõrvalekalletena, kuid tagastab algse väärtuse nende jaoks, mis seda ei ole.
Kõrvalekalde eemaldamiseks Google'i arvutustabelites tehke järgmist.
- Järgige ülaltoodud samme, et määrata, millised väärtused on kõrvalekalded.
- Valige ülemisest andmepunktist lahter kaks veergu.
- Sisestage järgmine valem, asendades C3 ülemise lahtri asukohaga ja D3 sellest paremal asuva lahtri asukohaga:
=IF(D3="Välimaine","",C3)
- Vajutage Sisenema. Kui ülemine lahter on kõrvalekalle, tagastab valem tühiku. Vastasel juhul tagastab see teie ülemise lahtri väärtuse.
- Valemi rakendamiseks ülejäänud lahtritele klõpsake ja hoidke lahtri allnurgas lohistamispidet.
- Lohistage alla lahtrite kohal, kuhu soovite valemit rakendada.
- Hiire vabastamisel kopeeritakse valem ja Google'i arvutustabelid arvutab lõpptulemuse. Kõik kõrvalekalletena loetletud väärtused eemaldatakse.
Andmete töötlemine Google'i arvutustabelites
Google'i arvutustabelite kõrvalekallete eemaldamise õppimine tagab, et teie andmeid ei moonutaks väärtused, mis jäävad märkimisväärselt väljapoole enamiku teie andmete vahemikku. Mõnel juhul võib see oluliselt mõjutada statistikat, mida kasutate andmete analüüsimiseks.
Teades, kuidas neid väärtusi eemaldada, saate soovi korral neist lahti saada või lisada, kui soovite kogu andmekogumit analüüsida. Võite isegi proovida mõlemat ja tulemusi võrrelda.
Google'i arvutustabelid on suurepärane statistilise analüüsi jaoks, kuid see võib teha palju, palju enamat. Saate teha koostööd teiste kasutajatega, kui loote Google'i arvutustabelite dokumenti ja isegi kommenteerida ja reageerida nende tööle. Sa saad sisestage Google'i arvutustabelite tabelid oma Google'i dokumentidesse, ja saate isegi Looge Google'i arvutustabelites QR-koode.