Automaattinen analysointi
Paljon muuttujia sisältäville datoille ei kannata esimerkiksi frekvenssitaulukoita laskettaessa kirjoittaa koodia jokaista muuttujaa varten erikseen, vaan kannattaa automatisoida laskenta:
- Esimerkiksi frekvenssitaulukon laskentaan liittyvän koodin voi kirjoittaa omaksi funktioksi, jolle voi antaa parametriksi muuttujan.
- Koodissa voidaan kutsua omaa funktiota jokaiselle for-silmukassa läpikäytävälle muuttujalle.
tilastoapu-muistiossa on luotu oma funktio frekvenssitaulukon (myös dikotomisille), ristiintaulukoinnin, tunnuslukujen, tunnuslukujen ryhmittäin ja korrelaatiokertoimien laskemiseen. Omissa funktioissa on käytetty aikaisemmissa osioissa opittuja laskentamentelmiä.
Omia funktioita kutsutaan koodissa for-silmukoiden sisältä. Muistion käyttäjän täytyy määritellä listoina kategoriset, dikotomiset ja määrälliset muuttujat. Näiden listojen mukaiset muuttujat käydään for-silmukoissa läpi.
Muistiossa käytetään XlsxWriter-moduulia, jonka avulla tulokset kirjoitetaan ja muotoillaan Excel-tiedostoon. Muistion koodien suorittamisen jälkeen tulokset sisältävä Excel-tiedosto löytyy samasta kansiosta kuin muistio.
Muistiossa ei ole selitetty XlsxWriterin käyttöä, mutta aiheesta kiinnostuneet löytävät hyvät käyttöohjeet osoitteesta https://xlsxwriter.readthedocs.io/.
Harjoittele esimerkki-muistion käyttöä myös muilla datoilla. Sopivia datoja löytyy seaborn-kirjastosta. Kokeile esimerkiksi seuraavilla komennoilla aukeavia datoja: sns.load_dataset('tips')
, sns.load_dataset('penguins')
, sns.load_dataset('diamonds')
, sns.load_dataset('taxis')
.