Ohjelmointiympäristö

Data-analytiikassa kannattaa käyttää koodin kirjoittamiseen ja suorittamiseen muistio-tyyppistä ohjelmointiympäristöä. Suosittelen Minicondan, Anacondan tai Google Colabin käyttöä. Kaikissa edellä mainituissa käytetään jupyteriin perustuvaa muistio-tyyppistä ympäristöä.

Miniconda

Omalle koneelle asennettavaksi ympäristöksi suosittelen Minicondaa. Lue kuitenkin Minicondan ja Anacondan vertailu ennen kuin valitset Mincondan ja Anacondan väliltä.

Minicondan löydät osoitteesta https://docs.anaconda.com/free/miniconda/. Valitse oma käyttöjärjestelmäsi (Windows, MacOS tai Linux) ja asenna Miniconda oletusasetuksilla.

Miniconda sisältää Pythonin ja conda-paketinhallintajärjestelmän. Data-analytiikassa tarvittavat lisäpaketit täytyy asentaa Minicondan asennuksen jälkeen condan avulla:

  • Käynnistä asennuksen jälkeen Minicondan komentorivi:
    • Windows-koneilla Windowsin käynnistysvalikosta Miniconda - Anaconda prompt (miniconda3)
    • MacOS- ja Linux-koneilla terminal/pääte.
  • Komentorivillä voit asentaa tarvitsemasi paketit. Jokaisen asennuskomennon jälkeen kestää hetken ennen kuin conda löytää sinulle sopivan version, jonka jälkeen se kysyy lupaa asennukseen. Vastaa kysymykseen y-kirjaimella ja paina enter. Data-analytiikkaa varten tarvitset ainakin seuraavat asennukset:
    • conda install jupyter (koodin kirjoittamiseen ja suorittamiseen käytettävä ohjelmointiympäristö)
    • conda install pandas (data-analytiikan peruspaketti, jonka mukana asentuu myös numeerisen laskennan peruspaketti numpy)
    • conda install seaborn (grafiikka-paketti, jonka mukana asentuu myös grafiikan peruspaketti matplotlib)
    • conda install scikit-learn (koneoppimisen paketti, jonka mukana asentuu myös tieteellisen laskennnan peruspaketti scipy)
    • conda install statsmodels (tilastollisten mallien paketti, josta löytyy mm. aikasarjaennustamisen menetelmiä)
    • conda install openpyxl (Excel-tiedostojen avaamiseen)
    • conda install xlsxwriter (Excel-tiedostojen kirjoittamiseen).

Myöhemmin voit tarpeen mukaan asentaa muita paketteja.

Tutustu asennuksen jälkeen jupyterin toimintaan. Jupyterin voit käynnistää Minicondan komentoriviltä komennolla jupyter notebook.

Anaconda

Anaconda sisältää valmiiksi asennettuna jupyterin ja useimmat data-analytiikassa tarvittavat paketit. Asennusohjeet löydät osoitteesta https://docs.anaconda.com/free/anaconda/install/.

Tutustu asennuksen jälkeen jupyterin toimintaan.

Google Colab

Jos et halua asentaa ympäristöä omalle koneellesi, niin voit käyttää ilmaiseksi pilvipalvelua Google Colab. Palvelun käyttämiseen tarvitset Google-tunnuksen. Colab sisältää valmiiksi asennettuina useimmat data-analytiikassa tarvittavat paketit.

Voit käynnistää Googlen version jupyteristä valitsemalla Colabin File/Tiedosto-valikosta New notebook/Uusi työkirja. Colabillä kirjoitetut muistiot tallentuvat Google Driveen.

Jos Google Colab käynnistyy suomenkielisenä, niin voit halutessasi vaihtaa sen englanninkieliseksi valitsemalla Ohje-valikosta Näytä englanniksi.