Datan käsittely Excelissä: tuonti, siivous, yhdistys

Excel is still the leading data processing tool for most organisations—and with good reason. Once you know how to import, clean, combine and analyse data effectively, you can reclaim hours each week and significantly reduce costly errors. In this guide, we walk you step by step through the complete Excel data workflow: importing and preprocessing, filtering, merging, managing errors and applying practical tips. The focus is squarely on real-world use cases and techniques that work in both classic Excel and Microsoft 365. You’ll also get a curated set of recommended articles for deeper learning, plus an FAQ that answers the most common questions. For a one-page overview of everything we’ve published on Excel, return to our Excel guides and tips.

Excelissä datan käsittely alkaa rakenteesta. Kun data on taulukkona (Ctrl+T), saamme automaattisesti suodattimet, fiksut viittaukset ja mahdollisuuden hyödyntää dynaamisia funktioita tehokkaammin. Rakentamalla prosessin “tuonti → esikäsittely → analyysi → raportointi” -ketjuksi vältämme ad hoc -kopioinnin ja pidämme työn toistettavana.

Miksi tämä on tärkeää? Koska datan käsittely Excelissä on yhtä vahvaa kuin sen heikoin lenkki. Jos tuonti on hataraa tai esikäsittely manuaalista, analyysi ei pysy laadukkaana eikä päivity luotettavasti.

Keskeiset työkalut nykypäivän Excelissä:

Power Query (Tietojen haku ja muuntaminen): paras tapa tuoda ja muokata dataa toistettavasti.
Dynaamiset funktiot (FILTER, SORT, UNIQUE, XLOOKUP): joustava analyysi ilman monimutkaisia matriisikaavoja.
Pivot-taulukot ja -kaaviot: nopea ryhmittely, aggregointi ja raportointi.
Power Pivot ja tietomalli: suurten datamäärien käsittely, suhteet ja DAX-mittarit.

Lisää esimerkkejä: Kaavat ja funktiot.

Tavoite on yksinkertainen: rakentaa putki, jossa painamme Päivitä ja koko analyysi päivittyy – ilman käsityötä.

Datan tuonti ja esikäsittely

Tuonti eri lähteistä

Kun aloitamme datan käsittelyn Excelissä, tuonti kannattaa tehdä Power Queryn kautta (Tiedot → Hae tiedot). Tuetut lähteet ovat laajat: CSV/TSV, Excel-työkirjat, kansio (automaattinen tiedostojen yhdistäminen), SharePoint, OneDrive, SQL/MySQL/PostgreSQL, OData, jopa verkkosivut. Suosimme Power Querya, koska:

Tuonti on dokumentoitu vaiheina (Steps), jotka voi toistaa yhdellä Päivitä-komennolla.
Muunnokset – kuten sarakkeiden tyypitys, rivien suodatus, sarakkeiden poisto – säilyvät historiassa.
Muutokset ovat ei-tuhoavia: alkuperäistä lähdettä ei muokata.

Vinkki: Jos lähde on CSV, määritä erotin (pilkku/puolipiste), merkistö ja päivämäärämuoto oikein heti tuonnissa. Väärä erotin on yleisin syy “kaikki samassa sarakkeessa” -ongelmaan.

Esikäsittely: siivous ennen analyysiä

Tietotyypit: Asetetaan sarakkeille oikeat tyypit (Teksti, Luku, Päivämäärä/Kellonaika). Tämä vaikuttaa lajitteluun, laskentaan ja ryhmittelyyn.
Otsikot ja taulukkomuoto: Muutetaan ensimmäinen rivi otsikoiksi, poistetaan turhat rivit, muunnetaan taulukoksi (Ctrl+T) ja nimetään taulukko selkeästi.
Trim/Clean: Tekstidatan siistimiseen Excelin puolella TRIM (POISTA.VÄLILYÖNNIT) ja CLEAN (PUHDISTA) – Power Queryssa “Trim” ja “Clean” -muunnokset.
Yhtenäistäminen: Maa- tai valuuttakoodit, maakoodit, kirjainkoot (UPPER/LOWER/PROPER), yhtenäiset päivämääräformaatit.
Sarakkeiden johdonmukaisuus: Poistetaan duplikaattikentät, yhdistetään sarakkeet yhtenäiseksi avaimiksi (esim. asiakas_ID + vuosi_kk).

Latausasetukset

Power Queryn “Lataa” -vaiheessa voimme:

Ladata taulukkoon (helppo jatkokäyttö funktioilla/pivoteilla).
Ladata vain tietomalliin (kun käytämme Power Pivotia/DAX:ia tai data on iso).
Poistaa taulukoista ladatun datan ja säilyttää vain kyselyn (kevyt työkirja).

Tekstidatan tavalliset kompastuskivet

Etunollat katoavat (esim. tuotekoodit): pakotetaan sarake teksti-tyypiksi tuonnissa.
Päivämäärät tulkitaan US/UK-logiikalla väärin: määritetään oikea kulttuuri Power Queryssa.
Desimaalierotin: Vaihdetaan alueasetukset tai käytetään korvausta (replace) tuonnissa.

Kun esikäsittely on kunnossa, analyysi pysyy vakaana ja päivittyy yhdellä klikkauksella.

Suodatus, lajittelu ja haku

Suodatus

Perusfiltterit (Aloitus → Lajittele ja suodata) tarjoavat pikavalintoja, teksti- ja lukusuodattimia, sekä päivämäärähierarkian. Kun tarvitsemme joustavuutta, dynaaminen FILTER-funktio on vahva vaihtoehto:

FILTER(taulukko: ehto) palauttaa vain ehdon täyttävät rivit.
Usean ehdon logiikka: ehto1*(AND) ja ehto1+ehto2 (OR) dynaamisissa kaavoissa.

Vinkki: Lisää UNIQUE ennen FILTERiä, jos haluat suodattaa vain uniikit rivit. Tai käytä FILTER jälkeenpäin, kun haluat rajausta subsettiin.

Lajittelu

Peruslajittelu nouseva/laskeva usean sarakkeen mukaan.
SORT-funktio: SORT(alue: sarake_indeksi: [järjestys]: [lajitteluperuste]) mahdollistaa kaavaan sidotun järjestyksen.
CUSTOM-listat (Esimies → Senior → Johtaja) onnistuvat tekemällä apusarakkeen, jossa on järjestysnumero.

Haku ja viittaukset

XLOOKUP (HAKU.J): moderni, selkeä syntaksi, osuu oikealle vasemmalle, tukee virheiden hallintaa (if_not_found), exact/approximate, ja voi palauttaa useita sarakkeita kerralla.
VLOOKUP (PHAKU) ja INDEX+MATCH (INDEKSI+VASTINE) ovat edelleen käyttökelpoisia, mutta XLOOKUP yksinkertaistaa useimmat tapaukset.
HLOOKUP (VHAKU) on harvoin tarpeen, koska XLOOKUP toimii molempiin suuntiin.

Esimerkkejä käytännöstä:

Tuotekoodin perusteella haetaan hinta ja kategoria yhdellä XLOOKUPilla, joka palauttaa kaksi saraketta kerralla.
Monikriteerihaku: käytämme apuavainta (esim. AsiakasID & Vuosi & Kuukausi) ja haemme sen perusteella.

Etsi ja korvaa, jokerimerkit

Ctrl+F / Ctrl+H on nopein tapa korjata massavirheitä. Jokerimerkit:

?: mikä tahansa yksittäinen merkki
*: mikä tahansa merkkijono
~: pakottaa jokerimerkin normaaliksi merkiksi (esim. etsi “” kirjoittamalla “~“).

Kun yhdistämme FILTERin, SORTin, UNIQUE:n ja XLOOKUPin, saamme dynaamiset taulukot, jotka reagoivat heti uusiin tietoihin – juuri tätä datan käsittely Excelissä parhaimmillaan on.

Datan yhdistäminen ja pilkkominen

Yhdistäminen (merge/append)

Power Query Merge: yhdistää tauluja avainsarakkeen perusteella (Inner, Left, Right, Full, Anti). Hyödyllinen, kun haemme master-taulusta lisätietoja transaktioihin.
Fuzzy matching: auttaa, kun avaimet eivät ole identtisiä (nimivirheet, välilyönnit). Käytä harkiten ja lisää kynnysarvo.
Append: pinoaa saman rakenteiset taulukot (esim. kuukausittaiset raportit yhdeksi taulukoksi). Kansio-lähde + Append = automaattinen koonti.

Excel-kaavoilla yhdistäminen onnistuu XLOOKUPilla tai INDEX+MATCHilla, mutta kun lähteitä on useita tai dataa paljon, Power Query on vakaampi.

Pilkkominen (split)

TEXTSPLIT (TEKSTI.JAA) jakaa merkkijonon erotinmerkkien perusteella suoraan useaan sarakkeeseen tai riviin (Microsoft 365).
Perinteinen Teksti sarakkeisiin -toiminto toimii kertaluontoisesti, mutta ei päivity automaattisesti.
LEFT/RIGHT/MID (VASEN/OIKEA/KESKI): kun erotin puuttuu, mutta rakenne on vakio (esim. koodi-12-ABC → osat kiinteillä pituuksilla).
TEXTAFTER/TEXTBEFORE: poimii tekstin tietyltä puolelta erotinta kohti – kätevä monimutkaisissa merkkijonoissa.
FLASH FILL (Pikakorjaus, Ctrl+E): tunnistaa esimerkkipohjaisesti kaavan datasta (osoitteet, nimet). Hyvä nopeaan kertamuunnokseen.

Taulujen normalisointi ja mallintaminen

Pyrimme leveistä taulukoista (sarake jokaiselle kuukaudelle) pitkäksi faktatauluksi (päiväys, mitta, arvo). Tämä mahdollistaa pivotoinnin, dynaamiset ajanjaksot ja DAX-mittarit. Power Queryssa Unpivot Columns hoitaa tämän yhdellä komennolla.

Vinkkejä vakaaseen yhdistämiseen

Puhdista avaimet: TRIM, CLEAN, UPPER – sama käsittely molemmille tauluille.
Varmista avainyksikäsitteisyys: erota luonnollinen avain (asiakasID) ja tekninen avain (juokseva ID).
Dokumentoi: nimeä kyselyt ja vaiheet kuvaavasti, lisää kommentteja (Advanced Editor/M-koodi).

Duplikaatit, tyhjät solut ja virheet

Duplikaattien hallinta

Remove Duplicates (Poista kaksoiskappaleet) taulukon sisällä on nopea, mutta kertaluontoinen.
Power Queryn Remove Duplicates on toistettavissa ja osa päivittyvää putkea.
Etsi duplikaatit: käytä COUNTIF/COUNTIFS (LASKE.JOS/.JOS.JOUKKO) ja ehdollista muotoilua korostamaan päällekkäisyydet.
UNIQUE palauttaa uniikit arvot lennosta – hyvä tarkistuslistoihin ja validaatioihin.

Tyhjät solut (blanks)

Go To Special → Blanks: valitse tyhjät ja täytä yläpuolisella arvolla (esim. ryhmänimen täyttö).
IF ja ISBLANK: IF(ISBLANK(A2): “N/A”: A2) tai parempi, IF(A2=””: “N/A”: A2), jos tyhjät ovat merkkityhjiä.
Power Queryssa Replace nulls ja Fill Down/Up selkeyttävät datan ennen analyysiä.

Virheiden käsittely

Yleiset virheet: #N/A (ei löydy), #VALUE., #REF., #DIV/0., #NUM., #NAME?, #SPILL.

IFERROR ja IFNA: suojaa raportit kaatumiselta ja tuo ymmärrettävän viestin (“Ei arvoa”).
ERROR.TYPE auttaa diagnosoimaan virheen logiikkaa kaavoissa.
XLOOKUPin if_not_found parametri korvaa IFERROR+lookup -yhdistelmän monesti.

Ehdollinen muotoilu ja datavalidointi

Ehdollinen muotoilu korostaa poikkeamat, arvot ylittää rajan, duplikaatit, top/bottom.
Datavalidointi: pudotusvalikot uniikkiarvoista (UNIQUE), sallittujen arvojen rajaus, päivämääräikkunat. Vähentää syöttövirheitä ennen kuin ne syntyvät.

Kun haluat tehdä tästä siistin ja johdonmukaisen raportin, katso Muotoilu ja kaaviot Excelissä.

Lokalisointi ja alueasetukset

Tarkista erotinmerkit, päivämäärämuodot ja valuuttasymbolit. Yhdenmukaista lähde ja Excelin alueasetukset – virheet vähenevät dramaattisesti.

Kun pidämme duplikaatit, tyhjät ja virheet kurissa jo esikäsittelyssä, koko ketju – suodatukset, haut ja pivotit – toimii niin kuin pitää.

Parhaat ohjeet ja työkalut (artikkelilistaus)

Alla on kuratoitu artikkelilistaus ja työkalut, joihin palaamme itsekin jatkuvasti. Jokainen otsikko on käytännönläheinen polku syvemmälle datan käsittelyyn Excelissä.

Power Queryn perusteet: tuonti, muunnokset ja päivittyvät putket

Milloin käyttää Power Querya vs. suorat kaavat.
Vaiheiden järjestys: tyypitys → suodatus → yhdistäminen → unpivot → lataus.

CSV ja kansiokoonti automaattisesti

“From Folder” -kysely + Append yhdistää kuukausitiedostot automaattisesti.
Erotinvinkit, otsikkorivin tunnistus, dynaamiset tiedostonimet.

XLOOKUP vs. VLOOKUP vs. INDEX+MATCH

Suorituskyky- ja ylläpitonäkökulma.
Monikriteerihaku apuavaimella, usean sarakkeen palautus, if_not_found.

Dynaamiset taulukot: FILTER, SORT, UNIQUE ja SEQUENCE

Rakennetaan interaktiivinen raportti ilman pivotia.
Usean ehdon suodatus ja mukautetut lajittelujärjestykset.

Tekstidatan puhdistus nopeasti

TRIM, CLEAN, SUBSTITUTE, TEXTSPLIT, TEXTAFTER/TEXTBEFORE.
Flash Fill -temput nimiin, koodeihin ja osoitteisiin.

Aikadata oikein: päivämäärät, kuukaudet, viikot, kvartaalit

DATE, EOMONTH, WEEKNUM, TEXT – sekä pivotin päivämääräryhmittely.
Ajanjaksot Power Pivotissa (Date Table) ja DAX: TOTALYTD, SAMEPERIODLASTYEAR.

Pivot-taulukon pikaopas

Ryhmittely, laskentakentät, viipalointi (Slicers), pivot-kaaviot.
Yhdellä taulukolla vs. tietomallilla (suhteet ja mittarit).

Virheiden hallinta ja validointi

IFERROR/IFNA -kuviot, Data Validation -säännöt, ehdollinen muotoilu.
Virheiden audit trail: kaavojen arvostus ja tarkastusnuolet.

Suorituskyky: kun data paisuu

64-bittinen Excel, Power Pivot -tietomalli, binäärimuoto Power Queryssa.
Volatiilit funktiot (OFFSET, INDIRECT) → pyri korvaamaan dynaamisilla taulukoilla.

Excel vai Power BI – milloin kumpi?

Excel: ad hoc -analyysi, mallinnuksen prototypointi, jakaminen pienryhmissä.
Power BI: hallittu jakelu, suuret datamallit, käyttöoikeudet ja päivitysaikataulut.

Pidämme listaa elävänä: teknologiat päivittyvät, mutta periaate pysyy – rakenna toistettava, läpinäkyvä prosessi.

Usein kysytyt kysymykset datan käsittelystä

Kuinka paljon dataa Excel jaksaa käsitellä?

Rivien maksimimäärä laskentataulukossa on ~1,048,576. Käytännössä pullonkaulat tulevat muistista, kaavoista ja muotoiluista. Jos data kasvaa isoksi, käytetään Power Pivotin tietomallia (pakattu sarakevarasto) tai siirrytään Power BI:hin.

Milloin käytämme Power Querya, milloin kaavoja?

Power Query, kun tuonnit toistuvat, lähteitä on useita, pitää yhdistää/pilkoa/normalisoida ja haluamme yhden Päivitä-napin prosessin.
Kaavat, kun tarvitsemme kevyitä, interaktiivisia laskelmia ja dynaamisia näkymiä suoraan taulukossa.

Usein paras ratkaisu on yhdistelmä: Query esikäsittelyyn, kaavat analyysiin.

XLOOKUP vai INDEX+MATCH?

XLOOKUP on luettavampi ja monipuolisempi. INDEX+MATCH on edelleen kelpo, etenkin vanhemmissa Excel-versioissa tai kun tarvitsemme hienovaraisia optimointeja. Jos organisaatiolla on Microsoft 365, käytetään ensisijaisesti XLOOKUPia.

Miten estämme päivämäärä- ja desimaalivirheet tuonnissa?

Määritä oikea kulttuuri Power Queryssa (sarakekohtainen Localized Type), tarkista erotinmerkit ja käytä esikatselussa muutama rivi eri esimerkeistä. CSV:ssä pidä kiinni yhtenäisestä formaattistandardeista (ISO 8601 päivämäärille, piste pilkun sijaan tai päinvastoin – kunhan linja pysyy).

Kuinka poistan duplikaatit turvallisesti?

Tee ensin kopio tai käytä Power Querya, jossa Remove Duplicates on toistettava ja läpinäkyvä vaihe. Tarkista avaimet ja käytä COUNTIFS- tai ehdollista muotoilua, jotta näet, mitä olet poistamassa.

Miten nopeutan hitaaksi käynyttä työkirjaa?

Muuta volatiileja funktioita (OFFSET, INDIRECT) dynaamisiin vaihtoehtoihin.
Minimoi koko taulukon viittaukset: käytä taulukoita (Ctrl+T) ja rajattuja alueita.
Poista ylenpalttinen ehdollinen muotoilu ja upotetut kuvat.
Hyödynnä tietomallia isoissa aggregoinneissa.

Jos tiedosto jumittaa jatkuvasti, käy läpi myös Mallit ja vianmääritys

Voinko yhdistää useita CSV:itä automaattisesti?

Kyllä. Tiedot → Hae tiedot → Kansiosta. Power Query luo yhdistysprosessin, jolla uudet tiedostot päivittyvät mukaan ilman manuaalista yhdistelyä.

Mitä teen, jos XLOOKUP palauttaa #N/A?

Tarkista avaimen datatyyppi (teksti vs. numero), tyhjät/ylimääräiset välilyönnit (TRIM/CLEAN), ja että match_mode on täsmäys. Hyödynnä if_not_found -parametria käyttäjäystävälliseen viestiin.

Miten käsittelen puuttuvat arvot?

Korvaa puuttuvat IFERROR/IFNA:lla tai IF(ISBLANK) -logiikalla Excelissä: Power Queryssa Replace Values, Fill Down/Up ja Conditional Column. Raportoinnissa on usein parempi näyttää 0:n sijaan “–” tai “Ei tietoa”.

Milloin kannattaa siirtyä Power BI:hin?

Kun tarvitsemme hallittua jakelua, käyttöoikeuksia, suuria malleja, jatkuvaa päivitysaikataulua ja interaktiivisia koontinäyttöjä selaimessa. Excel pysyy silti analyytikon työpöydällä – prototypointi ja ad hoc -selvitykset onnistuvat nopeimmin siellä.

, Kun hallitsemme tuonnin, esikäsittelyn, yhdistämisen, suodatukset ja virheiden hallinnan, datan käsittely Excelissä muuttuu raskaasta mekaanisesta työstä ketteräksi analyysiksi. Meidän resepti: rakenna toistettava putki, nimeä vaiheet selkeästi, ja automatisoi pienetkin manuaaliset kohdat. Se näkyy ajassa, jonka säästämme – ja laadussa, johon voimme luottaa.