Tietomassat ja avoimet sovelluksetLaajuus (15 op)
Opintojakson tunnus: TX00CG60
Opintojakson perustiedot
- Laajuus
- 15 op
Osaamistavoitteet
Opiskelija
- ymmärtää suurten ja heterogeenisten datajoukkojen merkityksen, käsittelyn ja hyödyntämisen avoimessa, linkitetyssä ympäristössä; tätä varten hän pystyy keräämään, valikoimaan ja homogenoimaan eri tietolähteistä saatavaa dataa
- osaa hyödyntää viestinnässä käytettävää digitaalista aineistoa yhdessä avoimesti saatavilla olevan datan kanssa
Sisältö
Tietomassojen haaste
Suurten datajoukkojen käsitteleminen on erittäin haastavaa toimialoilla, joilla tuotettavat sisällöt ovat digitaalisia. Mediateollisuuden sisällöt ovat digitalisoituneet 2000-luvun alusta lähtien lähes kokonaan. Lisäksi jokaisessa yrityksessä tehtävän päätöksenteon tueksi tarvitaan osaamista datan keräämiseen, muokkaamiseen ja analysointiin. Avoimesta datasta on tulossa aikaisempaa enemmän linkitettyä dataa, johon perinteisen tiedonhallinnan menetelmät ja käsitteet eivät tarjoa riittävää tukea.
Tietomassojen lähteitä ja niiden rakenteita
Taloudellisen ja prosesseja ohjaavan tiedon varastointi ja liiketoimintaosaaminen tukevat strategista ja operatiivista päätöksentekoa. Tietovarastojen tyypillisiä datalähteitä ovat suljetut, vain yritysten omassa käytössä olevat tietokannat täydennettyinä ulkoisella datalla, jota saadaan sekä taloustietoja kerääviltä yrityksiltä ja organisaatioilta että julkisyhteisöiltä. Lisäksi yrityksillä on muutakin digitaalista aineistoa, joka osaltaan tuottaa päätöksentekoon tarvittavaa informaatiota.
Käytettävän tiedon valinta on suurten datamassojen yhteydessä kriittistä: tiedon pitää olla ajantasaista, homogeenista, luotettavaa ja mahdollisimman luontevasti hyödynnettävää. Tätä varten on olemassa useita välineitä ja menetelmiä, joiden hallitseminen on keskeistä vallitsevassa kilpailussa riippumatta toimialasta.
Avoimen linkitetyn datan käsittely vaatii erilaisia välineitä kuin perinnäiset tiedonhallintaohjelmistot. Tämä johtuu siitä, että tietoa ei enää kerätä ja taltioida kaikilta osiltaan samalla tavalla kuin ennen, vaan tietoja linkitetään toisiinsa. Tämä vaikuttaa suoraan tallennusmalleihin ja toiminta-arkkitehtuureihin. Koska osa tiedosta on kuitenkin yksityistä, pitää käytössä olla mahdollisuus suojata tällainen data.
Tietomassojen matemaattinen mallintaminen
Suurten ja monimutkaisten datalähteiden tarjoaman tiedon käsittely ja hyödyntäminen ei ole mahdollista ilman ymmärrystä käytettävistä tietokoneohjelmistoista ja niiden soveltamista matemaattisista menetelmistä. Erilaisia valinta- ja muokkausalgoritmeja tarvitaan kaikissa käsittelyvaiheissa, ja tiedon hyödyntämisessä sovelletaan erilaisia tilastollisia menetelmiä. Lisäksi tarvitaan ymmärrys datan luonteesta, jotta sitä voidaan hyödyntää data-analyysin perustana. Toteutuksessa käytetään erilaisia datalähteitä ja käsittely- ja analysointimenetelmiä sekä visualisoidaan saatua informaatiota vuorovaikutteisesti.
Arviointikriteerit, tyydyttävä (1)
Opiskelija on saavuttanut opintojakson minimitavoitteet. Opiskelija tunnistaa, osaa määritellä ja käyttää suurten datajoukkojen yhteydessä käytettäviä käsitteitä ja malleja. Opiskelija ymmärtää massiivisten ja heterogeenisten datajoukkojen hyödyntämisen edellytykset ja periaatteet.
Arviointikriteerit, hyvä (3)
Opiskelija on saavuttanut opintojakson tavoitteet hyvin, vaikka tiedoissa ja taidoissa on joillakin alueilla vielä kehitettävää. Opiskelija osaa hyvin avoimen ja linkitetyn datan käsitteitä ja malleja. Opiskelijalla on valmiuksia soveltaa oppimaansa työelämän tilanteissa. Opiskelija ymmärtää suurten datajoukkojen merkityksen mediatekniikan alalla ja osaa analysoida omaa asiantuntijuuttaan.
Arviointikriteerit, kiitettävä (5)
Opiskelija on saavuttanut opintojakson tavoitteet kiitettävästi. Opiskelija hallitsee kiitettävästi opintojakson aihepiirin käsitteet ja mallit. Opiskelija osaa analysoida sujuvasti ja perustellusti sekä esittää käytännön kehittämistoimenpiteitä. Opiskelijalla on hyvät valmiudet soveltaa oppimaansa
vapaa-ajan, opiskelun ja työelämän tilanteissa. Opiskelija osaa analysoida avoimeen ja linkitettyyn dataan liittyvää asiantuntijuutta ja omaa asiantuntijaksi kehittymistään.
Arviointikriteeri, hyväksytty/hylätty
Opiskelija on saavuttanut opintojakson tavoitteet välttävästi. Opiskelija tunnistaa, osaa määritellä ja käyttää suurten datajoukkojen käsitteitä ja malleja. Opiskelija ymmärtää asiantuntijuuden kehittymisen edellytykset ja periaatteet.