Filosofian tietoteoria ja sovelletun matematiikan informaatioteoria tarkastelevat tietoa ja sen johdannaisia eri näkökulmista. Ne kumpikin kuitenkin erottelevat tiedon, informaation ja datan käsitteet.
Data on järjestäytymätöntä, sillä ei ole semanttista merkitystä. Dataa ovat esimerkiksi sanan ”domo” yksittäiset kirjaimet, eivät ne tarkoita mitään.
Tieto on ”hyvin perusteltu tosi uskomus”. Tiedolla on siis jokin merkitys, joka ei riipu yksittäisen ihmisen tulkinnasta. Tieto on järjestäytynyttä: ”domo” tarkoittaa siis taloa.
Informaatio on tulkittua tietoa, ihmisen mielikuvaa jostakin. Sinun ”domo” on erilainen kuin minun.
Sana ”data” on alkujaan latinan sanan ”datum” (jokin annettu) monikko, siis ”jotkin annetut”. Sanan merkitys on sittemmin siirtynyt tarkoittamaan päivämäärää (”päivälle annettu tunnus”), ja tässä merkityksessä sana esiintyy englannin kielessä ensimmäisen kerran 1600-luvulla.
Tietojenkäsittelyn jumalhämärässä 1940-luvulla tarvittiin uusi sana kuvaamaan tietoa, joita tietokoneet käsittelevät. Koska kyseessä oli koneille annettu tieto, valituksi tuli sana ”data”. Suomeksi tässä ei ole mitään ongelmaa, päivämäärä on päivämäärä ja data on dataa. Indoeurooppalaisten kielten puhujille tämä aiheutti sekaannuksen. Mikä sana tarkoittaa päivämäärää? Mikä dataa? Mitkä ovat näiden sanojen yksikkö- ja monikkomuodot (*)?
Indoeurooppalaisten kielten vaikutuksesta jotkut esperanton puhujat sotkevat vielä nämä, vaikka esim. esperanton keskeisiin sanakirjoihin kuuluva Plena Ilustrita Vortato PIV erottelee ne selkeästi.
- dato on päivämäärä ja edelleen esim. dati: 1) merkitä päivämäärä 2) määrittää päivämäärä
- dateno on data ja edelleen esim. datenopo: 1) tietue 2) tietuetietotyyppi
Usein näkee datasta käytettävän sanaa datumo, joka hyödyntää epämääräisyyttä osoittavaa um-päätettä. Mielestäni tämä on kuitenkin harhaanjohtava: miten päivämäärä vääntyisi dataksi?
Alkuperäisen latinan merkityksen ”jokin annettu” sisältää sana donitaĵo. Sanahan on muodostettu verbin ”antaa”, doni, passiivin menneestä partisiipista (-it-) ja käsitteen ilmenemismuotoa ilmaisevasta aĵ-päätteestä ynnä substantiivin tunnuksesta ‑o: doni + ‑it- + ‑aĵ- + o. Minusta donitaĵo ei kuitenkaan ole käyttökelpoinen sana. Yhtä vähän kuin nykyihminen mieltää päivämäärän dataksi tai toisinpäin hän miellä dataa annetuksikaan. Data on merkitykseltään täysin irtautunut päivämäärästä tai ”jostain annetusta”.
Informaatio on siis informo, tieto scio ja data dateno. Lisäksi on käsite tietämys, sciado, joka kokoaa ihmisen tai tietojärjestelmän tiedot yhteen.
*: Allekirjoittanut on saanut tapella tästä ruotsin kielen kohdalla vielä tällä vuosisadalla. Olo oli kuin olisin siirynyt johonkin pimeään keskiaikaan.