Siirry pääsisältöön

Tiedonhaku tietokannoista

Perustietoa tietokannoista, tiedonhausta ja hakukielistä.

Boolen logiikka -  hakujoukkojen yhdistämistä operaattoreilla


Tiedonhaku perustuu algebraan

Tiedonhaku digitaalisissa tietokannoissa perustuu matemaattiseen (tarkemmin algebra) ajatteluun: jokainen hakusana muodostaa hakutuloksessa yhden hakujoukon. Kun tehdään useamman kuin yhden hakusanan tiedonhaku, yhdistetään silloin hakujoukkoja keskenään. Yhdistämisen perustana on Boolen logiikka (linkki Wikipediaan)
 

Tiedonhakukieli ei ole luonnollista kieltä

Tiedon hakeminen ei sinänsä vaadi syvällistä matemaattista ajattelua. Työtäsi kuitenkin helpottaa, kun muistat, ettei tietokantojen kanssa "keskustella" kuin ihmiselle. Koneelta puuttuu, ainakin vielä, ihmisen monipuolinen kyky ymmärtää viestin lähettäjää ja olla joustavan interaktiivinen. Siksi tietokantojen kanssa käytetään komentokieltä, jonka pitää perustua loogisiin, konekielisiin hakulausekkeisiin. Muuta kone ei ymmärrä.

Edistyneimmät tietokannat, kuten Google, lähestyvät tekoälyyn pohjautuvassa teknisessä kehityksessä ihmismielen joustavuutta esimerkiksi hahmottamalla synonyymejä, korjaamalla kirjoitusvirheitä ja hyväksymällä hakuun sanan kaikki taivutusmuodot automaattisesti sekä muistamalla, minkä tyylistä tietoa olet aikaisemmin hakenut ja mistä olet kiinnostunut. Tällaisia tiedonhakijaa "ymmärtäviä" tiedonhakuohjelmia ei ole kuitenkaan paljon, joten pienemmissä nettitietokannoissa ja ammattikäytössä olevissa järjestelmissä tiedonhakujen loogisuuden ja täsmällisyyden vaade on edelleen ehdoton.
 

Boolen logiikan kolme komentoa: JA TAI EI

Monimutkaisimmissa hauissa käytetään useampaa kuin yhtä hakusanaa. Silloin hakusanat yhdistetään aina Boolen logiikan mukaisesti. Kun käytät useampaa hakusanaa samassa haussa, ilmoitat koneelle (tietoisesti tai tietämättäsi) aina myös, miten nämä hakusanajoukot yhdistyvät toisiinsa. Operaattorit JA, TAI ja EI ovat välineitä, joilla ilmoitat haluamasi yhdistämistavan. Vaikka tiedonhaussa käytettäisiin samoja hakusanoja, mutta operaattori vaihtuu, on tulos aina erilainen. Näihin operaattoreihin ja kahteen JA-haun sovellukseen perehdytään seuraavilla alasivuilla.