Johdanto * wordnet on.. WordNet on sähköinen sanastotietokanta (engl. electrical lexical database), jossa sanojen (lexicalized concept; synonym set) suhteet muihin sanoihin on määritelty. Sanasto sisältää substantiiveja, verbejä, adjektiiveja ja adverveja. - ch 16: concept and context independent - largest machine readable dictionary: n. 168 000 sanaa, 91 600 synsets -> concepts, 345 000 relations * synsets: - sanaselitys (gloss) [komments] [käyttöesim.] ~synsets -> DAG: A directed graph where no path starts and ends at the same vertex. ~ interaction -> [ ap[mutual|reciprocal] np[action] ] * suhteet/relaatiot * kysymys: text inference * Sovellukset - tekstihaut (text retrieval). Indeksoidaan T-vektoriin tekstikokoelman "distinct terms". Monesti termien merkitsevyys painotetaan a) niiden ao. dokumentissa (tekstissä) esiintymiskertojen suhteessa ja b) käänteisessä suhteessa siihen, monessako dokumentissa termi esiintyy. ~ homograafit (eri käsite) ~ synonyymit (eri sana) * ch 16: - väite: desire: rich connectivity, small set of relation types; fewer rel. types -> vähemmän päättelysääntöjä -> yksinkertaisempi päättelymekanismi - goal: TEXT INFERENCE: Ei-eksplisiittisen relevantin iedon päätteleminen explisiittisestä. Text inference: http://www.google.fi/search?q=%22text+inference%22&ie=UTF-8&oe=UTF-8&hl=fi&lr= TRANSITIVE "2. a. Gram. Of verbs and their construction: Expressing an action which passes over to an object; taking a direct object to complete the sense. "