Kaarel Sõrmuse 2017. aasta bakalaureusetöö raames valminud kantseliidi- ja paronüümituvastaja on saadaval Tartu Ülikooli arvutiteaduse instituudi lõputööde andmebaasis.

Käivitatav fail on tuvastaja.py, tegu on Pythoni programmiga.

See tähendab, et programmi töölepanekuks peavad arvutis olema Python, Java ja bakalaureusetöös eeldusena nimetatud EstNLTK (versioon 1.4). EstNLKT on eesti keele automaattöötlust võimaldav Pythoni teek.

Kuidas kõik vajalik arvutisse saada, kui varem midagi säärast pole teinud

1. Installida Java

Vajalik on Java Runtime (JRE) 1.7 või uuem versioon.

https://java.com/en/download/

2. Installida programm Anaconda

https://www.anaconda.com/download/

See on keskkond, millesse on mugav EstNLTK (ja Python) panna.

3. Installida EstNLTK

3.1 Käivitada käsurida

  • Anaconda Prompt (Windowsi puhul)

  • Terminal (MacOS puhul - vt Utilities->Terminal)

3.2 Luua keskkond õige Pythoniga

> conda create --name test python=3.5

Kus ‘test’ on keskkonna nimi, lihtsalt midagi, kuidas seda edaspidi kutsuda (võib kasutada ka mõnda muud meelepärast nime).

Algne '>' märk näitab, et käsk tuleb kirjutada käsureale, seda kopeerida pole vaja.

3.3 Minna äsjaloodud keskkonda

> activate test

3.4 Installida keskkonda EstNLTK

> conda install -c estnltk -c conda-forge estnltk=1.4.1

4. Kantseliidituvastaja

4.1. Tõmmata alla kantseliidituvastaja ZIP fail

4.2. Pakkida see lahti meelepärasesse kataloogi
nt. Documents alla uude kausta "Kantseliit"


Kuidas kantseliidituvastaja käima saada

1.Käivitada käsurida (vt ülevalt. 3.1)

2. Minna oma keskkonda

> activate test

3. Minna õigesse kataloogi (sinna, kus asub tuvastaja.py)

  Nt. Kui kogu zip on lahti pakitud kausta ‘Kantseliit’, mis asub põhikaustas Documents

> cd Documents/Kantseliit

4. Käivitada katseliidituvastaja

> python tuvastaja.py

Nüüd peaks avanema vastav programmiaken, kuhu rohke kantseliidiga teksti kirjutada või kleepida (Ctrl+V, MacOSis Cmd+V) saab.