Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

Kaarel Sõrmuse 2017. aasta bakalaureusetöö raames valminud kantseliidi- ja paronüümituvastaja on saadaval Tartu Ülikooli arvutiteaduse instituudi lõputööde andmebaasis.

Käivitatav fail on tuvastaja.py, tegu on Pythoni programmiga.

See tähendab, et programmi töölepanekuks peavad arvutis olema Python, Java ja bakalaureusetöös eeldusena nimetatud EstNLTK (versioon 1.4). EstNLKT on eesti keele automaattöötlust võimaldav Pythoni teek.

Kuidas kõik vajalik arvutisse saada, kui varem midagi säärast pole

1. Installida Java

Vajalik on Java Runtime (JRE) 1.7 või uuem versioon.

https://java.com/en/download/

2. Installida programm Anaconda

https://www.anaconda.com/download/

See on keskkond, millesse on mugav EstNLTK (ja Python) panna.

3. Installida EstNLTK

3.1 Käivitada käsurida

  • Anaconda Prompt (Windowsi puhul)

  • Terminal (MacOS puhul - vt Utilities->Terminal)

3.2 Luua keskkond õige Pythoniga

Code Block
themeRDark
> conda create --name test python=3.5

Kus ‘test’ on keskkonna nimi, lihtsalt midagi, kuidas seda edaspidi kutsuda (võib kasutada ka mõnda muud meelepärast nime).

Algne '>' märk näitab, et käsk tuleb kirjutada käsureale, seda kopeerida pole vaja.

3.3 Minna äsjaloodud keskkonda

Code Block
themeRDark
> activate test

3.4 Installida keskkonda EstNLTK

Code Block
themeRDark
> conda install -c estnltk -c conda-forge estnltk=1.4.1

4. Kantseliidituvastaja

4.1. Tõmmata alla kantseliiidtuvastaja ZIP fail

4.2. Pakkida see lahtu meelepärasesse kataloogi
nt. Documents alla uude kausta "Kantseliit"


Kuidas kantseliidituvastaja käima saada

1.Käivitada käsurida (vt ülevalt. 3.1)

2. Minna oma keskkonda

Code Block
themeRDark
> activate test

3. Minna õigesse kataloogi (sinna, kus asub tuvastaja.py)

  Nt. Kui kogu zip on lahti pakitud kausta ‘Kantseliit’, mis asub põhikaustas Documents

Code Block
themeRDark
> cd Documents/Kantseliit

4. Käivitada katseliidituvastaja

Code Block
themeRDark
> python tuvastaja.py

Nüüd peaks avanema vastav programmiaken, kuhu rohke kantseliidiga teksti kirjutada või kleepida (Ctrl+V, MacOSis Cmd+V) saab.

 



Page properties
hiddentrue


Related issues