Kaarel Sõrmuse 2017. aasta bakalaureusetöö raames valminud kantseliidi- ja paronüümituvastaja on saadaval Tartu Ülikooli arvutiteaduse instituudi lõputööde andmebaasis.
Käivitatav fail on tuvastaja.py, tegu on Pythoni programmiga.
See tähendab, et programmi töölepanekuks peavad arvutis olema Python, Java ja bakalaureusetöös eeldusena nimetatud EstNLTK (versioon 1.4). EstNLKT on eesti keele automaattöötlust võimaldav Pythoni teek.
Kuidas kõik vajalik arvutisse saada, kui varem midagi säärast pole
1. Installida Java
Vajalik on Java Runtime (JRE) 1.7 või uuem versioon.
2. Installida programm Anaconda
https://www.anaconda.com/download/
See on keskkond, millesse on mugav EstNLTK (ja Python) panna.
3. Installida EstNLTK
3.1 Käivitada käsurida
Anaconda Prompt (Windowsi puhul)
Terminal (MacOS puhul - vt Utilities->Terminal)
3.2 Luua keskkond õige Pythoniga
Code Block | ||
---|---|---|
| ||
> conda create --name test python=3.5 |
Kus ‘test’ on keskkonna nimi, lihtsalt midagi, kuidas seda edaspidi kutsuda (võib kasutada ka mõnda muud meelepärast nime).
Algne '>' märk näitab, et käsk tuleb kirjutada käsureale, seda kopeerida pole vaja.
3.3 Minna äsjaloodud keskkonda
Code Block | ||
---|---|---|
| ||
> activate test |
3.4 Installida keskkonda EstNLTK
Code Block | ||
---|---|---|
| ||
> conda install -c estnltk -c conda-forge estnltk=1.4.1 |
4. Kantseliidituvastaja
4.1. Tõmmata alla kantseliiidtuvastaja ZIP fail
4.2. Pakkida see lahtu meelepärasesse kataloogi
nt. Documents alla uude kausta "Kantseliit"
Kuidas kantseliidituvastaja käima saada
1.Käivitada käsurida (vt ülevalt. 3.1)
2. Minna oma keskkonda
Code Block | ||
---|---|---|
| ||
> activate test |
3. Minna õigesse kataloogi (sinna, kus asub tuvastaja.py)
Nt. Kui kogu zip on lahti pakitud kausta ‘Kantseliit’, mis asub põhikaustas Documents
Code Block | ||
---|---|---|
| ||
> cd Documents/Kantseliit |
4. Käivitada katseliidituvastaja
Code Block | ||
---|---|---|
| ||
> python tuvastaja.py |
Nüüd peaks avanema vastav programmiaken, kuhu rohke kantseliidiga teksti kirjutada või kleepida (Ctrl+V, MacOSis Cmd+V) saab.
Page properties | ||
---|---|---|
| ||
|