Uvod u jezik PYTHON

(priručnik za  predmet "Skript jezici")


© Matematički fakultet

Miljana Mladenović, Duško Vitas

O Python-u
Instalacija
Sintaksa jezika Python
Osnovne osobine
Službene reči
Operatori i njihovi prioriteti
Osnovne algoritamske strukture
Blok naredbi
if struktura
while struktura
Iskazi: break, continue, pass
Tipovi podataka u Python-u
Osnovni i ugradjeni tipovi
Brojevi
Konverzija formata
Neke matematičke funkcije
Neke random funkcije
Stringovi
Neke string funkcije
Formatiranje stringova
Liste
Torke
Osnovni izrazi sa torkama
Rečnici
Skupovi
Operacije nad skupovima
Datoteke
Funkcije modula os za rad sa datotekama
Funkcije modula os za rad sa folderima
Izuzeci
Funkcije
Moduli
Paketi
Klase
Regularni izrazi
Baze podataka
Primeri u Netbeans-u

Instalacija Python-a za OS Windows

Python se ne instalira podrazumevano u folderu Program files, već u folderu c:\PythonXX gde je  XX oznaka verzije instalacije. Npr. c:\Python26 je folder u kome je instalirana verzija 2.6  Opcije za instalaciju date su na slici 1.

 

slika  1. Instalacija Python-a

             

Potreban prostor na disku za verziju Python 2.6  je 50MB.

Da bi Python2.6 bio dostupan iz DOS shell-a, u Environment Variables treba varijabli PATH dodati:

  • vrednost c:\Python26-za poziv interpretera
  • vrednost c:\Python26\Scripts za izvršenje ostalih dodatih skripti.

Poziv interpretera iz komandne linije:  C:\> python

Sledeći korak u instalaciji je kompajler za Windows -  MinGW. Može se naći na adresi: http://sourceforge.net/projects/mingw/ , детаљније на: http://www.mingw.org/

Trenutno aktuelna verzija MinGW GCC 4.5.0 Installer. To nije GUI već alat ograničen na rad iz komandne linije. Problem kod instalacije je što se kod aktuelne verzije mingw-get-inst-20100909 , iako je dozvoljeno, instalacija ne može izvesti bez problema na disku koji nije C.

Videti sliku 2.

 

slika 2. Izbor putanje za instalaciju MinGW

             

Da bi MinGW bio dostupan iz DOS shell-a, u Environment Variables treba varijabli PATH dodati:

c:\MinGW\bin

             

Zatim je potrebno instalirati i PyYAML (slika 3). Instalacija se može preuzeti sa adrese:

http://pyyaml.org/download/pyyaml/PyYAML-3.09.win32-py2.6.exe

             

 

slika 3.  Instalacija PyYAML

             

Što se tiče editora, za Python prirodno okruženje za razvoj mogu biti VIM http://www.vim.org (slika 4) ili EMACS http://www.gnu.org/software/emacs

             

 

slika 4. Instalacija VIM okruženja

             

Od GUI okruženja, NetBeans IDE počev  od verzije 6.5 ima plug-in  Python Early Access (EA)  (slika 5)  koji se može preuzeti sa adrese http://dlc.sun.com.edgesuite.net/netbeans/6.5/Python/ea/ . Uz ovaj dodatak, očekuje se verzija Python-a u verziji najmanje 2.5.

 

slika 5.  Instalacija NetBeans IDE

             

Nakon instalacije, veličine 104.2 MB,  Python Platforms Manager se koristi za konfigurisanje Python i  Java paths vrednosti (slika 6).

 

slika 6. Konfigurisanje Python i  Java paths  vrednosti

U NetBeans-u izborom opcije menija Tools > Python Platforms Manager,  može se postaviti podrazumevana verzija: Python ili Jython.

        

Instalacija Natural Language Toolkit-a

NLTK kreiran je 2001. na Univerzitetu Pensilvanija, odsek za kompjuterske nauke. Od tada je svoj doprinos razvoju ovog alata dao veliki broj univerziteta. NLTK je organizovan u vidu modula, a najvažniji su:

Language processing task     NLTK modules                     Functionality                                                                            

Accessing corpora                        nltk.corpus                              standardized interfaces to corpora and lexicons

String processing                          nltk.tokenize, nltk.stem         tokenizers, sentence tokenizers, stemmers

Collocation discovery                   nltk.collocations                     t-test, chi-squared, point-wise mutual information

Part-of-speech tagging                 nltk.tag                                     n-gram, backoff, Brill, HMM, TnT

Classification                                  nltk.classify, nltk.cluster        decision tree, max.entropy, naive Bayes, EM, k-means

Chunking                                        nltk.chunk                                regular expression, n-gram, named-entity

Parsing                                            nltk.parse                                 chart, feature-based, unification, probabilistic, dependency

Semantic interpretation              nltk.sem, nltk.inference        lambda calculus, first-order logic, model checking

Evaluation metrics                        nltk.metrics                             precision, recall, agreement coefficients

Probability and estimation          nltk.probability                       frequency distributions, smoothed probability distributions

Applications                                   nltk.app, nltk.chat                   graphical concordancer, parsers, WordNet browser, chatbots

Linguistic fieldwork                      nltk.toolbox                             manipulate data in SIL Toolbox format                                    

             

NLTK je implementiran da postigne 4 primarna cilja:

  • jednostavnost u kreiranju okruženja i struktura koje obezbeđuju primenu NLP-a
  • doslednost  pri formiranju uniformnog okruženja, interfejsa i struktura podataka
  • Proširivost kojom se obezbeđuje struktura u koju se mogu uključiti novi softverski moduli
  • Modularnost radi obezbeđenja komponenti koje se mogu koristiti samostalno bez potrebe za razumevanjem ostatka alata

             

Instalacija se može preuzeti sa adrese: http://www.nltk.org/download.

             

 

slika  7.  Izbor instalacije Python-a

             

Moduli sa korpusima mogu se naći na adresi: http://www.nltk.org/data

             

I mada je Python 3.0 dostupan, mnogi paketi koje  NLTK zahteva još uvek nemaju implementaciju za verziju 3.0.  Stoga se preporučuje upotreba NLTK sa Python verzijama 2.4.*,  2.5.*  ili 2.6.*

Nakon instalacije za Windows OS, nltk-2.0b9.win32.exe, treba preuzeti i korpuse za testiranje i instalirati ih.   Podrazumevani folder na koji se preuzimaju podaci  je:

c:\Documents and Settings\user\Application Data\nltk_data

Da bi se instalirao korpus, treba pozvati daunloader iz  Python Command Prompt-a na način:

    >>> import nltk

    >>> nltk.download()

 

 

slika  8. Instalacija korpusa pozivom nltk.download()

 

 

 

 

 

                                            slika  9. Proces instalacije pregledom statusa

 

Postoje i Python prevodioci  koji kod prevode u mašinski jezik. Oni omogućavaju da se stvore izvršni moduli nezavisni od interpretera i  da se programi izvršavaju malo brže. Ono što se gubi ovakvim prevođenjem je prenosivost izvršnog fajla na različite operativne platforme.

             

Postoje 3 načina aktiviranja  programa (aplikacije) na Windows platformi:

1.       Interaktivni – pokretanjem Python interpretera

2.       (default) sačuvati programski kod u fajlu npr. ime.py, zatim u komandnoj liniji pozvati fajl na izvršenje:   python ime.py

3.       kreirati izvršni fajl ime. exe

       kreiranje ime.exe izvršnog fajla od ime.py fajla alatom py2exe

       poziv ime. Exe

 

Beograd, novembar 2010.