#!/usr/bin/env python3
'''
Webový mini-prohlížeč
----
Verze: 1
Autor: David Roesel, roesel@gmail.com
Web: http://david.roesel.cz/python
Popis:
        Podívá se pomocí modulu urllib na webové stránky a vypíše jejich HTML kód bez tagů.
        (Psáno pro Python 3.2, indentace 4x mezera.
         Kód je volně šiřitelný pod licencí Creative Commons Attribution 3.0 Unported)
'''
## Vytvoření objektu na stahování z webu, falšování prohlížeče a zadání adresy
import urllib.request
opener = urllib.request.build_opener()
opener.addheaders = [('User-agent', 'Mozilla/5.0')]
address = 'http://david.roesel.cz/python/'

## Otevření, načtení, dekódování stránky a její převod na běžný textový řetězec
html_old = str(opener.open(address).read().decode('utf8', 'replace')) #Původní HTML
html=""
u=False #Nacházím se právě v tagu?
for l in html_old: #Pro každé písmenko v původním HTML kódu zkontroluj
    if l=="<": #Pokud je "<", nastav, že jsme v tagu
        u=True
    elif not u: #Jinak pokud nejsme v tagu, přidej toto písmeko do výstupního kódu
        html += l
    elif l==">": #Jinak pokud je ">", nastav, že nejsme v tagu
        u=False
print(html) #Vypiš výstupní kód

