dudzz Le lait, après les céréales | Salut !
Voilà l'histoire je suis très novice dans le Python et je me suis lancé pour créer un petit script qui va récupérer des infos précise dans un tableau html, je m'explique :
J'aimerais pouvoir récupérer une suite de 10 chiffres qui suit après un terme bien précis.
Par exemple il faudrait que le script analyse chaque <td></td> puis dès qu'il trouve la chaine de caractère "Phone#:" sort les 10 chiffre qui suit.
Mon travail jusqu'a maitenent :
Code :
- import mechanize
- from bs4 import BeautifulSoup
- #login
- browser = mechanize.Browser()
- browser.set_handle_robots(False)
- browser.open('http://192.168.0.10/box/reseau-pa4-logs.htm')
- browser.select_form(nr = 0)
- browser.form['loginUsername'] = 'admin'
- browser.form['loginPassword'] = 'admin'
- browser.submit()
- html = browser.response().read()
- # Parser html
- soup = BeautifulSoup(html, "html.parser" )
- soup_2 = soup.findAll("td" )
- print soup_2
|
Ce qui renvoi comme résultat :
Code :
- [<td width="250"><span class="fontestableau">Temps</span></td>, <td width="442"><span class="fontestableau">Description</span></td>, <td>\xa012/9/2015 17:41:19\xa0</td>, <td>\xa0Call States Notify - Line1: Call ended. Phone#: 06xxxxxxxx.\xa0</td>, <td>\xa012/9/2015 17:34:12\xa0</td>, <td>\xa0Call States Notify - Line1: Incoming call from 06xxxxxxxx.\xa0</td>, <td>\xa012/9/2015 17:34:12\xa0</td>, <td>\xa0Call States Notify - Line1: Incoming call from .\xa0</td>, <td>\xa012/9/2015 16:35:27\xa0</td>, <td>\xa0Call States Notify - Line1: Call ended. Phone#: 06xxxxxxxx.\xa0</td>, <td>\xa012/9/2015 16:35:08\xa0</td>, <td>\xa0Call States Notify - Line1: Incoming call from 06xxxxxxxx.\xa0</td>, <td>\xa012/9/2015 16:35:08\xa0</td>, <td>\xa0Call States Notify - Line1: Incoming call from .\xa0</td>, <td>\xa011/9/2015 09:56:47\xa0</td>, <td>\xa0Call States Notify - Line1: Call ended. Phone#: 06xxxxxxxx.\xa0</td>, <td>\xa011/9/2015 09:50:08\xa0</td>, <td>\xa0Call States Notify - Line1: Incoming call from 06xxxxxxxx.\xa0</td>, <td>\xa011/9/2015 09:50:08\xa0</td>, <td align="center"><input align="middle" class="num-button2" type="submit" value="Effacer le journal">\n<input class="num-button2" onclick="window.location.reload();" type="button" value="Actualiser"/></input></td>]
|
Du coup il me faudrait un petit coup de main afin de ressortir uniquement les 10 chiffres du numéro de téléphone qui suit le termes "Phone#:"
Merci d'avance de votre aide !
|