Extraire image lien avec Beautiful Soup

Recherche :

Mot : Pseudo : Filtrer
Bas de page
Auteur	Sujet : Extraire image lien avec Beautiful Soup

erwan83

Du Shift DEL tu te méfieras !

Bonjour
J'ai trouvé comment extraire le texte d'un lien
exemple
<a href="tuttut">TEXTE</a>
me renvoie "TEXTE"

Je voudrais extraire une image sur le même principe
exemple
<a href="tuttut"><img src="photo.jpg"></a>
devrait me renvoyer
"photo.jpg"

Seulement, ça ne renvoie rien...
Avez-vous la solution ?

Code :

data = page.text
soup = BeautifulSoup(data, features="html.parser" )
for link_brut in soup.find_all('a'):
link = link_brut.get('href')
texte = link_brut.text

J'ai trouvé ce code que j'ai ajouté entre la 2eme et la 3eme lignes mais rien ne se passe

Code :

data = page.text
soup = BeautifulSoup(data, features="html.parser" )
image_links = [x['data-img'] for x in soup.find_all('a', rel='popover')]
for link in image_links:
print(link)

---------------
http://www.ypikay.com

Publicité

erwan83

Du Shift DEL tu te méfieras !

Je sais que ça ne se fait pas mais ....
Personne n'a un bout de code SVP ?

---------------
http://www.ypikay.com

mechkurt

J'ai pas forcement tout compris mais dans ton premier code tu utilises un parser pour récupérer toutes les balises <a /> et en extraire le lien href et le contenu textuel.

Par contre dans le 2eme (je ne connais pas BeautifulSoup mais on peut essayer de deviner), on dirait que tu prend toutes les balises ayant un attribut data-img (image_links = [x['data-img']) et qu'en suite tu boucles sur ces "noeuds" pour trouver des enfants <a /> ayant l'attribut rel='popover' (for x in soup.find_all('a', rel='popover')]).
Clairement, tout ça ne vas pas t'aider à trouver la valeur d'attribut "src" dans des <img />

Encore une fois plutôt que copier / coller des fragments de code essaye de comprendre la logique des sélecteurs et des boucles dans BeautifulSoup.

J’imagine que pour cibler des <img /> dans des <a /> tu dois pouvoir faire un truc du genre :

Code :

data = page.text
soup = BeautifulSoup(data, features="html.parser" )
for link_brut in soup.find_all('a'):
for img_brut in link_brut.find_all('img'):
src= img_brut.get('src')

Message édité par mechkurt le 12-06-2023 à 12:33:57

---------------
D3

erwan83

Du Shift DEL tu te méfieras !

oui j'ai testé mais il ne me renvoie strictement rien d'où ma question !

---------------
http://www.ypikay.com

mechkurt

Je connais peu Python et pas du tout BeautifulSoup, probable que le retour d’itération de ta première boucle n'a pas de méthodes pour filtrer comme la 2eme ?
Tu affiche les erreurs et aucun message pertinent ne t’aiguille sur une solution ?
Et quid de faire des print a chaque tout de boucle pour voir ce qu'il en est ?

Code :

import lxml
import requests
from bs4 import BeautifulSoup
from selenium import webdriver
def test():
url = "https://asheville.craigslist.org/search/fua"
driver = webdriver.Firefox()
driver.get(url)
html = driver.page_source.encode('utf-8')
soup = BeautifulSoup(html, "lxml" )
for post in soup.find_all('li', "result-row" ):
for post_content in post.find_all("a", "result-image gallery" ):
print(post_content['href'])
for pic in post_content.find_all("img" ):
print(pic['src'])

https://stackoverflow.com/questions [...] lsoup?rq=3

---------------
D3

gilou

Modérateur
Modzilla

Ca semble assez clair, au vu de ce que tu as posté :

Code :

data = page.text
soup = BeautifulSoup(data, features="html.parser" )
for image in soup.find_all('img'):
source = image.get('src')
texte = source.text

A+,

---------------
There's more than what can be linked! -- Iyashikei Anime Forever! -- AngularJS c'est un framework d'engulé! --

FORUM HardWare.fr

Programmation

Python

Extraire image lien avec Beautiful Soup

Sujets relatifs
Pourquoi j'ai cette erreur lorsque je met une image dans un bouton ou	Comment charger une image ?
Image décorative qui pixelise avec mise a l'échelle de windows	lien flash - excel en vba sans etre en réseau
Script bash/python extraire données bdd	Galerie d'image automatique
Découper une image en morceaux pour éviter la copie trop facile	Insertion image en html depuis mon ordi
[Ada][Adacore] Problème d'édition de lien avec GPS	responsive scroll pas quand je glisse l'image
Plus de sujets relatifs à : Extraire image lien avec Beautiful Soup

Page générée en 0.088 secondes