← Volver

Cómo obtener todos los enlaces de una página web

El método más sencillo es utilizando Beautiful Soup, una pontente librería para analizar contenido HTML.

from urllib.request import urlopen
from bs4 import BeautifulSoup

r = urlopen("https://www.wikipedia.org/")
bs = BeautifulSoup(r.read(), "html.parser")
r.close()

for link in bs.find_all("a"):
print(link.get("href"))

Para ejecutar este código primero debe instalarse el módulo bs4.

pip install beautifulsoup4


¿Alguna duda sobre este código? ¡Preguntanos en el foro!