← Volver

Cómo obtener todos los enlaces de una página web

El método más sencillo es utilizando Beautiful Soup, una pontente librería para analizar contenido HTML.

from urllib.request import urlopen
from bs4 import BeautifulSoup

r = urlopen("https://www.wikipedia.org/")
bs = BeautifulSoup(r.read(), "html.parser")
r.close()

for link in bs.find_all("a"):
    print(link.get("href"))

Para ejecutar este código primero debe instalarse el módulo bs4.

pip install beautifulsoup4

urllib url beautiful-soup html

👨‍💻 ¡Ya lanzamos el curso oficial de Recursos Python en Udemy! Un curso moderno para aprender Python desde cero con programación orientada a objetos, SQL y tkinter en 2024.

🐍 También te puede interesar:

💡 Ofrecemos servicios profesionales de desarrollo y capacitación en Python a personas y empresas. Consultanos por tu proyecto.