Dans cette formation, nous apprendrons à utiliser Selenium et BeautifulSoup pour faire du web-scraping! Mais en fait, c’est quoi le web-scraping? Le terme peut littéralement être traduit en français par « raclement du web » ou encore par « grattage du web ». Il s’agit donc de la collecte ou bien de l’extraction de données à partir du web. Par la réalisation d’un script dans un langage de programmation quelconque, le web-scraping vous permettra d’extraire le contenu d’un site web.

Cette technique est parfois utilisée à mauvais escient pour plagier des articles provenant de plusieurs sites web, et ce, afin de construire un site web n’ayant comme but que le profit. Heureusement, cette utilisation est désormais punie par les moteurs de recherche comme Google ou Bing. Autrement, cette technique trouve particulièrement écho dans la communauté scientifique et dans les nouvelles technologies. Afin de vous donner une idée des possibilités, voici quelques exemples d’utilisation:

À propos de Joshua L.J. Vachon

Joshua complète présentement une maîtrise en Informatique appliquée à l'histoire (M.A. Histoire) à l'Université de Sherbrooke. Ses recherches portent sur les humanités numériques et la création d'un système alimentaire historique.

Laissez un commentaire