Alternatives à Selenium
Dans le présent cours, nous avons utilisé Selenium pour faire du web-scraping, mais sachez qu’il existe des alternatives. Selenium est particulièrement intéressant pour automatiser des tâches ou effectuer des tests sur un navigateur. Pour autant, vous pouvez également utiliser le module Beautiful Soup ou Scrapy.
Beautiful Soup
Installation
>> pip install beautifulsoup4
Pour en savoir plus
- Documentation: https://www.crummy.com/software/BeautifulSoup/bs4/doc/
- Parser vos XML et HTML: https://python.doctor/page-beautifulsoup-html-parser-python-library-xml
- Beautiful Soup comme un chef (UQAM) *: http://jhroy.ca/uqam/edm5240/BeautifulSoup-DocAbregee.pdf
Scrapy
Installation
>> pip install scrapy
Pour en savoir plus
- Documentation: https://docs.scrapy.org/en/latest/
- Making Web Crawlers Using Scrapy for Python: https://www.datacamp.com/community/tutorials/making-web-crawlers-scrapy-python