Quer saber como construir um rastreador e analisador de sites escalável? Implemente um projeto para rastrear, coletar, extrair conteúdo e armazená-lo em escala de maneira distribuída e tolerante a falhas.
Você poderá acessar todo o código final aqui: no GitHub.
Sobre o autor: Ander Rodríguez é um desenvolvedor web que trabalha em várias startups há mais de 10 anos, tendo trabalhado com uma grande variedade de setores e tecnologias. Engenheiro que virou empresário.
Siga o link: https://www.zenrows.com/blog/mastering-web-scraping-in-python-scaling-to-distributed-crawling
Imagem de Gerd Altmann por Pixabay