Criando um Web Crawler para pegar as informações diretamente no site do Cartola FC
Neste post vou ensinar como criar um web crawler para pegar as informações no site do Cartola FC e assim criar suas próprias estatísticas, índices, etc... Mas afinal, o que é um web crawler? Segundo a Wikipedia, "é um programa de computador que navega pela World Wide Web de uma forma metódica e automatizada.". No caso do Cartola FC, queremos acessar o site e pegar todas as informações referentes a tabela de busca, de todos os jogadores.
Então a ideia básica é acessar o site do Cartola FC, pegar o código fonte e tratá-lo de alguma maneira de forma a restar apenas as informações que são de seu interesse.
A imagem abaixo exibe como exemplo o jogador Fred (com a tabela que é apresentada ao usuário) e um respectivo pedaço do código fonte.
No próximo post vou por o código para fazer isso utilizando a linguagem R.
Para quem quiser os dados em formato .csv, aqui está:
https://dl.dropboxusercontent.com/u/46482875/rodada1-brasileirao.csv
Opa! Blz? Grande dica! Estou aguardando seu prox. post!
Voce por acaso tem o CSV das outras rodadas também?
Abs e parabens pela iniciativa
Olá,
Bom, acabei abandonando o que estava fazendo. Mas tenho os dados sim, exceto o da penúltima rodada que esqueci de pegar. Haha. Mas basta me mandar um e-mail que eu te envio.
Cara, sabe como fazer isso com PHP? O cURL não tá rolando.
Tem que estar logado? Como fazer em PHP?