Tutorial de Web Scraping Python en Español; Scrapy

Existen muchos desarrolladores que aportan conocimiento y su código open source de este lenguaje. Y un grupo de desarrolladores ha compartido Scrapy. Por eso vamos a hacer un Tutorial de web scraping python.

¿Que es Web Scraping?

Mediante programación o software puedes extraer información de sitios web. Normalmente estos simulan, el usuario de un navegador normal y después realizar sus funciones de extraer determinada información.

Con el resultado de web scraping, se puede usar la información para un buen uso o mal uso, depende de ti. Pero muchos usos como; analizar competencia en precios de productos, monitorización de datos, cambios a sitios web y mucho más.

¿Que es Scrapy?

web scrapping python

Scrapy, es un Framework Open Source de Python. Este Framework hace “web scraping”, es decir extraer información o datos de algunos sitios web, digo algunos, por que de seguro habra sitios web, donde no este permitido el web scraping (hablando moralmente) o aparte de que su código este diseñado para no poder extraer cierta información.

¿Que información puedes extraer?

La mayoría que este que contenga el sitio web que deseas extraer, es decir puedes extraer hasta este mismo texto que tú estas leyendo en este momento, los títulos, las imágenes, código HTML e infinidad de datos que te imagines de un sitio web.

¿Cuando usar Web Scraping?

Muchos conocen las API’s, pero no todos los sitios web tienen una API, tambien hay muchos que no permiten el abuso de estas API’s, entonces aquí es cuando puedes usar Scrapy para extraer información de páginas web.

Yo he estado jugando con Scrapy, y la verdad he podido sacar bastante información en segundos, literalmente en segundos, pero depende mucho la cantidad de datos que deseas extraer.

¿Cómo hacer Web Scraping?

Les enseñaremos como usar Scrapy , para explicarles todo lo que aprendimos (aclarando que aún nos falta mucho por aprender), pero como ejemplo vamos a hacer un proyecto de extracción de información de productos en Mercado Libre.

Hicimos una serie de videos tutoriales, para que ustedes puedan entender mejor, espero y me entiendan a mí jaja.

Advertencia: Este tutorial es con fines educacionales, no nos hacemos responsables del mal o bien uso que le puedan dar.

Actualizamos el código, para poder descargar las imágenes, esta parte no sale en el video, pero esta en el código final en nuestro repositorio de Github.

Videos de Tutorial Web Scraping Python

Enlaces adicionales

Conclusión

La verdad estoy muy impresionado, ya que puedes descargar la mayoría de datos que tu deseas de un sitio web, con esta técnica de web scraping python pero bueno esta la parte moral de esta situación, como no es contenido tuyo y no tienes acceso a esa base de datos, estamos de acuerdo que no nos pertenece.

Pero aún así tengo una ideología de que si no quieres que te roben determinado contenido, no lo subas a Internet. Mi punto de vista es que una vez que subes información a Internet es totalmente publico, y te arriesgas a que pasen estas cosas.