Importar tablas o listas usando Google Sheet
Quizás esto que voy a intentar explicar les resulte una pavada, pero suele pasarme que al leer trabajos que toman tablas o listas de sitios web, me encuentro con: capturas de pantalla de las tabla o listas (lo que hace que después los datos no se puedan manipular), o que están copiadas y pegadas en una planilla de texto o de cálculo pero con formatos horribles y que no se actualizan automáticamente.
Ahora, ¿sabías que hay una forma más simple y también "reutilizable" de importar tablas y listas?
Podés crear una planilla en Google Sheets e importar la tabla en un ratito usando la función importHTML. Esta función está compuesta por:
- url: es la dirección del sitio desde el que vamos a importar las tablas o listas que nos interesan.
- query: indica qué vamos a importar, si son tablas o listas.
- index: indica la posición (en el sitio original) de eso que vamos a importar. A diferencia de url y query, no se escribe entre comillas.
Para importar cualquier tabla desde un sitio, tenés que hacer click en una celda, y escribir:
=importHTML("url"; "query"; index)
En url copiamos la dirección desde la que se va a importar, en query indicamos el formato de lo que importamos (list o table) y en index la posición que tiene eso en la página de origen.
Vamos con un ejemplo. Supongamos que quieren importar la lista de casos de Coronavirus de worldometers, que hoy (15 de junio de 2020) es algo así:
la tabla sigue... Para eso, lo que debemos hacer estimar una celda vacía, y escribir lo siguiente:
=IMPORTHTML("https://www.worldometers.info/coronavirus/?"; "table"; 1)
y nos va a quedar una tabla que se actualiza automáticamente cada vez que reciba cambios en el sitio desde el que la importamos, y en este caso se ve así:
Espero que se haya entendido. No solo es importante para que podamos manipular los datos, sino también para mantenerlos actualizados y poder generar, por ejemplo, visualizaciones que tomen datos de nuestra planilla y se actualicen de manera automática. Esto nos ahorra, entre otras cosas, que tengamos que chequear actualizaciones y hacer modificaciones 24/7.