Noticias Suscripciones

rOpenSci potenciando ciencia, acceso y uso de datos

Episodio 29 - 2017-04-23


En este episodio conversamos con Scott Chamberlain de rOpenSci acerca de formas de potenciar la ciencia a través de datos y herramientas que faciliten el acceso y uso de datos valiosos.

Primero un poco acerca de Scott. Pudimos hablar con el en Portland, Oregon. Scott no hizo el típico camino a Data Science pero comenzó en Biología y luego hizo maestrías y doctorado en ecología y evolución. Durante sus estudios estuvo muy expuesto a datos y herramientas.

Luego un poco acerca de rOpenSci. Esta es una organización sin fines de lucro en la Universidad Berkeley que a través de un equipo pequeño potencia una comunidad creciente de gente que prepara librerías R para acceso y uso de datos científicos. Esta organización nació cuando Carl (ahora profesor en UC Berkeley) y Scott coincidieron en un proyecto que requirió la creación de paquetes para accesar datos. Se dieron cuenta que esta era una necesidad importante de muchos científicos y académicos y consiguieron fondos para ayudar a resolver esta problemática en mayor escala.

Pudimos hablar de lo poderoso que es que existan este tipo de comunidades aportando software y soluciones rápidas para todos aquellos científicos que como parte de esta comunidad tienen que resolver problemas con datos y ahora tienen un espacio en la que pueden hacer preguntas y donde hay gente que desde el lado de software puede dedicar tiempo a resolver estos problemas.

Para fortalecer esta comunidad rOpenSci es muy abierta a recibir personas nuevas que quieren contribuir y además tiene una conferencia anual que agrupa a científicos y dateros alrededor del mundo que están interesados en las problemáticas alrededor de acceso y uso de datos. En estas conferencias hay mucha interacción y charlas interesantes y se cultivan las relaciones entre los integrantes de la comunidad.

También pudimos hablar acerca del crecimiento de la comunidad R y hablamos sobre el rol que están jugando las empresas como Microsoft u Oracle que suman cada vez mas al R Consortium para resolver problemas y continuar la evolución.

Pudimos conversar acerca del proyecto Data Refuge buscando rescatar datos relevantes que están publicados en sitios de Gobierno de Estados Unidos y que ahora corren riesgo de desaparecer (tales como datos sobre cambio climático y energía entre otros).

Aprovechamos el rol que tiene Scott en esta comunidad que está apoyando innovación en acceso a datos para preguntarle cuales son las tendencias que él ve en la creación de nuevas librerías o paquetes. Su respuesta giró alrededor de mas herramientas de manipulación de datos. También acerca de presentación y apps, tales como Shiny. Hablamos de herramientas de integración que están surgiendo. También pudimos hablar de los casos en que el uso de R puede generar ventajas.

Como ejemplos de lo que Scott y rOpenSci están actualmente trabajando hablamos sobre Taxonomía (bastante específico para Biología) y otro proyecto para facilitar el consumo de GeoJSON.

Links Relevantes