Recicladores de Datos: ¿Cómo extraemos conocimiento de grandes volúmenes de datos?

En los últimos dos años se generaron más datos que en toda la historia de la humanidad. Este hecho no es fundamentalmente distinto de otros similares que cada año son noticia en el campo de la computación  respecto a la capacidad de cómputo, capacidad de almacenamiento, velocidad de las redes de comunicación, por mencionar los tres más famosos. Estos anuncios se repiten año a año, prácticamente desde los años 60. Lo que ahora sí es nuevo es que el ritmo de producción de los datos, su volumen y su variedad es tal que permiten una nueva clase de algoritmos y procesos de análisis que nos ayudan a descubrir conceptos y relaciones latentes en las grandes colecciones de datos.
Café Científico del 9 de Julio
Café Científico del 9 de Julio
Gracias a esto podemos entender mejor nuestro entorno y tomar decisiones con una mayor precisión. Esta nueva realidad abarca multitud de ámbitos del conocimiento y la industria, desde retos de visión por computadora (reconocimiento de objetos y/o rostros), hasta problemas de marketing empresarial (descubrimiento de patrones del comportamiento de clientes, o de su consumo), pasando por aplicaciones en Bioinformática, Astrofísica, producción industrial, conducción automática de vehículos y muchas otras. La presente charla pretende compartir con la audiencia esta noción de “descubrimiento automático de conocimiento” y promover un debate sobre sus implicaciones en nuestras vidas diarias.

 


Raúl Ramos Pollan, es profesor de la Escuela de Ingeniería de Sistemas e Informática de la Universidad Industrial de Santander y lidera el área de Analítica de Datos a Gran Escala en el Centro de Cálculo Científico y Supercomputación de la UIS. Su carrera se ha desarrollado entre la industria y la academia. Fue director del Centro Extremeño de Tecnologías Avanzas, un centro de cómputo público en España dedicado al desarrollo de proyectos de computación avanzada con un foco especial en América Latina. Dirigió el departamento de software de Pildo Labs, una PYME basada en Barcelona, España, dedicada al desarrollo de soluciones en el sector aeronáutico y fue también Arquitecto de Software en Sun Microsystems como parte de sus centros de desarrollo Java. En los comienzos de su carrera formó parte durante cinco años del equipo de Ingeniería de Software del Centro Europeo para la Física de Partículas (CERN) en Ginebra, Suiza, contribuyendo al desarrollo incipiente de los sistemas que posteriormente formarían parte de la Grid, la red de centros de cómputo dedicada a resolver problemas científicos en distintas áreas de conocimiento. En Colombia, antes de vincularse con la UIS colaboró como Investigador Sénior con la Universidad Nacional de Colombia en Bogotá en temas de aprendizaje computacional a gran escala.

Actualmente, sus intereses de investigación se centran en el aprendizaje computacional (machine learning), inteligencia artificial y procesos de descubrimiento de conocimiento sobre grandes colecciones de datos en problemas y áreas de aplicación tales como la bioinformática, algoritmos de posicionamiento por satélite, física de astropartículas e imagen médica entre otros.