Cerrar
CONACYT

Infotec en los medios

El científico de datos, la nueva revolución industrial

Fuente: Crónica.com.mx | Publicado: 06/05/2017

Por: Elio Atenógenes Villaseño

 

En los últimos años, el análisis de datos ha sufrido un cambio radical en su enfoque original. El desarrollo actual de las tecnologías de la información y las capacidades computacionales redimensionan los alcances y posibilidades de la exploración y explotación (cual yacimientos o minas) de grandes bases de datos. Sin embargo, a diferencia de la industria minera o la de energéticos (minerales o fósiles), en la explotación de grandes volúmenes de información (Big Data Analytics) se parte de que la generación masiva de materia prima (datos crudos) y la base tecnológica (TIC) tienen un costo marginal cada vez más pequeño.

Lo que sí va en aumento en esta industria son los sueldos y la demanda (no cubierta) de este tipo de perfiles profesionales. De manera que, los jugadores en este nuevo terreno son aquellas organizaciones (gobiernos, empresas, universidades o grupos de investigación, sociedad civil, etc.) que además de tener acceso a los grandes datos y la tecnología para su procesamiento, cuenten con el apoyo de un Lcientífico de datosc.

Pero ¿siempre han existido los científicos de datos? Históricamente, los científicos han utilizado datos para establecer o comprobar hipótesis o describir su objeto de estudio. Sin embargo, el científico de datos debe contar, además, con la capacidad de afrontar nuevas condiciones ya que se pasa de la escasez de información y datos, a su proliferación; de un alto costo para el almacenamiento y procesamiento de datos, a su comoditización; de la aplicación de métodos matemáticamente rigurosos de muestreo, al uso de información de poblaciones enteras; de la simplificación en la modelación matemática, al uso de modelos cada vez más complejos para el fenómeno estudiado.

Esta nueva realidad establece como característica del científico de datos, la innovación continua en el aprovechamiento de tecnologías de cómputo de alto rendimiento, así como en el diseño e implementación de métodos para el análisis de grandes volúmenes de datos. Dados los perfiles científicos que actualmente se forman en las universidades, el científico de datos es un híbrido entre matemático aplicado y científico de la computación.

Una de las tendencias actuales en la analítica de grandes datos es el uso de métodos de inteligencia artificial, los cuales son implementados en infraestructuras computacionales de alto rendimiento que actualmente están disponibles como servicio web. Estos nuevos modelos de servicios de alto valor, hacen más accesible la capacidad de procesamiento y análisis inteligente. La disponibilidad de grandes volúmenes de información también hace que sea posible aplicar los métodos de aprendizaje computacional (Machine Learning) utilizando datos del mundo real.  Estos métodos permiten, entre otras cosas, incorporar el conocimiento de expertos humanos en decisiones que se toman automáticamente en tiempo real. La capacidad del análisis inteligente es clave en las tecnologías disruptivas del futuro próximo: el internet de las cosas, las ciudades inteligentes, los autos-autónomos, la tele-medicina, etcétera.

No es de extrañar que actualmente hay una explosión en la inversión canalizada a )star-upss que ofrecen servicios y productos basados en inteligencia artificial y aprendizaje computacional. La inversión en 2011 era del orden de 282 millones de dólares, para 2015 era de 2,388; es decir en cinco años se multiplicó por un factor mayor al 800%. Esta dinámica sólo se puede explicar por la generación de valor que las tecnologías inteligentes son capaces de generar. 

Desde 2010, INFOTEC ha impulsado proyectos enfocados al desarrollo de capacidades en torno al procesamiento y análisis automático de grandes cúmulos de información en búsqueda de conocimiento valioso y útil. En particular, el Laboratorio de Big Data (LaBD)/https://www.infotec.mx/es_mx/infotec/Laboratorio_de_Analitica_Big_Data) tiene como objetivo el apropiamiento e implementación de tecnologías de información y cómputo para el almacenamiento, recuperación, procesamiento, análisis inteligente y visualización que permitan una exploración y análisis oportuno de grandes almacenes de datos de diversa índole, con la finalidad de obtener información valiosa y útil para distintos proyectos de investigación, aplicaciones y nuevos modelos de los servicios de INFOTEC. A este laboratorio se encuentran asociados investigadores del programa de Cátedras CONACyT, asignados a INFOTEC, y se tienen proyectos en colaboración con investigadores de otros centros de investigación como: CentroGeo, INAOE y CIDE, así como con investigadores de universidades como UNAM, UMSNH, UPY y UAA, e instituciones de gobierno como el INEGI. Tecnológicamente, el LaBD está soportado por la infraestructura de cómputo de alto rendimiento que facilita el Laboratorio Nacional de Internet del Futuro (LaNIF) que se encuentra en el Centro de Datos de INFOTEC sede Aguascalientes. Además, se tienen programas de )Posgrado en Ciencia de DatosP los cuales se imparten de manera presencial en Aguascalientes y próximamente también se impartirán a distancia.

De esta manera, INFOTEC, como centro público de Investigación, contribuye a la formación de talento humano en ciencia de datos que será en beneficio social para que nuestro país afronte los retos y aproveche las oportunidades que ofrece la nueva era o cuarta revolución industrial que estamos viviendo.

 

Elio Atenógenes Villaseñor

Es candidato a doctor en Ciencias de la Computación por el Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas (IIMAS) de la Universidad Nacional Autónoma de México (UNAM).En la actualidad, es profesor-investigador de tiempo completo en INFOTEC. Investigador del INFOTEC, Centro de Investigación e Innovación en Tecnologías de la Información y Comunicación.

 

Fuente: Crónica.com.mx

Datos de contacto

Área de Comunicación Social - Tel: 5624 2800 ext. 2503 - infotecomunica@infotec.mx