
La pascalina del matemático francés Blaise Pascal fue, según varios manuales de iniciación a la informática, un invento revolucionario para el año 1642; es a las computadoras modernas lo mismo que el “homo neanderthalensis” al “homo sapiens”. La máquina, en sus primeras versiones, apenas permitía llevar a cabo algunas operaciones matemáticas básicas como sumar y restar. Esa era toda su capacidad para procesar datos, aunque no podía almacenarlos.
Hoy en día, nuestros dispositivos electrónicos de uso diario utilizan microchips hasta mil veces más pequeños con la posibilidad de recoger, almacenar y procesar grandes volúmenes de información en nanosegundos. Esto evidencia la importancia del procesamiento de los datos, sobre todo, para analizarlos y convertirlos en información útil. Por esto, precisamente, existe la ciencia de datos.
En la última década, la ciencia de datos dejó de ser un concepto exclusivo de centros tecnológicos y laboratorios; comenzó a transformarse en una herramienta esencial para casi todos los campos del conocimiento. En la actualidad, en muchas áreas se recurre al análisis inteligente de datos para decidir estratégicamente, con mayor rapidez y precisión. Todo parece indicar que se encuentra presente a diario –desde las sugerencias personalizadas en plataformas digitales hasta los sistemas que identifican fraudes bancarios o anticipan tendencias de consumo–, pero muchos se preguntan: ¿qué es la ciencia de datos y cómo surge?
En este artículo, se indicará qué comprende la ciencia de datos, cómo surgió y por qué ha sido clave para la innovación y la toma de decisiones basadas en evidencia en un mundo cada vez más digitalizado.
¿Qué es la ciencia de datos?
De acuerdo con Cao, L. (2017):
La ciencia de datos es un nuevo campo interdisciplinario que sintetiza y se fundamenta en la estadística, la informática, la computación, la comunicación, la gestión y la sociología para estudiar los datos y sus entornos (incluidos los ámbitos y otros aspectos contextuales, como los organizativos y sociales), con el fin de transformar los datos en conocimientos y decisiones siguiendo un enfoque y una metodología que siguen la secuencia de datos–conocimiento–sabiduría. (p. 9)
En otro orden, Kelleher y Tierney (2021) señalan que:
La ciencia de datos abarca un conjunto de principios, definiciones de problemas, algoritmos y procesos para extraer patrones no obvios y útiles de grandes conjuntos de datos. Muchos de los elementos de la ciencia de datos se han desarrollado en campos relacionados, como el aprendizaje automático y la minería de datos. (p. 11)
Según estas dos aproximaciones al concepto, este campo se caracteriza por su heterogeneidad y por sus ilimitadas posibilidades de combinar conocimientos para facilitar la comprensión de la realidad.
Por todo esto, la ciencia de datos permite a los investigadores abordar problemas, al tiempo que facilita la toma de decisiones informadas que contribuyen a la comprensión de fenómenos complejos en distintos contextos, tanto en los ámbitos científicos como en los sociales y humanísticos (Manrique-Gómez y Borja, 2025). Es más que gestionar un gran volumen de datos, consiste en generar valor a partir de información relevante para mejorar procesos que en el pasado se fundamentaban por lo general en la intuición humana.
Breve historia de la ciencia de datos
La ciencia de datos tiene como antecedentes, además de las matemáticas, disciplinas como la estadística y la probabilidad. La estadística se originó en la Edad Antigua, hace más de 5000 años. Era utilizada principalmente por los egipcios, babilonios y chinos para llevar a cabo censos de la población y contar la cantidad de recursos disponibles. Esto quiere decir que también se empleaba en el ámbito militar. La estadística había cambiado poco hasta los siglos XV y XVI, cuando empezó a desarrollarse, hasta convertirse en la estadística moderna que conocemos. (Ramírez y Vásquez, 2000, p. 1)
Según Restrepo y González (2003), la probabilidad emergió con el “Libro sobre el juego de los dados” en 1563, escrito por el matemático italiano Gerolamo Cardano. Sin embargo, la teoría de la probabilidad comenzó a formalizarse gracias a Blaise Pascal y Pierre de Fermat, quienes publicaron su correspondencia en 1654. Posteriormente, el matemático y físico holandés Christiaan Huygens publicó un breve tratado titulado “Sobre los razonamientos relativos a los juegos de dados” en 1657, inspirado en la correspondencia anteriormente publicada por Pascal y Fermat. (p. 3)
Poco a poco, matemáticos famosos de todo el mundo empezaron a interesarse más por la probabilidad. La probabilidad se convirtió en un foco de atención para los matemáticos y se implementó en varias disciplinas, incluida la educación. Actualmente, la probabilidad es esencial para calcular el margen de error o determinar qué tan factible es realizar una determinada acción. (Restrepo y González, 2003, p. 3)
La ciencia de datos se inició entre los siglos XVIII y XIX. Tukey, J. F. (2021) explica que en este lapso de tiempo los científicos buscaban métodos para recopilar, organizar y analizar información con el propósito de comprender fenómenos sociales, económicos y naturales. A finales del siglo XIX estos enfoques se vieron fortalecidos por los primeros intentos de automatizar el procesamiento de datos, como las máquinas tabuladoras de Herman Hollerith utilizadas en los censos nacionales. Esto implicó un avance significativo en la manipulación sistemática de grandes cantidades de información.
Durante el siglo XX, la evolución de la informática impulsó decisivamente el análisis de datos. La aparición de las primeras computadoras permitió realizar cálculos complejos con mayor velocidad y precisión, y con esto, se integró la estadística con la tecnología. Entre las décadas de 1960 y 1980 surgieron los sistemas de bases de datos y se consolidaron técnicas de análisis cuantitativo aplicadas tanto en el ámbito científico como en el empresarial. En las décadas de 1980 y 1990, se crearon métodos de minería de datos y los primeros algoritmos de aprendizaje automático, con el objetivo de encontrar patrones y relaciones ocultas en conjuntos de datos más extensos. (Foote, K. D., 2021)
En el siglo XXI, la ciencia de datos se estableció como una disciplina autónoma debido al crecimiento exponencial de la información digital, fenómeno conocido como big data. El auge de la Internet, las redes sociales y la computación en la nube generaron la necesidad de profesionales capaces de combinar programación, estadística y conocimiento del dominio para transformar datos en conocimiento útil. (Foote, K. D., 2021)
En resumen, la ciencia de datos tiene el potencial de transformar la forma en que vivimos, trabajamos y entendemos el mundo. Esta disciplina permite tomar decisiones más fundamentadas y prevenir dificultades para encontrar soluciones efectivas en campos tan diversos como la economía, la salud, la educación y la investigación científica. No solo permite optimizar procesos, sino que también amplía las capacidades humanas para comprender fenómenos que inciden en la vida diaria e impulsa nuevas formas de pensar, innovar y adaptarse a entornos en constante transformación.
Así, su verdadero valor radica en su capacidad para convertir la incertidumbre en conocimiento y el conocimiento en acción, consolidándose como un pilar para el desarrollo de sociedades más resilientes, inteligentes y orientadas al futuro.
Referencias
Tukey, J. F. (2021). El origen y evolución de la ciencia de datos (Data Science). Fundación ISD.
Disponible en: https://isdfundacion.org/2021/07/02/el-origen-y-evolucion-de-la-ciencia-de-datos-data-science/
Foote, K. D. (2021). A Brief History of Data Science. Dataversity.
Disponible en: https://www.dataversity.net/articles/brief-history-data-science/
Manrique-Gómez, L., & Borja Gómez, J. H. (2025). Ciencia de datos para la historia: datificar las fuentes para una historia (predictiva). Historia y grafía, (64), 97-145.
Kelleher, J. D., & Tierney, B. (2021). Ciencia de datos: La serie de conocimientos esenciales de MIT Press. Ediciones UC.
Cao, L. (2017). Data science: a comprehensive overview. ACM Computing Surveys (CSUR), 50(3), 1-42.
Restrepo, L. F., & González, J. (2003). La historia de la probabilidad. Revista Colombiana de Ciencias Pecuarias, 16(1), 83-87.
Ramírez, G., & Vásquez, M. (2000). Historia de la Estadística.
Por: Duval Modesto.
La entrada ¿Qué es y cómo surge la ciencia de datos? se publicó primero en El Nuevo Diario (República Dominicana).



