La ciencia en pocas palabras

Anatomía de la inteligencia artificial para principiantes

Escrito por Ernesto Vázquez-Chimalhua y Tzvetanka D. Dinkova

LA CIENCIA EN POCAS PALABRAS

Anatomía de la inteligencia artificial para principiantes

Ernesto Vázquez-Chimalhua y Tzvetanka D. Dinkova
Año 14 / Número 84 / 2025
RECIBIDO: 04/02/2025; ACEPTADO: 26/06/2025; PUBLICADO: 19/12/2025
Ernesto Vázquez-Chimalhua
Posdoctorante del Departamento de Bioquímica, Facultad de Química, Universidad Nacional Autónoma de México. Ciudad de México. Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.

Tzvetanka D. Dinkova.
Profesora e investigadora del Departamento de Bioquímica, Facultad de Química, Universidad Nacional Autónoma de México. Ciudad de México. Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.

RESUMEN

Actualmente, la inteligencia artificial (IA) dejó de evocar a la ciencia ficción o al futurismo y pasó a ser parte de nuestro presente. La IA es una tecnología innovadora perteneciente al campo de la ciencia computacional con enorme potencial de aplicación en diversas disciplinas científicas y tecnológicas. El conocimiento sobre la anatomía de la IA es prioritario para que podamos utilizarla de manera adecuada, tomemos decisiones conscientes y minimicemos el uso de recursos innecesarios. Incluso, en ciertos aspectos, tiene la capacidad de aumentar la calidad de vida humana.

Palabras clave: Computación, inteligencia artificial, tecnología.

 

El pasado de la inteligencia artificial

Los indicios de la historia de la inteligencia artificial (IA) se remontan al siglo XVII. El filósofo René Descartes veía al cuerpo humano como una máquina compleja que llevaba a cabo sus funciones fisiológicas mediante los movimientos mecánicos de sus partes controladas por la mente. En esa misma época, Blaise Pascal y Gottfried Wilhelm Leibniz inventaron una máquina que realizaba operaciones matemáticas básicas y las personas que la manejaban fueron llamadas calculadoras. En el siglo XIX, Charles Babbage elaboró una máquina calculadora que resolvía operaciones matemáticas más complejas. Babbage enfatizaba que las calculadoras podían realizar cualquier cálculo con mayor eficiencia a cómo lo haría una persona y que incluso podrían sustituirlo.

Entre los siglos XIX y XX, escritores de literatura de ficción como Mary W. Shelley, Jules Verne, L. Frank Baum, Karel Čapek, Isaac Asimov y Arthur C. Clarke, especulaban en sus novelas sobre la creación de seres artificiales inteligentes. Tales historias proyectaron e inspiraron la elaboración de una IA.

Entre 1930 y 1950, el matemático Alan Mathison Turing, considerado el padre de la IA, se empeñó en crear computadoras con rasgos de inteligencia capaces de llevar a cabo actividades humanas. En 1950, Turing publicó su artículo «Maquinaria computacional e inteligencia», donde planteó la pregunta: ¿Las máquinas pueden pensar? Para evaluar la inteligencia de las computadoras, Turing diseñó una prueba, la cual nombró el juego de la imitación. El ejercicio consistió en que un interrogador humano hiciera preguntas a A y B; uno de estos era persona y el otro una computadora. La tarea del interrogador era definir de entre A y B cuál era la persona y cuál la computadora, a partir de las respuestas dadas. Turing se cuestionaba: ¿Podría diferenciar el interrogador humano las respuestas elaboradas de una computadora de las de un humano?

Poco después, en 1955, Herbert Alexander Simon y Allen Newell desarrollaron una de las primeras computadoras reconocidas como inteligentes. Tal máquina contenía el programa computacional llamado El teórico lógico, que resolvía problemas humanos de pensamiento complejo como solucionar teoremas (proposiciones demostradas) geométricos. Un año después, en 1956, John McCarthy acuñó el término «inteligencia artificial» (IA) en una conferencia en Dartmouth, Estados Unidos de América. En 1957, el psicólogo Frank Rosenblatt creó una pequeña red neuronal artificial que llamó Perceptron y fundó el aprendizaje artificial profundo. En 1959, Arthur Samuel acuñó el término de máquinas de autoaprendizaje.

Una prueba histórica para la IA se llevó a cabo en 1997 cuando la computadora Deep Blue de IBM®, diseñada para jugar ajedrez, logró ganarle partidas a Garri Kaspárov, el campeón mundial del deporte ciencia de ese momento. En décadas pasadas, los avances en IA han sido rápidos y a grandes pasos, tanto que sus aplicaciones se han expandido en la mayoría de nuestras actividades diarias. La IA ha llegado para quedarse; por eso, debemos acostumbrarnos a ella y saber cómo usarla. La capacidad que tiene la IA de ayudarnos a llevar a cabo alguna labor hace imaginar que podríamos llegar a vivir como en la caricatura de los Supersónicos y tener una Robotina que nos echara la mano para limpiar la casa.

 

El presente de la IA

El siglo XXI se ha caracterizado por la impactante influencia de la IA en nuestra cotidianidad. Por eso, es indispensable conocer cómo está conformada la IA. Es apropiado destacar que, funcionalmente, la IA se clasifica en dos categorías: la IA débil (IAd), o estrecha, y la IA fuerte, que está dividida en IA general (IAg) y súper IA (sIA). La IA fuerte es solo un concepto teórico hasta la fecha, y su objetivo es igualar e incluso superar cognitiva y mecánicamente al ser humano. Tales máquinas de IA fuerte, si existieran, podrían tener conciencia de ellas mismas y de su entorno, e incluso manifestar y comprender emociones humanas como tristeza o alegría.

El nivel predominante de la IA es la IAd, aunque los investigadores computacionales ya han desarrollado los componentes básicos de la sIA. La IAd requiere de la asistencia humana para que le sustente los datos de entrenamiento y defina los algoritmos de aprendizaje, es decir, es conductual y realiza labores designadas. Algunos ejemplos son: reconocer rostros, objetos o escenas en imágenes; reconocimiento de voz en los asistentes virtuales Alexa®, Siri® o Google assintant®; visión computarizada de los carros autónomos; recomendar contenidos en los sistemas Netflix® o Youtube®; y procesamiento del lenguaje natural como lo hace ChatGPT®. Por cierto, en 2023, el juego de la imitación o la prueba de Turing fue superada por ChatGPT®, el programa para conversar de la empresa OpenAI.

Recientemente, en enero de 2025, la empresa china DeepSeek presentó su primer programa de IA conversacional DeepSeek-R1®, el cual desplazó a ChatGPT® en descargas en los Estados Unidos de América. Asombrosamente, con la IA se hacen videos que parecen reales, donde vemos a Harry Potter en fiestas o criaturas marinas raras. Para poder entender mejor cómo hemos llegado tan lejos con la IA, debemos conocer la forma en la que está constituida, lo que se explicará más adelante.

 

 

Dentro del corazón de la IA

Desde un panorama organizativo, la IA es el sistema general que contiene a sus subconjuntos: las Máquinas de Aprendizaje (MA), las Redes Neuronales Artificiales (RNA) y las Máquinas de Aprendizaje Profundo (MAP). En el orden donde las MA tienen como subelemento a las RNA, las cuales, a su vez, tienen como subelemento a las MAP.

Las MA cuentan con una memoria limitada y se centran en el uso de datos de entrenamiento y algoritmos (instrucciones mecánicas dispuestas en determinado orden jerárquico) sofisticados de aprendizaje. Los algoritmos de las MA están diseñados de tal manera que son capaces de entrenarse por sí solos con el historial de datos de entrada e identificar rasgos y relaciones entre ellos. Al suministrar nuevos datos, los algoritmos de las MA arrojan resultados actualizados. Posteriormente, los nuevos datos pasan a formar parte del historial y las MA entrenan con estos. Sin embargo, las MA continúan bajo la intervención y supervisión de los humanos, quienes se encargan de etiquetar (estructurar) los datos de entrada. Es decir, si queremos que el algoritmo de la MA identifique imágenes de pelotas o perros, tiene que ser alimentada con imágenes etiquetadas como pelotas o perros para que entrene con ellas.

La ventaja de las MA es que requieren pocos datos etiquetados de entrada para efectuar una tarea. Mientras que, para los algoritmos de las MAP, las etiquetas no son necesarias y su entrenamiento puede ser no supervisado (sin etiquetas) o semisupervisado (con y sin etiquetas) por alguna persona, pero requieren mayor cantidad de datos para aprender a identificar similitudes o patrones. Estructuralmente, las MAP están hechas a partir de las RNA, estas tratan de imitar cómo las neuronas del cerebro humano se conectan y comunican entre sí. 

Para la IA, una neurona artificial (o perceptrón) es un nodo de procesamiento que identifica patrones según las características de los datos y obedece las instrucciones de los algoritmos. Las RNA están constituidas por capas de nodos; las MA llegan a utilizar hasta dos capas de neuronas artificiales, en tanto que las MAP emplean mínimamente tres capas de neuronas artificiales. Algunas MAP llegan a tener RNA profundas con nodos interconectados de hasta mil capas.

Las RNA profundas están dispuestas en tres secciones. La primera sección es una capa hecha para los datos de entrada, la segunda es una multicapa oculta que entrena con los datos (o examina), y la tercera sección es una capa de salida para los resultados. Los algoritmos de las MAP tienen la capacidad de analizar los datos en ambas direcciones de los sectores, es decir, desde la capa de entrada, pasando por las capas ocultas hasta la capa de salida y viceversa. Lo anterior logra corregir previos errores.

 

¿Por qué comprender la IA?

La importancia de comprender cómo está formada la IA radica en diversos factores fundamentales para nuestra interacción con esta tecnología. Un factor es el hecho de que educar a la gente sobre cómo funcionan los sistemas de IA ayuda a generar confianza en su uso, ya que los usuarios son capaces de comprender los procesos detrás de sus resultados. Otro factor es que, dejar en claro la estructura corporal de la IA, incentiva la comprensión de los avances científicos.

Por ejemplo, en 2024, los investigadores Denis Hassabis, David Baker y John M. Jumper ganaron el Premio Nobel de Química por predecir con IA tipo MAP la estructura tridimensional de proteínas. Recordemos que las proteínas son biomoléculas fundamentales para la formación e integridad de la célula. Previamente, en 2018, Hassabis y Jumper presentaron el programa computacional de IA AlphaFold, con el cual resolvieron el problema de modelar el plegamiento de las proteínas y predecir la formación de su estructura tridimensional. Ellos entrenaron a AlphaFold con datos de más de 100 mil secuencias y estructuras de proteínas conocidas.

Ahora podemos entender que los algoritmos entrenan con esos datos y arrojaron la predicción de la estructura tridimensional de las proteínas. Baker fue más allá y usó la IA para diseñar proteínas que no existen en la naturaleza, es decir, proteínas artificiales con funciones novedosas. Baker hace uso de estas proteínas sintéticas para atender problemas del presente siglo como el cáncer y, en colaboración con Neil King, diseñaron una vacuna para el virus de inmunodeficiencia humana (VIH).

En resumen, el conocimiento sobre la estructura y los componentes de la IA no solo habilita un mejor uso de esta tecnología computacional, sino que también fomenta un enfoque crítico y reflexivo hacia su impacto en la sociedad.

Bermúdez-Rattoni F., Osorio-Gómez D. y Guzmán-Ramos K. (2024). Conciencia en la inteligencia artificial. ¿Cómo ves?, 313. https://www.comoves.unam.mx/numeros/articulo/313/conciencia-en-la-inteligencia-artificial

Bhardwaj A., Kishore S. y Pandey D. K. (2022). Artificial intelligence in biological science. Life, 12(9),1430. https://pmc.ncbi.nlm.nih.gov/articles/PMC9505413/pdf/life-12-01430.pdf

Carvajal-Villaplana, A. (2024). Claudio Gutiérrez: en los albores de la inteligencia artificial. Rev. Filosofía Univ. Costa Rica, 63(165), 241-252. https://revistas.ucr.ac.cr/index.php/filosofia/article/view/58418/58814