El 25 de septiembre de 2025, OpenAI presentó una nueva evaluación llamada GDPval con el propósito de medir cuán bien sus modelos —y los de otros— rinden frente a tareas…
Leer más
El 25 de septiembre de 2025, OpenAI presentó una nueva evaluación llamada GDPval con el propósito de medir cuán bien sus modelos —y los de otros— rinden frente a tareas…
El estudio de Apple muestra que los modelos de lenguaje, incluidos los más avanzados, fallan en razonamiento matemático.