2 items
#METR
Toutes les news taguées avec ce sujet.
- OPINIONheat 72
Import AI 448 : R&D, agent CUDA de ByteDance, IA satellite embarquée
Ajeya Cotra revoit ses prévisions à la hausse : les agents IA progressent bien plus vite que prévu, avec un horizon temporel dépassant déjà 12 heures.
- RECHERCHEheat 72
MirrorCode : un benchmark pour tester la réingénierie logicielle autonome par les agents IA
METR et Epoch publient MirrorCode, un benchmark révélant que les agents IA peuvent réimplémenter des logiciels complexes sans accès au code source.