Toutes les news taguées avec ce sujet.
Une méthodologie de bootstrapping sans scraping pour entraîner des modèles NMT sur une langue indigène à très faibles ressources.
Un hypernetwork produit des adapters LoRA spécifiques à chaque dépôt, éliminant le surcoût de tokens à l'inférence tout en absorbant l'évolution du code.
TailLoR exploite la décomposition spectrale des poids pré-entraînés pour réduire les interférences entre tâches en apprentissage continu.
Un framework d'apprentissage continu multimodal qui corrige l'assignation aveugle aux experts LoRA en intégrant la structure de sortie des tâches.
Hugging Face détaille comment adapter le modèle Cosmos Predict 2.5 de NVIDIA via LoRA et DoRA pour générer des vidéos de robots.
Un framework de communication entre agents LLM qui remplace les messages textuels par des perturbations LoRA transitoires, réduisant les tokens traités de 83 %.
Un système basé sur Gemma 3 fine-tuné par langue via LoRA atteint un F1 moyen de 0,811 sur 22 langues, classé 2e au SemEval-2026.