3 items

#mixture-of-experts

Toutes les news taguées avec ce sujet.

Chronologie · 60 derniers jours

RECHERCHE
heat 30
Extension in-place du tokenizer pour les LLM pré-entraînés
Une méthode pour agrandir le vocabulaire d'un modèle déjà entraîné sans repartir de zéro, appliquée à LFM2.5-8B-A1B.
RECHERCHE
heat 25
Routage multi-experts pour l'OCR mandchou multi-domaines à faibles ressources
Un système d'OCR pour le mandchou historique combine plusieurs experts spécialisés et un routeur visuel pour gérer différents styles d'écriture.
RECHERCHE
heat 42
Un framework MoE multi-tâches pour la classification, détection de packing et attribution de malwares
Des chercheurs proposent une architecture Mixture of Experts unifiée capables de classifier, détecter le packing et identifier les familles de malwares simultanément.

3 items

Toutes les news taguées avec ce sujet.

Chronologie · 60 derniers jours

RECHERCHE
heat 30
Extension in-place du tokenizer pour les LLM pré-entraînés
Une méthode pour agrandir le vocabulaire d'un modèle déjà entraîné sans repartir de zéro, appliquée à LFM2.5-8B-A1B.
RECHERCHE
heat 25
Routage multi-experts pour l'OCR mandchou multi-domaines à faibles ressources
Un système d'OCR pour le mandchou historique combine plusieurs experts spécialisés et un routeur visuel pour gérer différents styles d'écriture.
RECHERCHE
heat 42
Un framework MoE multi-tâches pour la classification, détection de packing et attribution de malwares
Des chercheurs proposent une architecture Mixture of Experts unifiée capables de classifier, détecter le packing et identifier les familles de malwares simultanément.