Toutes les news taguées avec ce sujet.
Nvidia dévoile le RTX Spark, un ordinateur de bureau ultracompact intégrant un GPU RTX pour l'inférence IA locale et les usages créatifs.
Nvidia dévoile un nouveau chip IA destiné aux PC grand public, signalant une poussée vers l'inférence locale.
Une analyse compare le coût énergétique réel d'un LLM local sur Apple Silicon face aux tarifs d'OpenRouter : le résultat surprend.
Un développeur publie un moteur d'inférence léger pour faire tourner DeepSeek 4 Flash localement via Metal, le framework GPU d'Apple.