Lokale LLMs op Mac met LM Studio¶
LM Studio + MLX maakt het mogelijk om LLMs lokaal te draaien op Apple Silicon zonder cloud API.
Benodigdheden¶
- Mac met Apple Silicon (M1 of nieuwer)
- 8GB RAM β kleine modellen (3B) of sterk gequantiseerde 7B
- 16GB RAM β comfortabel 7B/8B modellen
- 32GB+ RAM β 13B tot 34B modellen
Jouw M5 Pro met 48GB is ideaal voor modellen tot ~34B.
Wat is MLX?¶
Apple's open-source ML framework, specifiek voor Apple Silicon. Gebruikt unified memory zodat CPU en GPU data delen zonder kopiΓ«ren β resulteert in snelle, efficiΓ«nte inferentie.
Setup (kort)¶
- Download LM Studio β Apple Silicon build
- Zoek een model (bijv.
Qwen3 4BofGemma 3 27B) - Kies 4-bit quantisatie (
Q4_K_M) voor goede balans - Chat β laad model β zet Hardware Acceleration op MLX
Aanbevolen startmodellen¶
| Model | RAM | Gebruik |
|---|---|---|
qwen3-4b-thinking |
8GB+ | Snel, goed voor chat & code |
gemma-3-27b |
32GB+ | Krachtig, langere context |
qwen3-coder:30b (Ollama) |
32GB+ | Jouw huidige voorkeur voor code |
Lokaal vs. Cloud¶
| Lokaal | Cloud | |
|---|---|---|
| Kosten | Gratis | Pay-per-token |
| Privacy | Volledig privΓ© | Data naar derde partij |
| Snelheid | Afhankelijk van GPU | Snel, dedicated hardware |
| Modellen | Beperkt door RAM | Alle SOTA modellen |
Workflow: Lokaal prototypen β cloud voor productie.
Verwant¶
- [[Cloud GPU Prijsvergelijking]]
- [[n8n mcp homelab]]