XDA, Gemma 4’ü aynı masaüstündeki Qwen 3.5 ile karşılaştırmaya bir hafta harcadı ve yorum dizini daha sessiz bir noktayı kanıtladı: çoğu okuyucu zaten yerel bir LLM yığınını çalıştırmaktadır. Kategori hobi oyuncaklarını geride bırakmıştır. Niceliklendirilmiş 7B ve 14B modelleri kod incelemesi, özetleme ve rutin yazı için yeterince iyidir, orta ölçekli MoE modellerinin yeni dalgası kapalı sınır modellerine olan mesafeyi daraltmıştır ve llama.cpp’yi sarmalayan uygulamalar gerçek yazılım gibi görünmeye başlamıştır.

Windows, macOS ve Linux’ta yerel LLM’leri çalıştırmak için 8 en iyi uygulamayı test ettik. Kıyaslama sıkıcı şeylerdi: Ryzen dizüstü bilgisayarda bir modeli ne kadar hızlı başlatırlar, RTX kartında GPU boşaltmayı ne kadar temiz işlerler, sohbet arayüzü gerçekten güzel mi, ve bir sonraki büyük model geldiğinde ne kadar kırılırlar. Bu kategoride fiyat her zamankinden daha az önemlidir çünkü çoğu güçlü seçenek ücretsizdir.

Yerel LLM uygulamasında ne aramalı

Birkaç kriter, günlük kullanımının bir haftasını yaşayan araçları kaldırılanlardan ayırır:

Hızlı karşılaştırma

UygulamaEn iyiPlatformlarÜcretsiz planÖne çıkan özellik
OllamaTek satırlı yüklemeler ve komut dosyası yapabileceğiniz CLIWindows, macOS, LinuxEvet (açık kaynak)localhost’ta OpenAI uyumlu API
LM StudioYerleşik model araması ile cilalı sohbet UI’siWindows, macOS, LinuxEvet (kişisel kullanım için ücretsiz)Nicelik filtreleme ile Hugging Face entegrasyonu
JanÇevrimdışı modu kaydeden tamamen açık kaynaklı sohbet istemcisiWindows, macOS, LinuxEvet (açık kaynak)Telemetri yok ve temiz ayarlar hikayesi
GPT4AllGPU’suz dizüstü bilgisayarlar için hafif sohbetWindows, macOS, LinuxEvet (açık kaynak)Düşük RAM makineleri için CPU birinci nicelikler
MstyYan yana karşılaştırmalar için çok modelli bölme görünümüWindows, macOS, LinuxEvet (ücretsiz katman)Bir pencerede iki yerel modeli karşılaştırın
Open WebUITarayıcıda çalışan kendini barındıran sohbet ön yüzüDocker (herhangi bir işletim sistemi)Evet (açık kaynak)Çoklu kullanıcı modu ve sohbet başına model değiştirme
LlamafileModel başına tek bir yürütülebilir, yükleyici yokWindows, macOS, LinuxEvet (açık kaynak)Bir dosyaya çift tıklayarak modeli çalıştırın
Text Generation WebUISampler ayarlaması ve uzantıları olan güç kullanıcısı oyun alanıWindows, macOS, LinuxEvet (açık kaynak)Nesil parametreleri üzerinde en derin kontrol

Masaüstünde yerel LLM’leri çalıştırmak için 8 en iyi uygulama

1. Ollama — günlük kullanım için en iyi tek satırlı kurulum

Ollama, kategorinin varsayılana en yakın olanıdır. Tek bir yükleyici bir CLI ve arka plan hizmeti bırakır, ardından ollama run llama3.2 niceliklendirilmiş bir model çeker ve sohbeti başlatır. Aynı daemon, localhost:11434’te OpenAI uyumlu bir API’yi ortaya çıkarır, bu da OpenAI konuşan her editör uzantısının ve not defterinin değişiklik olmadan çalışması anlamına gelir. Model kitaplığı, makul varsayılan niceliklerle çoğu popüler aileyi kapsar.

Eksik olduğu yer: Birinci taraf UI minimumdur. Ollama bir runtime’dır, bir sohbet uygulaması değildir, bu nedenle ona bir terminalden konuşursunuz veya bunu ayrı bir ön uç ile eşleştirirsiniz. Özel istemler ve şablonlar Modelfile’de yaşar, bu güçlüdür ancak bir adım ekler.

Fiyatlandırma:

Platformlar: Windows, macOS, Linux

İndir: ollama.com

Alt çizgi: “Sadece çalışan” bir arka uç istiyorsanız ve kendi UI’nizi getirmekten mutluysa yerel LLM’ler için Ollama’yı seçin.


2. LM Studio — yerleşik model araması ile en iyi sohbet UI’si

LM Studio, çoğu insanın web demolarını geçtikten sonra iner olduğu cilalı sohbet istemcisidir. Model tarayıcısı doğrudan Hugging Face’e bağlanır, nicelik seviyesi ve mimariye göre filtreler ve bir dosyanın gerçekten sizin VRAM’ınıza sığıp sığmayacağını gösterir. Sohbet penceresi sistem istemlerini, ön ayarları, çok dönemli düzenlemeyi ve Ollama’nın sunduğu aynı OpenAI uyumlu uç noktayı ortaya çıkaran yerel bir sunucu modunu destekler.

Eksik olduğu yer: Lisans kişisel kullanım için ücretsiz ancak ticari bağlamlar için ücretli bir plan gerektirir, bu da şirketteki bir dizüstü bilgisayara koymadan önce bilmek değerdir. Uygulama kapalı kaynaklıdır.

Fiyatlandırma:

Platformlar: Windows, macOS, Linux

İndir: lmstudio.ai

Alt çizgi: Model keşfi, nicelik seçimi, sohbet ve yerel API’yi işleyen tek bir pencere istiyorsanız yerel LLM’ler için LM Studio’yu seçin.


3. Jan — en iyi tamamen açık kaynaklı sohbet istemcisi

Jan, bir takımın LM Studio deneyimini sıfırdan açık kaynak olarak inşa ettiğinde olan şeydir. Model mağazası kuratörlüdür, sohbet UI temizdir ve projenin telemetri olmaksızın tamamen çevrimdışı çalışacak bir politikası belirtilmiştir. Ayarlar paneli, hangi anahtarların ağ çağrılarını etkilediğini açık hale getirir, bu bu kategoride alışılmadındır.

Eksik olduğu yer: Performans, aynı donanımda LM Studio’dan bir kıl kadar geride kalmaktadır, kısmen takım hiper spesifik GPU ayarlamadan ziyade taşınabilirliği önceliklendirdiği için. Mobil ve uzak API’sı hikayeleri masaüstü sohbetinden daha yenidir.

Fiyatlandırma:

Platformlar: Windows, macOS, Linux

İndir: jan.ai

Alt çizgi: LM Studio UI’sini kapalı kaynaklı lisans olmadan ve analitik devre dışı bırakma geçişine güvenmeksizin istiyorsanız yerel LLM’ler için Jan’ı seçin.


4. GPT4All — GPU’suz düşük özellikteki dizüstü bilgisayarlar için en iyi

GPT4All, yerel LLM sahnesinin ilk günlerinden beri vardır ve çoğundan sıkıcı işi daha iyi yapar. Varsayılan model listesi CPU çıkarımı için ayarlanır, küçük nicelikler ayrılmış GPU’su olmayan makinelerde çalışır ve sohbet UI artık diske işaret eden yerel belge sohbetini içerir. Eski bir dizüstü bilgisayarda 7B modeli çalıştırmayı deneyen ve yavaşlıktan sıçrayan kullanıcılar için, küratörlü küçük model seçimi doğru başlangıç noktasıdır.

Eksik olduğu yer: GPU hızlandırması desteklenir ancak projenin odağı değildir. Sohbet UI güzel yerine işlevseldir.

Fiyatlandırma:

Platformlar: Windows, macOS, Linux

İndir: gpt4all.io

Alt çizgi: Donanımınız mütevazı ise ve için ayarlanmış modelleri içeren bir sohbet istemcisi istiyorsanız yerel LLM’ler için GPT4All’ı seçin.


5. Msty — iki modeli yan yana karşılaştırmak için en iyi

Msty, belirli bir boşluğu dolduran az açık olmayan bir seçimdir: aynı anda iki yerel modelle konuşabilir ve yanıtlarını yan yana gösterebilir. Uzak API’lere kancalar ile birleştiğinde, bu aynı istemde bir Qwen sürümünü bir Gemma niceliğine kıyaslamak için en kolay yoldur ve iki pencereyi oynatmaksızın. Bilgi yığınları, alma için folderleri veya URL’leri sohbete eklemenize izin verir.

Eksik olduğu yer: Ücretsiz katman çoğu kişisel kullanımı kapsar, ancak bazı güçlü özellikler ücretli bir plan arkasında oturur. Model araması LM Studio’dan daha dardır.

Fiyatlandırma:

Platformlar: Windows, macOS, Linux

İndir: msty.app

Alt çizgi: Aktif olarak modelleri karşılaştırıyor ve bu iş akışı için tasarlanmış bir sohbet istemcisi istiyorsanız yerel LLM’ler için Msty’yi seçin.


6. Open WebUI — aile veya takım sunucusu için en iyi tarayıcı ön yüzü

Open WebUI, konteynerlı bir web uygulaması olarak çalışır ve ağ üzerinden Ollama (veya herhangi bir OpenAI uyumlu arka uç) ile konuşur. Arayüz ChatGPT web uygulaması gibi görünür, rol tabanlı erişim denetimi ile çok kullanıcılı hesapları destekler ve sohbet başına model değiştirmeyi işler. Herkesin herhangi bir tarayıcıdan kullanabileceği tek bir yerel model sunucusu istemeyen bir ev veya küçük takım için bu en temiz cevapdır.

Eksik olduğu yer: Ollama’nın (veya eşdeğerinin) bir yerde çalışmakta olduğunu varsayar. Çok kullanıcılı özelliklerin biraz kurulum gerekir. Bu bir tarayıcı uygulaması, bu nedenle yerel masaüstü cilası yoktur.

Fiyatlandırma:

Platformlar: Docker, Windows, macOS veya Linux’ta herhangi bir modern tarayıcıdan erişilebilir

İndir: openwebui.com

Alt çizgi: Ev laboratuvarı veya küçük bir takım için paylaşılan bir sohbet ön yüzü istiyorsanız ve bir kapsayıcı çalıştırmaktan rahat isseniz yerel LLM’ler için Open WebUI’yi seçin.


7. Llamafile — en iyi sıfır yükleme seçeneği

Llamafile, bir modeli ve llama.cpp çalışma zamanını kurulum olmaksızın Windows, macOS ve Linux’ta çalışan tek bir yürütülebilir olarak dağıtır. Bir dosya indirin, çift tıklayın ve yerel bir sohbet UI tarayıcıda açılır. Format Cosmopolitan projesinden akıllı bir platformlar arası ikili numaradır; bu, aynı dosyanın işletim sistemleri genelinde çalışması anlamına gelir.

Eksik olduğu yer: Model tarayıcısı yok. Modelleri dosya olarak yönetirsiniz. Güncellemeler yürütülebiliri takas etmeyi gerektirir. Bazı antivirus araçları ikiliyi işaretler, bu GitHub sorunlarında yinelenen bir şikayettir.

Fiyatlandırma:

Platformlar: Windows, macOS, Linux

İndir: github.com/Mozilla-Ocho/llamafile

Alt çizgi: Hugging Face hakkında hiç duymamış biri ile çalışan bir modeli paylaşmak için mutlak en düşük tören yolunu istiyorsanız yerel LLM’ler için Llamafile’ı seçin.


8. Text Generation WebUI — güç kullanıcısı oyun alanı için en iyi

Text Generation WebUI (bazen oobabooga denir) hepsi içeren seçenektir. Birden fazla arka uç, güneş altında her sampler, RAG, karakter kartları, sesli ve görüntü temelli sohbet ekleyen bir uzatma sistemi. Sampler ayarlamalarını, kontrastif kod çözmeyi ve belirsiz nicelik formatlarını önemseyen araştırmacılar ve hacılar buraya iner.

Eksik olduğu yer: Kurulum bu listedeki diğer seçeneklerden daha fiddlier’dir ve karışıma Python ortamları ile CUDA araç takımları vardır. UI, rastgele kullanıcıları zaptiye etme yolunda bilgi yoğunudur.

Fiyatlandırma:

Platformlar: Windows, macOS, Linux

İndir: github.com/oobabooga/text-generation-webui

Alt çizgi: Her düğmeyi ortaya çıkarmak istiyorsanız ve bir Python ortamında rahat isseniz yerel LLM’ler için Text Generation WebUI’yi seçin.

Doğru olanı nasıl seçilir

Çalışan kuruluma en basit yolu istiyorsanız, Ollama’yı yükleyin ve beğendiğiniz bir sohbet ön yüzü ile eşleştirin.

Cilalı bir pencerede her şeyi yapan bir uygulama istiyorsanız, LM Studio’yu yükleyin.

Açık kaynak sizin için önemliyse, Jan’ı yükleyin.

Dizüstü bilgisayarınız daha eski veya GPU yoksa, GPT4All’ı yükleyin ve kuratörlü küçük modellerine bağlı kalın.

Modelleri aktif olarak karşılaştırıyor isen, Msty’yi yükleyin.

Ev için paylaşılan bir sohbet sunucusu istiyorsanız, Ollama’nın arkasında Open WebUI çalıştırın.

Sıfır tören istiyorsanız, önem verdiğiniz model için Llamafile’ı indirin.

Her düğmeyi istiyorsanız, Text Generation WebUI’yi yükleyin ve ilk koşu için bir öğleden sonra bütçelendirin.

SSS

Yerel LLM’ler ayrık GPU olmayan bir dizüstü bilgisayarda çalışır mı?

Evet. Niceliklendirilmiş 3B ve 7B modelleri entegre grafiklerde veya saf CPU’da çalışır, yavaş ancak kullanışlı olarak. GPT4All ve Llamafile her ikisi de bu durum için ayarlanmış küçük modeller gönderirler.

Yerel LLM çalıştırmak için ne kadar VRAM’a ihtiyacım var?

Q4 niceliğinde 7B modelle rahat bir deneyim için, yaklaşık 6 GB VRAM. Q4’te 14B için, yaklaşık 10 GB. 70B sınıfı modeller için, 24 GB veya daha fazla hesaplayın veya daha düşük hızlarda CPU RAM’ı ve GPU’yu bölün.

Ollama yerel LLM’ler için en iyi uygulama mı?

Çoğu kullanıcı için en iyi arka uçtur. Aynı pencerede cilalı bir sohbet UI da istiyorsanız, LM Studio veya Jan “en iyi uygulamaya” daha yakındır. Ollama artı ayrı UI en yaygın yığındır.

Yerel LLM’ler gerçekten özel midir?

Evet, bir uyarı ile. Çıkarım tamamen sizin makinenizde çalışır. Sorun, bazı uygulamaların varsayılan olarak analiz veya güncelleme kontrolü için eve telefon açmasıdır. Jan ve GPT4All açma düğmesini açık hale getirir. LM Studio bunu ayarlar altında sahip.

Kodlayıcı editörümle yerel bir LLM kullanabilir miyim?

Evet. OpenAI uyumlu bir uç nokta (Ollama, LM Studio, Jan, Msty) ortaya koyan herhangi bir uygulama, OpenAI’yi hedefleyen editör uzantılarında temel URL olarak ayarlanabilir. Continue, Cursor’un bring-your-own-key modu ve çoğu VS Code uzantısı bunu kabul ederler.