Telefonunuzda bir LLM çalıştırmak, gerçekten deneene kadar pratik olmayan görünüyor. Qwen3-1.7B, Phi-3 Mini ve Gemma 2 2B gibi modeller, 6 GB RAM’li orta-seviye bir Android cihazına rahatça sığıyor, okunabilir hızda metin oluşturuyor ve sorgu başına tam olarak sıfır maliyeti var. API anahtarı gerekmez, sohbet geçmişi sunucuya gönderilmez, aylık ücret yok.
Android için en iyi cihaz üzerinde AI sohbet uygulamaları 2026’da önemli ölçüde gelişti. Farklı telefonlarda yedi seçeneği test ettik, gerçek dünya belirteç hızlarını değerlendirdik ve hangi app mağazaların her birini dürüstçe taşıdığını kontrol ettik. Bu liste, bulut API’sinin etrafındaki ince bir sarmalama değil, gerçek yerel çıkarımı isteyenler içindir.

Cihaz Üzerinde AI Sohbet Uygulamasında Ne Aranmalı
Uygulamanın kendisi, altındaki çalışma zamanından daha az önemlidir. Buradaki tüm ciddi seçenekler llama.cpp veya karşılaştırılabilir bir çıkarım motoru kullanıyor, bu nedenle anlamlı farklar birkaç şeye geliyor.
Model format desteği. GGUF, nicelleştirilmiş yerel modeller için fiili standarttır. Yalnızca kendi tescilli formatını kabul eden herhangi bir uygulama, sınırlı bir seçime ve yeni modeller geldiğinde yavaş güncellemelere sahip olacaktır. Herhangi bir GGUF dosyasını yan yükleyip yüklenebilmenizi sağlayan uygulamalar arayın.
Nicelik seçenekleri. Bir 3B modelinin Q4_K_M niceliğidir aynı modelinin Q8’den daha hızlı çalışır ve daha az RAM kullanır, mütevazı kalite kaybı ile. En iyi uygulamalar bunu gizlemek yerine bu seçimi ortaya koyor.
Bağlam uzunluğu. Kısa ileri geri sohbetten fazlası için, en az 4K belirteç bağlamı gerekir. Bazı uygulamalar bunu 2K ile sınırlandırıyor ve sizi daha uzun oturumlar içinde kesilmiş yanıtlarla bırakıyor.
Donanım hızlandırması. GPU üzerinde OpenCL veya Vulkan, Snapdragon ve Dimensity yongalarında önemli bir fark yaratır. Tamamen CPU üzerinde çalışan uygulamalar açıkça daha yavaştır.
İndirme ardışık düzeni. En iyi uygulamalar, Hugging Face’e göz atmak veya kürlenmiş bir model listesi ve doğrudan uygulamaya GGUF dosyalarını çekmek. Dosya yöneticisi aracılığıyla dosyaları elle taşımanızı gerektiren herhangi bir şey, çoğu kullanıcının tolere etmeyeceği sürtünme ekler.
Hızlı Karşılaştırma
| Uygulama | En İyi İçin | Google Play | F-Droid | APK Doğrudan | Ücretsiz |
|---|---|---|---|---|---|
| PocketPal AI | Genel Olarak En İyi | Evet | Hayır | Hayır | Evet |
| Maid | Hafif + Uzak | Evet | Hayır | Evet (GitHub) | Evet |
| SmolChat | Görev Odaklı İş Akışları | Evet | Hayır | Evet (GitHub) | Evet |
| ChatterUI | Karakter / Rol Oynama | Hayır | Hayır | Evet (GitHub) | Evet |
| MNN LLM Chat | Çoklu Modal, Qwen/DeepSeek | Evet | Hayır | Evet (GitHub) | Evet |
| MLC Chat | Geliştirici / Araştırma | Hayır | Hayır | Evet (GitHub) | Evet |
| Private LLM | iOS Kullanıcıları | Yalnızca iOS | Hayır | Hayır | Hayır |
Uygulamalar
1. PocketPal AI -- Android için Genel Olarak En İyi Cihaz Üzerinde LLM Uygulaması
PocketPal AI Google Play’de 1 milyon indirmeyi aşmıştır ve bunu kazanmıştır. Uygulama, yerleşik bir Hugging Face tarayıcısıyla gelmektedir, böylece uygulamayı bırakmadan arama yapabilir, niceliğe göre filtreleyebilir ve GGUF modellerini indirebilirsiniz. 2026’da desteklenen modeller Phi-3 Mini, Gemma 2 2B, Qwen3, Danube 3 ve Hugging Face üzerinde GGUF formatında yayınlanan başka bir şey içerir. Sürüm 1.15.0, araç çağırma desteği ekledi ve çoğu yerel sohbet uygulamasının işleyemediği yapılandırılmış otomasyon görevlerini açıyor.
Arayüz, her biri kendi modeline, sistem istemi ve parametre ayarlarına sahip birden fazla “Pal” oluşturmanıza izin verir. Hızlı sorular için hızlı bir Q4 modeli ile dikkatli taslak için daha yavaş bir Q8 modeli arasında geçiş yapmak yalnızca iki dokunuş gerektirir.
Nerede Kısa Kalır: llama.cpp derlemesi dışında GPU hızlandırması yok, bu nedenle Snapdragon Elite gibi GPU-ağır yongalarda çıkarım hızı, yerel uygulamalar kadar hızlı değildir. Daha büyük modeller (7B+) kullanılabilir hızda çalışması için en az 8 GB RAM’li bir cihaz gerektirir.
Fiyatlandırma: Ücretsiz. Uygulama içi satın almalar yok, abonelik yok.
Platformlar: Android, iOS
Alt çizgi: PocketPal AI, çoğu insan için doğru başlangıç noktasıdır. Model keşfinden çıkarıma kadar tüm iş akışını bir uygulamada işler ve komut satırı çalışması gerekmez.
2. Maid -- Yerel ve Uzaktan AI'yi Tek Bir Uygulamada Karıştırmak İçin En İyi
Maid (v3.0.0, Mart 2026) llama.cpp aracılığıyla yerel olarak Internet olmadan GGUF modellerini çalıştırıyor, ancak API anahtarı sağlarsanız Anthropic, Mistral, DeepSeek, Ollama ve OpenAI’a da bağlanıyor. Bu kombinasyon, çoğu zaman özel çıkarımı isteyenler ancak daha zor bir görev için daha yetenekli bir bulut modeline ihtiyaç duyan insanlar için yararlıdır. Seçkin modeller listesi Qwen, Phi, LFM ve TinyLlama’yı kapsar ve yerel depolamadan herhangi bir GGUF yükleyebilirsiniz.
Sürüm 3.0, görüş modeli desteği ve sistem düzeyinde konuşma tanıma ekledi, bu nedenle uygulamayı değiştirmeden istemler dikte edebilir ve görüntü açıklamaları alabilirsiniz. Hiçbir telemetri yok, hiçbir reklam yaklaşımı aynı geliştirici tarafından diğer projelerle tutarlıdır.
Nerede Kısa Kalır: React Native temeli, UI Kotlin ile oluşturulmuş bir uygulamadan daha az doğal hissedebilir anlamına gelir. Parametre maruziyeti (sıcaklık, top-p, bağlam uzunluğu) orada ancak olması gerekenden birkaç dokunuş daha derin gömülü.
Fiyatlandırma: Ücretsiz. Uygulama içi satın almalar yok.
Platformlar: Android (Google Play, GitHub APK)
İndir: GitHub Yayınları kaynağından doğrudan APK olarak da mevcuttur.
Alt çizgi: Yerel özel çıkarım ve API tabanlı istekleri işleyen bir uygulamayı istiyorsanız doğru seçim aralarında temiz bir geçiş.
3. SmolChat -- Görev Özel Yerel Yardımcılar İçin En İyi
SmolChat (io.shubham0204.smollmandroid) standart sohbet kullanıcı arayüzlerinden farklı bir açı alır. Tek bir genel amaçlı konuşma dizesi yerine, farklı sistem istemleri ve modeller tarafından desteklenen birden fazla görev özel “uygulamayı” tanımlamanıza izin verir. Dar bağlamla Phi-3 Mini çalıştıran bir özetçi ayarlayabilir, daha uzun bir pencereyle Qwen3-1.7B çalıştıran bir kod yardımcı ve farklı bir sıcaklık profili kullanan bir yazı yardımcı. Her görev ayrı bir araç gibi davranıyor. Tüm çıkarımlar llama.cpp aracılığıyla yerel olarak çalışıyor; cihazdan hiçbir veri çıkmıyor.
Uygulama herhangi bir GGUF modelini destekliyor, kod sözdizimi vurgulaması ile Markdown işler ve cihazda konuşma geçmişini saklar. Google Play’de olduğu kadar GitHub yayınlarında da oturuyor, bu da onu yan yüklemesiz yerel-LLM uygulamalarından biri yapıyor.
Nerede Kısa Kalır: Yerleşik model tarayıcı yok. Hugging Face veya başka bir kaynaktan GGUF dosyalarını ayrı olarak indir ve uygulamayı onlara işaret et. Bu ekstra adım daha az teknik kullanıcıları uzaklaştırıyor.
Fiyatlandırma: Ücretsiz.
Platformlar: Android (Google Play, GitHub APK)
İndir: Ayrıca GitHub Yayınları’ndan mevcuttur.
Alt çizgi: Genel bir chatbot yerine odaklanmış yerel AI araçlar kümesi oluşturmak istiyorsanız, SmolChat size bulut bağımlılığı olmadan bu yapıyı veriyor.
4. ChatterUI -- Yerel Modellerle Karakter Sohbeti ve Rol Oynama İçin En İyi
ChatterUI (v0.9.0), bu listedeki karakter kartı iş akışları etrafında tasarlanan tek uygulamadır. v2 karakter kartı spesifikasyonu okuyor, bu nedenle SillyTavern veya benzer araçlardan karakter tanımlarını içe aktarabilir ve yerel olarak çalışan bir GGUF modeliyle kullanabilirsiniz. Arka uç llama.cpp’dir ve uygulama, daha yetenekli bir makinede çıkarım çalıştırmak ve telefonunuzdan bağlanmak isteyenler için Ollama, KoboldCpp ve text-generation-webui’yi destekliyor. Tamamen cihaz üzerinde kullanım için depolamadan doğrudan GGUF dosyalarını yükler.
Örnekleyici ayarlar oturum başına ortaya konuyor: sıcaklık, top-p, top-k, tekrar cezası ve bağlam uzunluğu hepsi yapılandırılabilir. Metin-konuşmaya dönüşüm cihazın yerleşik TTS motorunu kullanarak yanıtları okuyor.
ChatterUI yalnızca GitHub’dan doğrudan APK olarak kullanılabilir. Play Store listesi yok ve F-Droid paketi yok. Bu, yüklemeden önce bilinmeyen kaynaklardan yüklemeyi etkinleştirmeniz gerekeceği anlamına geliyor.
Nerede Kısa Kalır: Yalnızca GitHub dağıtımı gerçek bir engel oluşturuyor. APK yan yüklemesi deneyimi olmayan kullanıcılar bunu sinir bozucu bulacak. UI işlevsel ancak yoğun ve genel chatbot kullanıcılarının tırmanması gerekmeyen bir öğrenme eğrisi.
Fiyatlandırma: Ücretsiz. AGPL-3.0 altında lisanslandı.
Platformlar: Android (yalnızca GitHub APK)
İndir: GitHub Yayınlarından APK İndir (yan yükleme gerekir; Google Play dışında APK yüklemeye ilişkin rehberimize bakın)
Alt çizgi: ChatterUI, karakter kartlarının ne olduğunu zaten bilenler için. Eğer bu sizseniz, en iyi yerel seçim bu. Değilse, bunun yerine PocketPal AI ile başlayın.
5. MNN LLM Chat -- Çok modal ve Çin Kökenli Modeller İçin En İyi
MNN LLM Chat MNN çıkarım motoru üzerinde inşa edilmiş Alibaba tüketici uygulamasıdır ve şirket tüm mobil ürünlerinde kullanıyor. Model seçimi Qwen’e (Qwen3 dahil), DeepSeek R1 1.5B, Gemma, Llama ve Phi’ye eğiliyor, standart sohbetin ötesinde görüntüden metne ve sesten metne kapsayan çok modal destek ile. Bu çok modal açı bu fiyat noktasında (ücretsiz) gerçekten nadirdir ve onu çoğu GGUF odaklı uygulamadan ayırır.
Uygulama Google Play’de (paket com.alibaba.mnnllm.android.release) ve GitHub’dan doğrudan APK olarak mevcuttur. Doğrulanmış cihaz testi OnePlus 13 ve Xiaomi 14 Ultra üzerinde yapıldı; daha düşük spec donanım istikrarsızlık sorunları yaşayabilir.
Nerede Kısa Kalır: Kurumsal yedekleme iki yüzlü bir kılıç. Uygulama iyi bakılıyor, ancak Alibaba menşei, bazı kullanıcıların topluluk tarafından oluşturulmuş uygulamalardan daha dikkatli veri işleme inceleyeceği anlamına geliyor. Daha düşük spec cihazların “tamamen çalışmada başarısız olabileceği” uyarısı alışılmadık derecede dürüst ve ciddiye alınmaya değer.
Fiyatlandırma: Ücretsiz.
Platformlar: Android (Google Play, GitHub APK)
Alt çizgi: Özel olarak Qwen veya DeepSeek modellerini istiyorsanız veya metin ile birlikte görüntüleri ve sesi işleyen yerel bir uygulamaya ihtiyacınız varsa doğru seçim.
6. MLC Chat -- Geliştiriciler ve GPU Hızlandırmalı Araştırma İçin En İyi
MLC Chat CMU’daki Machine Learning Compilation projesinin referans uygulamasıdır. Adreno (Snapdragon) ve Mali GPU’ları üzerinde OpenCL’yi hedefleyerek, TVM aracılığıyla cihaz GPU’sunda çalışacak şekilde LLM’leri derler. Bu derleme adımı farklı kıldığı şeydir: llama.cpp tabanlı uygulamalar CPU-first çıkarımını isteğe bağlı Vulkan hızlandırması ile yaparken, MLC hedef GPU mimarisine özel olarak model ağırlıklarını önceden derler, bu doğru donanımda önemli ölçüde daha hızlı belirteç nesline neden olabilir.
Değiş tokuş, her modelin ayrı derlenmiş bir ikilisi gereken. Model seçimi Hugging Face GGUF katalogundan daha küçüktür ve kurulum bu listedeki diğer herhangi bir uygulamadan daha fazla adım gerektirir. Proje GitHub deposu olarak etkin olarak geliştirilir (github.com/mlc-ai/mlc-llm) ve kıyaslamalar çalıştırmak veya motor üzerinde inşa etmek isteyenleri hedefler.
Nerede Kısa Kalır: Mayıs 2026 itibariyle mevcut kararlı Play Store listesi yok. Kurulum kaynaktan oluşturmayı veya GitHub’dan ön sürüm derlemelerini kullanmayı gerektirir. Henüz genel kullanım için bir uygulama değildir.
Fiyatlandırma: Apache 2.0 altında ücretsiz ve açık kaynak.
Platformlar: Android (GitHub derlemeleri, geliştirici önizlemesi)
İndir: GitHub Deposu ve Derleme Talimatları
Alt çizgi: GPU çıkarım ölçütü yaptıysanız veya derlenmiş bir LLM çalışma zamanının üzerine bir ürün yapıyorsanız değerlendirmeye değer. Günlük özel sohbet kullanımı için doğru seçim değildir.
7. Private LLM -- Yalnızca iOS, ancak iOS Meraklısı Okuyucuları İçin Bilmeye Değer
Private LLM Apple’nın Core ML ve Metal hızlandırmasını kullanarak iPhone ve iPad’de GGUF modellerini çalıştırıyor. Android için mevcut değildir. Bunu burada dahil ediyoruz çünkü her yerel LLM karşılaştırma konusunda çıkıyor ve Android kullanıcıları bunun kendileri için bir seçenek olmadığını bilmeli. Apple Silicon yongalarında iOS-native hızlandırması, karşılaştırılabilir donanımda çoğu Android seçeneğinden önemli ölçüde daha hızlı belirteç üretimi sağlıyor; bu belirli bir ürün avantajı yerine cihaz üzerinde AI durumunu yansıtıyor.
En yakın eşdeğeri arayan Android kullanıcıları PocketPal AI kullanmalıdır; çünkü çapraz platform ve karşılaştırılabilir geliştirme dikkatini alıyor.
Nerede Kısa Kalır: Yalnızca iOS. Son iPhone gereklidir (kullanılabilir hız için A14 veya sonrası). Ücretli uygulama.
Fiyatlandırma: Ücretli (tek seferlik satın alma).
Platformlar: Yalnızca iOS
İndir: iOS cihazları için App Store’da mevcut.
Alt çizgi: iOS tarafında neyin görüleceğinin referans noktası. Android kullanıcıları: PocketPal AI sizin eşdeğeriniz.
Doğru Cihaz Üzerinde AI Sohbet Uygulamasını Nasıl Seçersiniz
En basit kurulum ve en geniş model seçimini istiyorsanız, PocketPal AI kullanın. Model keşfinden çıkarıma kadar tüm iş akışını bir uygulamada işler ve yan yükleme gerektirmeden Google Play’dedir.
Tek bir arayüzden yerel ve API tabanlı modelleri çalıştırmak istiyorsanız, Maid kullanın. Yerel llama.cpp ve kendi anahtarınızla Anthropic veya Mistral gibi bulut sağlayıcıları arasında geçiş yapabilme, onu en esnek seçenek yapıyor.
Genel bir chatbot yerine görev özel yerel araçlar (bir özet oluşturucusu, kod gözden geçirici, yazı yardımcısı) oluşturmak istiyorsanız, SmolChat kullanın. Çok uygulamalı yapı odaklanmış iş akışları için daha uygun.
Yerel modellerle rol oynama veya yaratıcı yazı için karakter kartı desteğine ihtiyacınız varsa, ChatterUI kullanın. Yan yükleme gerekli maddesini giriş ücreti olarak kabul edin.
Yalnızca metin değil, görüntüleri ve sesi kapsayan çok modal yerel çıkarımı istiyorsanız, MNN LLM Chat kullanın. Burada seçeneklerin arasında giriş türlerinin en geniş aralığını destekliyor.
Android yerine iOS’dayorsanız bu listeyi atlayın. Private LLM o platformda bakılacak kıyaslama.
Sık Sorulan Sorular
Hangi Android Telefonlar Gerçekten Yerel LLM Çalıştırabiliyor?
6 GB RAM’i olan ve Q4 nicelik ile Snapdragon 778G veya daha yeni (veya eşdeğer MediaTek Dimensity 900 serisi) çalıştıran cihaz 1B ila 3B parametre modellerini kullanılabilir tempoda çalıştırabilir. 7B modeller en az 8 GB RAM ve kabul edilebilir hız için Snapdragon 8 Gen 1 veya daha iyisini gerektirir. 4 GB RAM’li bütçe telefonları 1B modellerini yükleyebilir ancak uygulamada sinir bozucu kadar yavaş metin üretecek.
Hugging Face’ten GGUF Modellerini İndirmek Güvenli mi?
GGUF bir ikili model biçimidir. Kötü şekilde oluşturulmuş dosya çıkarım uygulamasını çökertebilir, ancak burada listelenen uygulamalarda bir komut dosyası veya çalıştırılabilir gibi cihazınızda rastgele kod yürütemez. Yine de, anonim yüklemeler yerine yerleşik model sayfalarından (Meta, Google, Microsoft, Qwen takımı, EleutherAI) indirmelisiniz. Risk düşüktür ancak rastgele topluluk yüklenmesiyle sıfır değildir.
Android için En İyi Ücretsiz Yerel AI Sohbet Uygulaması Nedir?
PocketPal AI. Ücretsiz, Google Play’de, Hugging Face entegrasyonu aracılığıyla en geniş model çeşitliliğini destekliyor ve tutarlı güncellemeler alıyor. Çok modal desteğe ihtiyaç duyan kullanıcılar için, MNN LLM Chat ücretsiz alternatiftir.
Bu Uygulamalardan Herhangi Biri İnternet Olmadan Tamamen Çevrimdışı Çalışıyor mu?
Evet. PocketPal AI, Maid (yerel mod), SmolChat, ChatterUI ve MNN LLM Chat hepsi konuşma sırasında ağ aramaları olmadan cihazda tamamen çalışıyor. Başlangıç model indirmesi için sadece İnternet gerekir. Bundan sonra Uçak modu iyi çalışıyor.
Neden Çok Sayıda Yerel LLM Uygulaması Sadece Doğrudan APK Olarak Mevcut?
Google Play inceleme süreci ve politikalar, çalışma zamanında model ağırlıklarını indiren ve yürüten uygulamalar için sürtünme yaratıyor; bu teknik olarak dinamik kod yükleme ile benzerdir. Bu boşluktaki birkaç geliştirici bu sürtünmeden kaçınmak için GitHub APK aracılığıyla dağıtıyor. Bu dürüst bir takas: daha hızlı yineleme ve Play Store kısıtlaması yok alıyorsunuz ancak APK’yi kendiniz doğrulama sorumluluğunu alıyorsunuz. Projenin resmi GitHub yayınları sayfasından APK kurmak en güvenli yaklaşımdır.
Android’de Yerel LLM’ler ChatGPT veya Claude Aboneliğini Değiştirebilir mi?
Hızlı mesaj taslağı, bir paragrafı özetlemek veya gerçek soruyu yanıtlamak gibi kısa form görevleri için, evet. Karmaşık çok adımlı muhakeme, büyük dosyalarda kodlama yardımı veya son bilgi gerektiren görevler için, cevap daha sık hayır. Telefonda çalışan bir Qwen3-1.7B modeli, herhangi bir ticari API’nin arkasında çalışan olandan önemli ölçüde daha küçüktür. Kullanım durumu, sınırlanmış görevler için özel, çevrimdışı, sınırlamayan çıkarım; sınırı modeller için tam bir yedek değil.