gpt-oss-120b¶
Bu makalede
Bilgi
gpt-oss-120b, OpenAI tarafından geliştirilmiş, açık ağırlıklı büyük ölçekli bir modeldir; derin akıl yürütme, çok adımlı planlama ve araçlarla karmaşık etkileşim gerektiren yüksek performanslı görevler için tasarlanmıştır. Model 120 milyar parametre içermekte olup, her geçişte yaklaşık 21 milyar parametre aktif hale gelerek hesaplama gücü ile verimlilik arasında bir denge sağlar. Gelişmiş kuantizasyon yöntemleri ve optimizasyonlar sayesinde gpt-oss-120b, 70 GB veya daha fazla video belleğe sahip sunucu donanımında çalıştırılabilir ve ölçeklenebilir yerel veya hibrit dağıtımı destekler.
gpt-oss-120b'nin Ana Özellikleri¶
- Koşullu aktivasyona sahip ölçeklenebilir mimari: Model 120 milyar parametre içerse de, seyrek aktivasyon (sparse activation) mekanizması sayesinde her istekte yalnızca yaklaşık 21 milyar parametre aktif hale gelir. Bu durum, kaliteden ödün vermeden bellek ve hesaplama kaynakları gereksinimlerini önemli ölçüde azaltır.
- Gelişmiş ajan yetenekleri: gpt-oss-120b, kod yürütme, gerçek zamanlı web araması, API çağrıları ve sıkı yapılandırılmış çıktılar (JSON, XML vb.) oluşturma dahil geniş bir araç setini destekler. Bu özellik, otonom ajanlar ve karmaşık otomasyon sistemleri için ideal bir temel sunar.
- Uyarlanabilir akıl yürütme: Model, hızlı doğrudan yanıtlardan çok adımlı düşünce zincirlerine (chain-of-thought) ve karar ağaçlarına kadar esnek bir akıl yürütme seviyesi sistemi uygular. Kullanıcılar, görevin karmaşıklığına bağlı olarak "düşünme derinliğini" kontrol edebilir.
- Referans testlerinde yüksek performans: gpt-oss-120b, özellikle mantık, matematik, programlama ve disiplinler arası bilgi sentezi gerektiren görevlerde o3 ve o4 seviyesindeki kapalı kaynaklı modellerle karşılaştırılabilir sonuçlar göstermektedir.
- Kapsamlı çok dilli destek: Model, 50'den fazla dildeki verilerle eğitilmiş olup çok dilli ve çok kültürlü bağlamlarda etkili bir şekilde çalışabilir. En iyi sonuçlar için, istem (prompt) içinde dil ve kültürel çerçevelerin açıkça belirtilmesi önerilir.
- Verimli kuantizasyon ve uyumluluk: MXFP4 ve INT4 formatları desteği, kalitede önemli bir kayıp olmadan bellek kullanımını azaltmaya ve çıktı hızını artırmaya olanak tanır. Model, vLLM, GGUF ve Hugging Face Transformers gibi popüler çerçevelerle uyumludur.
Çalıştırma Özellikleri¶
| ID | Yazılım Adı | Uyumlu OS | VM | BM | VGPU | GPU | Min CPU (Çekirdekler) | Min RAM (GB) | Min HDD/SSD (GB) | Özel Alan Adı | Aktif |
|---|---|---|---|---|---|---|---|---|---|---|---|
| 415 | gpt-oss:120b | Ubuntu 22.04 | - | - | + | + | 16 | 128 | 240 | Hayır | SİPARİŞ VER |
Kurulumun teknik özellikleri:
- Çekirdeği 6. sürüme güncellenmiş Ubuntu 22.04;
- En son Nvidia sürücüleri;
- CUDA Toolkit;
- Modelleri yönetmek için Ollama;
- Web arayüzü için OpenWebUI.
Kurulum özellikleri:
- Kurulum süresi, işletim sistemi ayarlarını da içeren toplamda 35-45 dakikadır;
- Ollama sunucusu, gpt-oss-120b modelini GPU/RAM belleğinde yükler ve çalıştırır;
- Open WebUI, Ollama sunucusuna bağlı bir web uygulaması olarak dağıtılır;
- Kullanıcılar, modelle programlama ve ajan görevleri için Open WebUI web arayüzü üzerinden etkileşimde bulunur;
- Tüm hesaplamalar ve kod işlemleri sunucuda yerel olarak gerçekleşir;
- Yöneticiler, OpenWebUI araçlarını kullanarak modeli belirli geliştirme görevleri için yapılandırabilir;
- Bellek kullanımını optimize etmek için çeşitli kuantizasyon seviyeleri desteklenir.
gpt-oss-120b Dağıtıldıktan Sonra Başlangıç¶
Ödeme yapıldıktan sonra, sunucunun hazır olduğuna dair bildirim, sipariş sırasında kaydedilen e-posta adresine gönderilecektir. Bu bildirimde VPS IP adresi, sunucuya erişim için kullanıcı adı ve Şifre ile OpenWebUI kontrol paneline bağlantı yer alacaktır. Müşteriler, ekipmanları Sunucu Yönetim Paneli ve API — Invapi üzerinden yönetir.
- İşletim sistemi sunucusuna erişim için kimlik bilgileri (örneğin SSH üzerinden) alınan e-postada gönderilecektir.
- Open WebUI web arayüzüne sahip Ollama kontrol paneli bağlantısı: Invapi kontrol panelinin Configuration >> Tags sekmesindeki webpanel etiketinde bulunur. Tam bağlantı, örneğin
https://gpt-oss<Invapi'den_Sunucu_ID>.hostkey.in, sunucu teslim edildiğinde gönderilen e-postada sağlanır.
webpanel etiket bağlantısına ilk ziyaretinizde bir karşılama sayfası açılacaktır. Kurulumu başlatmak için Get started düğmesine tıklayın.
webpanel etiketinden bağlantıya tıkladıktan sonra, sohbet botunuz için bir yönetici hesap adı, e-posta ve Şifre oluşturmanız gereken Get started with Open WebUI giriş penceresi açılır, ardından Create Admin Account düğmesine basın:

Dikkat
İlk kullanıcı kaydedildikten sonra, sistemin kendine otomatik olarak yönetici rolü atar. Güvenliği ve kayıt süreci üzerindeki kontrolü sağlamak için, sonraki tüm kayıt talepleri OpenWebUI'da yönetici hesabından onaylanmalıdır.
Başarılı kayıt işleminden sonra, gpt-oss-120b'ye erişim sağlayan ana Open WebUI arayüzü açılacaktır:

Not
Open WebUI web arayüzüne sahip Ollama kontrol panelinin kullanımı hakkında detaylı bilgi, Kendi Sunucunuzda AI Sohbet Botu makalesinde bulunabilir.
Not
gpt-oss-120b modeli ile optimal çalışma için, 120B model için en az 70 GB video belleğe sahip bir GPU kullanılması önerilir. Uzun kod bağlamlarının ve karmaşık ajan görevlerinin verimli işlenmesi için 80 GB video belleğe sahip GPU'lar kullanmanızı öneririz. Ollama ayarları ve Open WebUI hakkında detaylı bilgi Ollama geliştirici dokümantasyonunda ve Open WebUI geliştirici dokümantasyonunda bulunabilir.
Kullanım Önerileri
gpt-oss-120b modelinin verimliliğini maksimize etmek için şunlar önerilir:
- Modeli, chain-of-thought işleme dahil olmak üzere akıl yürütme görevleri için kullanın. Model, düşük, orta ve yüksek olmak üzere ayarlanabilir akıl yürütme seviyelerini destekler; bunlar bir sistem istemi (system prompt) aracılığıyla yapılandırılır.
- Modelin yerleşik ajan yeteneklerinden yararlanın: fonksiyon çağrısı, Python kodu yürütme ve yapılandırılmış çıktılar.
- Modelin ajan yeteneklerinden faydalanarak çok aşamalı geliştirme görevleri için modeli kullanın.
- Modeli, ayarlama (tuning) desteklediği ve OpenAI Harmony yanıt formatında çalıştığı göz önünde bulundurularak mevcut geliştirme araçlarıyla API aracılığıyla entegre edin. Model, yerel dahil olmak üzere düşük gecikme süresiyle verimli dağıtım için tasarlanmıştır.
API Kullanarak gpt-oss-120b ile Sunucu Siparişi¶
Bu yazılımı API kullanarak kurmak için bu talimatları izleyin.