gpt-oss-120b¶
Bu makalede
Bilgi
gpt-oss-120b, OpenAI'den açık ağırlıklarla tasarlanmış, derin düşünme, çok adımlı planlama ve araçlarla karmaşık etkileşim gerektiren yüksek performans görevleri için büyük ölçekli bir modeldir. Model 120 milyar parametreye sahiptir ve her geçişte yaklaşık olarak 21 milyar tanesi aktive edilir, bu da hesaplama gücü ile verimlilik arasında denge sağlar. İleri düzey kuantizasyon yöntemleri ve optimizasyon sayesinde, gpt-oss-120b 70 GB veya daha fazla video belleğine sahip sunucu donanımında dağıtılabilir ve ölçeklenebilir yerel ya da hibrit dağıtımları destekler.
gpt-oss-120b'nin Ana Özellikleri¶
- Koşullu Aktivasyonla Ölçeklenebilir Mimari: Modelde 120 milyar parametre bulunmakla birlikte, sparsel aktivasyon (sparse activation) mekanizması sayesinde her istekte yaklaşık 21 milyar parametreyi aktive eder. Bu, bellek ve hesaplama kaynaklarının önemli ölçüde azalmasına neden olurken kaliteyi etkilemeden.
- Gelişmiş Ajan Yetenekleri: gpt-oss-120b, kod çalıştırma, gerçek zamanlı web arama, API çağrısı ve JSON, XML gibi sıkı yapılandırılmış çıktıların (strictly structured outputs) oluşturulmasını içeren geniş bir araç setini destekler. Bu onu özgür ajanlar ve karmaşık otomatik sistemler için mükemmel bir temel haline getirir.
- Uyarlanabilir Mantıksal Düşünme: Model, hızlı doğrudan yanıtlardan çok adımlı düşünce zincirlerine (chain-of-thought) ve karar ağaçlarına kadar esnek bir mantık seviyeleri sistemi uygular. Kullanıcılar, görevin karmaşıklığına bağlı olarak "düşünce derinliği"ni kontrol edebilirler.
- Benchmarks Üzerinde Yüksek Performans: gpt-oss-120b, mantık, matematik, programlama ve disiplinler arası bilgi sentezi gerektiren görevlerde o3 ve o4 seviyelerindeki özel modellerle karşılaştırılabilir sonuçlar sergiler.
- Kapsamlı Çokdillilik Desteği: Model, 50'den fazla dildeki veri üzerinde eğitilmiştir ve çok dilli ve kültürel bağlamlarda etkili bir şekilde çalışabilir. En iyi sonuçlar için, dile ve kültürel çerçeveleri talimatta açıkça belirtmek önerilir.
- Verimli Quantization ve Uyumluluk: MXFP4 ve INT4 formatlarına destek sağlamak, bellek kullanımını önemli ölçüde azaltır ve kalite kaybı olmadan çıkış hızını artırır. Model, vLLM, GGUF ve Hugging Face Transformers gibi popüler çerçevelerle uyumludur.
Çalıştırma Özellikleri¶
| ID | Uyumlu OS | VM | BM | VGPU | GPU | Min CPU (Çekirdekler) | Min RAM (GB) | Min HDD/SSD (GB) | Aktif |
|---|---|---|---|---|---|---|---|---|---|
| 415 | Ubuntu 22.04 GPU | - | - | + | + | 16 | 128 | 240 | SİPARİŞ VER |
Sürümün teknik özellikleri:
- 6 sürümüne güncellenmiş Ubuntu 22.04;
- En son Nvidia sürücüler;
- CUDA Toolkit;
- Modelleri yönetmek için Ollama;
- Web arayüzü için OpenWebUI.
Kurulum özellikleri:
- Kurulum süresi, işletim sistemi kurulumunu içererek 35-45 dakika sürer;
- Ollama sunucusu gpt-oss-120b modelini GPU/RAM belleğinde yükler ve çalıştırır;
- Open WebUI, Ollama sunucusuna bağlı olarak bir web uygulaması olarak dağıtılır;
- Kullanıcılar, programlama ve ajan görevleri için Open WebUI web arayüzü üzerinden modelle etkileşime girer;
- Tüm hesaplamalar ve kod işleme sunucuda yerel olarak gerçekleştirilir;
- Yöneticiler, geliştirme görevleri için modeli OpenWebUI araçları kullanarak özelleştirebilir;
- Bellek kullanımını optimize etmek için çeşitli kuantizasyon seviyelerine destek sağlanır.
gpt-oss-120b Dağıtıldıktan Sonra Başlarken¶
Ödeme sonrasında, sipariş sırasında kayıtlı e-posta adresine sunucu hazır olduğunu bildiren bir bildirim gönderilecektir. Bu bildiriye sunucunun IP adresi, erişim için kullanıcı adı ve Şifre dahil olmak üzere bilgiler yer alacaktır, ayrıca OpenWebUI kontrol paneline giden bağlantı da bulunmaktadır. Müşteriler ekipmanını Sunucu Yönetim Paneli ve API — Invapi aracılığıyla yönetir.
- OS sunucusuna erişim için kimlik bilgileri (örneğin, SSH üzerinden), aldığınız e-postada gönderilecektir.
- Ollama kontrol paneline ve Open WebUI web arayüzüne giden bağlantı: Invapi'nin Info >> Tags sekmesindeki webpanel etiketinde. E-postada sunucu teslimatının bir parçası olarak, örneğin
https://gpt-oss<Server_ID_from_Invapi>.hostkey.inşeklinde tam bağlantı sağlanmış olacaktır.
Etiket webpanel üzerinden bağlantıya tıkladıktan sonra Get started with Open WebUI oturum açma penceresi açılacak, burada chatbot'unuz için bir yönetici hesabı adı, e-posta ve şifre oluşturmanız gerekir, ardından Create Admin Account düğmesine tıklamanız gerekir:

Dikkat
İlk kullanıcıyı kaydettikten sonra sistem onlara otomatik olarak bir yönetici rolü atar. Kayıt işlemini güvenli hale getirmek ve kontrol etmek için, tüm sonraki kayıt istekleri, yönetici hesabından OpenWebUI üzerinden onaylanmalıdır.
Başarılı kaydolduktan sonra, Gpt-oss-20b'ye erişim sağlayan ana Open WebUI arayüzü açılacaktır:

Not
Ollama kontrol paneli ile Open WebUI kullanımı hakkında ayrıntılı bilgi kendi sunucunuzda AI Chatbot makalesinde bulunabilir.
Not
gpt-oss-120b modelinin en iyi performans göstermesi için, 120B model için en az 70 GB video belleğine sahip bir GPU kullanılması önerilir. Uzun kod bağlamlarının ve karmaşık ajan görevlerinin verimli işlenmesi için, 80 GB video belleğine sahip GPU'ların kullanımı tavsiye edilir. Ana Ollama ayarları ve Open WebUI hakkında detaylı bilgi Ollama geliştirici dokümantasyonu ve Open WebUI geliştirici dokümantasyonunda bulunabilir.
Kullanım Tavsiyeleri
gpt-oss 20B modelinin verimliliğini maksimize etmek için:
- Modelin zincir-düşünce işleme dahil olmak üzere akıl yürütme görevleri için kullanılması önerilir. Model düşük, orta ve yüksek olan ayarlanabilir üç yoğunluk seviyesini destekler; bunlar sistem teşviki aracılığıyla yapılandırılır.
- Modelin dahili ajan yetenekleri olan fonksiyon çağırma, Python kodu çalıştırma ve yapılandırılmış çıkışların kullanılması.
- Modeli birden fazla aşamalı geliştirme görevlerinde ajan yeteneklerini kullanarak kullanma.
- Var olan geliştirme araçları ile modeli API aracılığıyla entegre etmeyi düşünün; model ayarlama ve OpenAI Harmony yanıt formatında çalışma desteği sunar. Model, yerel dahil olmak üzere düşük gecikmeli dağıtım için tasarlanmıştır.
API Kullanarak gpt-oss-120b ile Sunucu Siparişi Verme¶
Bu yazılımı API kullanarak kurmak için bu talimatları izleyin.
Bu sayfanın bazı içeriği AI ile oluşturulmuş veya çevrilmiştir.