Başlıklar
Nvidia AI Developer Hesabından Yapılan Bir Paylaşımda, Bu Yeni Modelin “Llama-3.1-Nemotron-70B-Instruct” Adıyla lmarena.AI’nin Chatbot Arena’sında Lider Model Olduğu Belirtildi
Nemotron
Llama-3.1-Nemotron-70B-Instruct, Meta’nın açık kaynaklı Llama-3.1-70B-Instruct modelinin özelleştirilmiş bir versiyonu olarak tanımlanıyor. “Nemotron” ismi, modele kattığı yenilikleri ifade ediyor. Nvidia ise bu modeli daha “yardımcı” bir hale getirmek için özel veri setleri, gelişmiş ince ayar yöntemleri ve kendi ileri düzey AI donanımlarını kullanarak geliştirdi.
Bu sayede OpenAI’nin ChatGPT’si ve Anthropic’in Claude-3’ü gibi popüler modellerden daha işlevsel bir sistem ortaya çıkarmayı başardığını iddia ediyor.
Benchmarking (Karşılaştırmalı Performans Testleri)
Bir yapay zeka modelinin en iyi olup olmadığını belirlemek için açık ve net bir yöntem bulunmuyor. AI performansını ölçmek, termometre ile sıcaklık ölçmek gibi kesin bir gerçeğe dayanmıyor. Bu testler sırasında farklı AI modellerine aynı sorular, görevler veya problemler veriliyor ve sonuçların yararlılığı karşılaştırılıyor.
Nvidia’nın iddiasına göre, Nemotron mevcut en ileri düzey modellerden olan GPT-4o ve Claude-3’ü önemli bir farkla geride bırakıyor. Chatbot Arena’daki “Zor” test sonuçlarına göre Nvidia’nın Nemotron modeli 85 puan almış. Bu puan doğruysa, Nemotron’un bu alanda en iyi model olduğu anlamına geliyor.
İlginç Bir Nokta
Nvidia’nın başarı iddiasını daha da ilginç kılan şey, Meta’nın Llama-3.1-70B modelinin orta seviye bir açık kaynaklı model olmasıdır. Karşılaştırma yapmak gerekirse, GPT-4o’nun 1 trilyondan fazla parametreyle geliştirildiği tahmin ediliyor.
“Bitcoin Trade, Fed’in Faiz İndirimi Beklentilerini Azalttıkça 70.000 $ BTC Fiyatını Görebileceklerini Düşünüyor” adlı yazımıza buradan ulaşabilirsiniz.