AI Çoklu Model Savaşı: Açık Kaynak Yükselişi Algoritma İnovasyonu Mühendislik Uygulamalarına Yerini Bırakıyor

robot
Abstract generation in progress

AI alanındaki "yüz model savaşı": mühendislik sorunları algoritma yeniliklerinin yerini alıyor

Geçen ay, AI dünyasında bir "hayvanlar savaşı" patlak verdi. Bir tarafta Meta'nın geliştirdiği Llama modeli, açık kaynak özelliğiyle geliştiricilerin beğenisini kazandı. Diğer tarafta ise Mayıs'ta piyasaya çıkan Falcon adında büyük bir model, Llama'yı geride bırakarak açık kaynak LLM sıralamasında zirveye yerleşti.

İlginçtir ki, Falcon'un geliştiricisi Birleşik Arap Emirlikleri'ndeki Teknoloji İnovasyon Araştırma Enstitüsü. 180B sürümü yayınlandıktan sonra, Birleşik Arap Emirlikleri Yapay Zeka Bakanı, Time dergisinin AI alanındaki en etkili 100 kişi listesine seçildi.

Artık belli bir mali güce sahip ülkeler ve şirketler, kendi büyük dil modellerini oluşturuyor. Sadece Körfez ülkelerinde birden fazla oyuncu var, Suudi Arabistan yeni bir üniversite için 3000'den fazla H100 çip satın aldı ve LLM eğitimi için kullanacak.

Bu "Büyük Model Savaşı"nın arkasında, Transformer algoritmasının katkısı var. 2017'de, Google "Attention Is All You Need" makalesinde Transformer algoritmasını açıkladı ve bu, bu AI patlamasının tetikleyicisi oldu. Sonrasında tüm büyük modeller, GPT serisi de dahil olmak üzere, Transformer üzerine inşa edildi.

Transformer, erken dönem sinir ağlarının bağlamı anlamakta zorlanma sorununu çözdü, eğitim verimliliğini büyük ölçüde artırdı ve AI'yı büyük model dönemine taşıdı. Bu, büyük modellerin teorik araştırmadan tamamen mühendislik sorununa dönüşmesini sağladı - yeterli veri, hesaplama gücü ve model mimarisi olduğunda, teknik yeteneği olan herhangi bir şirket büyük bir model oluşturabilir.

Bu, akademik dünyadaki temel algoritma yeniliklerinin hızının yavaşlamasına neden oldu; veri, hesaplama gücü, model mimarisi gibi mühendislik unsurları AI yarışmalarının anahtarı haline geldi. Bazı analizler, hatta GPT-4'ün rekabet gücünün de esasen mühendislik çözümlerinden kaynaklandığını, açık kaynak olması durumunda rakiplerin hızla kopyalayabileceğini öne sürüyor.

Ancak, girişin kolay olması herkesin AI çağının devlerinden biri olabileceği anlamına gelmez. Meta'nın Llama serisi, açık kaynaklı LLM'lerin yön göstereni haline geldi ve büyük bir geliştirici topluluğuna sahip. Performans açısından ise, GPT-4 hala çok önde, diğer modeller onun yanına bile yaklaşamıyor.

Büyük modellerin temel rekabet avantajı, ekosistem inşası veya saf çıkarım yeteneğindedir, yalnızca parametre ölçeği ile değil. Açık kaynak topluluğunun giderek daha aktif hale gelmesiyle, çeşitli LLM'lerin performansları benzer hale gelebilir.

Daha büyük bir zorluk, kârlılık modelidir. Az sayıda istisna dışında, çoğu büyük model sağlayıcısı, maliyet ile gelir arasında ciddi bir dengesizlik sorunu yaşamaktadır. Yüksek hesaplama maliyetleri, sektörün gelişimi için bir engel haline gelmiştir ve yazılım şirketleri büyük maliyetler ödedikten sonra hâlâ net bir kâr elde etme yöntemi bulamamıştır.

Homojen rekabetin artması ve açık kaynak modellerinin çoğalmasıyla birlikte, yalnızca büyük model tedarikçileri daha büyük bir baskı ile karşılaşabilir. Gelecekte, gerçek değer muhtemelen modelin kendisinde değil, uygulama senaryolarında ve ticarileştirme yeteneklerinde yatmaktadır.

GPT5.81%
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • 5
  • Share
Comment
0/400
SingleForYearsvip
· 18h ago
Yeni başlayanlar bu büyük modelleri anlayamıyor.
View OriginalReply0
OnChainDetectivevip
· 18h ago
Suudi Arabistan yine büyük miktarda çip stokluyor... Daha önce tespit ettiğim Birleşik Arap Emirlikleri'ndeki büyük transferlerin gerçekten bir bağlantısı mı var? Arkadaki finansman kaynağı derinlemesine incelenmeli.
View OriginalReply0
StakeTillRetirevip
· 19h ago
Artık algoritma yarışından kurtuldum!
View OriginalReply0
SocialAnxietyStakervip
· 19h ago
Yongaya para göndermek bu kadar mı basit?
View OriginalReply0
TheMemefathervip
· 19h ago
Neredeyse hepsi tamamlandı.
View OriginalReply0
  • Pin
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate app
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)