Yandex Araştırmaları LLM’leri Sıkıştırmak İçin Yeni Yöntemler Geliştirerek Yapay Zeka Dağıtım Maliyetlerini 8 Kata Kadar Azalttı

23 Temmuz 2024 23:12

425

Yandex Araştırma ekibi, IST Austria, NeuralMagic ve KAUST araştırmacılarla işbirliği yaparak büyük dil modelleri için iki yeni sıkıştırma yöntemi geliştirdi: Dil Modelleri için Eklemeli Niceleme (AQLM) ve PV-Tuning. Bu yöntemler bir araya getirildiğinde model boyutunda 8 kata kadar azalma sağlarken yanıt kalitesini %95 oranında koruyor. Kaynakları optimize etmeyi ve büyük dil modellerinin çalıştırılmasında verimliliği artırmayı amaçlayan bu yeni yaklaşımın detaylarına dair makale, şu an Viyana, Avusturya’da devam etmekte olan Uluslararası Makine Öğrenimi Konferansı’nda (ICML) yer aldı.

AQLM ve PV-Tuning’in temel özellikleri

AQLM, LLM sıkıştırması için geleneksel olarak bilgi erişiminde kullanılan eklemeli niceleme yönteminden yararlanıyor. Ortaya çıkan yöntem aşırı sıkıştırma altında modelin doğruluğunu koruyup geliştiriyor, böylece LLM’lerin ev bilgisayarları gibi günlük cihazlarda yaygınlaştırılmasını mümkün kılıyor. Bu, bellek tüketiminde önemli bir azalmaya neden oluyor.

PV-Tuning ise model sıkıştırma işlemi sırasında ortaya çıkabilecek hataları gideriyor. AQLM ve PV-Tuning birleştirildiğinde, sınırlı bilgi işlem kaynaklarında bile yüksek kalitede yanıtlar sağlayabilen kompakt bir model eşliğinde optimum sonuçlar sunuyor.

Yöntem değerlendirme ve tanıma

Sunulan yöntemlerin etkinliği, LLama 2, Mistral ve Mixtral gibi popüler açık kaynaklı modeller kullanılarak titizlikle değerlendirildi. Araştırmacılar bu büyük dil modellerini sıkıştırarak cevap kalitesini İngilizce karşılaştırma ölçütleri olan WikiText2 ve C4 ile değerlendirdi. Modeller 8 kat sıkıştırılmalarına rağmen %95 gibi etkileyici bir oranda cevap kalitesini korumayı başardı.

AQLM ve PV-Tuning’den kimler yararlanabilir

Yeni yöntemler, tescilli dil modellerini ve açık kaynaklı LLM’leri geliştiren ve dağıtan şirketler için önemli ölçüde kaynak tasarrufu sağlıyor. Örneğin sıkıştırma sonrası 13 milyar parametreye sahip Llama 2 modeli artık 4 yerine sadece 1 GPU üzerinde çalışarak donanım maliyetlerinde 8 kata kadar azalma sağlıyor. Bu da girişimlerin, bireysel araştırmacıların ve LLM meraklılarının Llama gibi gelişmiş LLM’leri günlük kullandıkları bilgisayarlarda çalıştırabilecekleri anlamına geliyor.

Yeni LLM uygulamalarını keşfetmek

AQLM ve PV-Tuning, modellerin sınırlı hesaplama kaynaklarına sahip cihazlarda çevrimdışı olarak dağıtılmasını mümkün kılarak, akıllı telefonlar, akıllı hoparlörler ve daha fazlası için yeni kullanım alanları sağlar. Bu cihazlara entegre edilen gelişmiş LLM’ler sayesinde kullanıcılar metin ve görüntü oluşturma, sesli yardım, kişiselleştirilmiş öneriler ve hatta gerçek zamanlı dil çevirisini aktif bir internet bağlantısına ihtiyaç duymadan kullanabiliyor.

Ayrıca, bu yöntemler kullanılarak sıkıştırılan modeller daha az hesaplama gerektirdiğinden 4 kata kadar daha hızlı çalışabiliyor.

Uygulama ve erişim

Dünya genelindeki geliştiriciler ve araştırmacılar, GitHub’da bulunan AQLM ve PV-Tuning’i kullanabiliyor. Geliştiriciler tarafından sağlanan demo materyalleri, çeşitli uygulamalar için sıkıştırılmış LLM’leri etkili bir şekilde eğitmek için rehberlik sunuyor. Ayrıca geliştiriciler, bu yöntemler kullanılarak sıkıştırılmış popüler açık kaynaklı modelleri indirebiliyorlar.

ICML’de öne çıktı

Yandex Research’ün AQLM sıkıştırma yöntemine ilişkin bilimsel makalesi, dünyanın en prestijli makine öğrenimi konferanslarından biri olan ICML’de yayınlandı. IST Austria’dan araştırmacılar ve yapay zeka girişimi Neural Magic’ten uzmanlarla birlikte hazırlanan bu çalışma, LLM sıkıştırma teknolojisinde önemli bir ilerleme anlamına geliyor.

Kaynak: (BYZHA) Beyaz Haber Ajansı

Admin

YORUMLAR

[ Yoruma cevap yazmaktan vazgeç ]

Henüz yorum yapılmamış. İlk yorumu yukarıdaki form aracılığıyla siz yapabilirsiniz.

SON DAKİKA HABERLERİ

28 Ocak 2026 14:53

İstanbul’da 14 İlçede Uyuşturucu Operasyonu: 39 Şüpheli Yakalandı

İstanbul’da bir ayda 14 ilçede düzenlenen uyuşturucu operasyonlarında 39 şüpheli yakalandı, çok miktarda uyuşturucu ve hap ele geçirildi. İstanbul Emniyet Müdürlüğü Narkotik Suçlarla Mücadele Şube Müdürlüğü ekipleri, İstihbarat Şube Müdürlüğü...

28 Ocak 2026 14:38

ABD’nin El Koyduğu Tankerdeki Rus Denizciler Serbest

ABD’nin el koyduğu petrol tankerindeki iki Rus denizci serbest bırakılarak Rusya’ya dönüyor. Rusya Dışişleri Bakanlığı Sözcüsü Mariya Zaharova, ABD tarafından el konulan bir petrol tankerinde bulunan Rus denizcilerin durumuna ilişkin...

28 Ocak 2026 14:32

Diyarbakır Enerji Üssü Oluyor: Petrol ve Doğal Gazdan Elektrik

Diyarbakır, kaya petrolü üretimi ve doğal gazdan elektrik enerjisi elde edilmesiyle enerji alanında önemli bir merkez haline geliyor. Enerji ve Tabii Kaynaklar Bakanlığı verilerine göre, Türkiye Petrolleri Anonim Ortaklığı (TPAO),...

28 Ocak 2026 14:20

Fenerbahçe’de FCSB Maçı Öncesi Sakatlık ve Kadro Krizi

Fenerbahçe’de Edson Alvarez’in sakatlığı ve diğer oyuncuların durumu FCSB maçı öncesi belirsizlik yarattı. Fenerbahçe’de bireysel antrenmanlarını sürdüren Edson Alvarez’in ayak bileğinde ödem oluştuğu ve bu durumun oyuncunun FCSB karşısında forma...

28 Ocak 2026 13:38

Restoranlarda Ek Ücretler Yasaklandı: Sadece Menü Fiyatı Geçerli

Restoranlarda beklenmedik ek ücretler sona eriyor; sadece menüdeki fiyatlar geçerli olacak. Hazırlanan yeni düzenleme ile birlikte, restoran ve benzeri işletmeler menülerinde belirtilen fiyatlar dışında hiçbir ek ücret talep edemeyecek. Servis...

28 Ocak 2026 13:34

Dışişleri Bakanı Fidan’dan İran’a Tek Tek Dosya Kapatma Önerisi

Dışişleri Bakanı Hakan Fidan, İran ile müzakerelerde tek tek dosya kapatma yöntemini önerdi. Dışişleri Bakanı Hakan Fidan, Al Jazeera’ya verdiği röportajda İran ile ilgili önemli açıklamalarda bulundu. Fidan, İran’a yeniden...

YAZARLAR

Turhan AKŞEN

Samsun’dan Bir Özgür Özel Geçti Bölüm 3

18 Nisan 2025 19:16

TÜM YAZARLARI GÖSTER

ALIŞVERİŞİN GÜVENLİ ADRESİ

Kemer Belediyespor U11 ilk maçını kazandı

Büyükşehir’den 15’inci ASFİM

Kemer Belediyespor Play

Ege Üniversitesi Spor Kulübüne yeni merkez tahsis edildi

Şubat’ta spor ve heyecan var

Adana Adıyaman Afyon Ağrı Aksaray Amasya Ankara Antalya Ardahan Artvin Aydın Balıkesir Bartın Batman Bayburt Bilecik Bingöl Bitlis Bolu Burdur Bursa Çanakkale Çankırı Çorum Denizli Diyarbakır Düzce Edirne Elazığ Erzincan Erzurum Eskişehir Gaziantep Giresun Gümüşhane Hakkari Hatay Iğdır Isparta İstanbul İzmir K.Maraş Karabük Karaman Kars Kastamonu Kayseri Kırıkkale Kırklareli Kırşehir Kilis Kocaeli Konya Kütahya Malatya Manisa Mardin Mersin Muğla Muş Nevşehir Niğde Ordu Osmaniye Rize Sakarya Samsun Siirt Sinop Sivas Şanlıurfa Şırnak Tekirdağ Tokat Trabzon Tunceli Uşak Van Yalova Yozgat Zonguldak