Bir döngüde birkaç engel içeren bir OpenCL çekirdeği yazıyorum. Çekirdeği CPU üzerinde test ettim (8 çekirdekli FX8150) ve sonuç bu bariyerlerin çalışma hızını 50 - 100 kat azalttığını gösteriyor (bunu daha sonra birden çok iş parçacığı + CyclicBarrier kullanarak Java'daki çekirdeği yeniden uygulayarak doğruladım) . Bariyerin asıl olarak CPU'nun sipariş dışı uygulamadan yararlanma nedenini durduğundan şüpheleniyorum, bu yüzden GPU'da aynı hızdaki düşüşü gözlemlerseniz biraz endişeliyim. Birkaç resmi belgeyi kontrol ettim ve biraz etrafta dolaştım ama bu konuda çok az bilgi var.Modern GPU (ör. Fermi/Evergreen) sipariş yürütmeyi desteklemiyor mu?
5
A
cevap
7
Mevcut üzere işlemci ardışık sanat GPU'lar state-of-the. GPU'lar boru hattını farklı çözgülerden (dalga cepheleri) gelen talimatları birleştirerek etkin bir şekilde doldururlar. Karşılaştırmalarda, CPU'lar boru hattını doldurmak için sıra dışı spekülatif yürütme kullanır. Ayrı boru hatlarına sahip olan ALU'lar ve SFU'lar gibi farklı işlevsel birimler vardır. Ancak talimat bağımlılığının warp'i durduğuna dikkat edin. GPU'larda çözme talimatı hakkında daha fazla bilgi için this NVIDIA patent'a bakın.
2
NVIDIA'nın Yeni Nesil
CUDA hesaplayın ve Grafik Mimarlık, “Fermi” Kod-Adlandırılan:
Nvidia GigaThread Engine anahtarlama (sayfa 5 de)
- 10x daha hızlı uygulama bağlamının yeteneklere sahiptir
- Eşzamanlı çekirdek yürütme
- İşlenecek konu blok yürütme :)
- çift üst üste bellek aktarımı motorları
İlgili konular
- 1. System.Linq.Dynamic OrderByDescending ("someColumn") desteklemiyor mu?
- 2. IE 8 itmeyi desteklemiyor mu?
- 3. GPU üzerinde tamsayı hesaplamaları
- 4. C# grafikler için GPU kullanıyor mu?
- 5. GPU
- 6. mu Python ithalat sipariş madde
- 7. WCF DataService, ön kontrol opsiyonlarını desteklemiyor mu?
- 8. OS X, epoll işlevini desteklemiyor mu?
- 9. xslt-fo utf-8'i desteklemiyor mu?
- 10. NVelocity artık dize şablonlarını desteklemiyor mu?
- 11. SearchRequest, radius ve GeoBoundingBox parametrelerini desteklemiyor mu?
- 12. pandalar MovingOLS NA değerlerini desteklemiyor mu?
- 13. gperftools işlemci profiler çoklu işlemleri desteklemiyor mu?
- 14. Phongap Build, Windows 10 desteğini desteklemiyor mu?
- 15. Seaborn distplot bir aralığı desteklemiyor mu?
- 16. Libxml2 XPath 2.0'ı destekliyor mu, desteklemiyor mu?
- 17. python yürütmeyi hızlandırma nasıl yapılır
- 18. Yürütmeyi durdurmadan istisna atın?
- 19. Bu üyeler belirsiz sipariş veriyor mu?
- 20. XML'de Sipariş Materyali DataContractSerializer Tarafından Okunur mu?
- 21. TensorFlow: GPU
- 22. Pandalar, yyyyQp (ör. 2013Q2) formunun üç aylık tarihlerini destekliyor mu?
- 23. Yayınları desteklemiyor
- 24. Delphi XE2 Veri kümesi alan türü TStringField Unicode'u desteklemiyor mu?
- 25. Chrome v23, görünüm ölçeği veya viewport meta etiketini desteklemiyor mu?
- 26. Gölgelendiricilerin GPU üzerinde çalışmasını sağlama
- 27. System.Data.SQLite Çoklu İşlemleri Desteklemiyor
- 28. habtm ilişkisi desteklemiyor: bağımlı seçenek
- 29. Sipariş
- 30. çok GPU temel kullanımı
Tabi ki vardır. Zaman-alma fpu hesaplarını kod aracılığıyla heterojen bir şekilde bölmelisiniz, böylece tamsayı calc yapabilir. aynı anda yüzer –
@ tuğrulbüyükışık teşekkürler. Beni (referans amaçlı) onaylayan resmi bir belgeye yönlendirebilir misiniz? – aaronqli