gpu'da ölçü birimi olarak flops kullanılıyor ama sağlıklı bir sayı değil. Sebebi de GPU'daki en yavaş iş floating point işler değil, texture access. Bunun hızını ölçmek de çok zor, bunun iki sebebi var:
-texture access diğer floating işlemlere paralel bir iş, bir fetch ardından o sonuçlanana kadar başka işler yapabiliyor, yeni bir fetch hariç.
-fetch unitler, texture datasını 2x2'lik cacheler halinde alıyor. dolayısıyla sağa sola access etmektense texture datasını sırayla lokal olarak işlemek daha hızlı, ama bu her zaman mümkün olamıyor.
hatta fetching o kadar yavaş ki, çoğu durumda lookup table olarak texture kullanmak yerine, her arithmetic unitte table'ın gerekli kısımlarını online hesaplamak daha hesaplı oluyor.
benim şu ana kadar gördüğüm gpu implementation whitepaperlarda hız ölçütü aynı işin cpu implementationıyla karşılaştırmak suretiyle yapılıyor. "şu iş şu gpu'da şu cpu'nun şu kadar katı daha az zaman aldı." gibi.
physx'i duymadım.