<div dir="ltr"><div><div><div><div><div>I did some benchmarking with 3 versions of the cuda toolkit on my box.<br><br></div>My interpretation of the results is that it could be good to move to cuda 5.0.<br></div>But more importantly 24 max registers seems to be sub optimal in the scenes I have tested with.<br>
<br></div>It could maybe be good to see if the default for sm_21 and sm_20 cards could be moved to 32 as it is for sm_3x currently. <br><br></div>Also note that I tested with the release 2.67b linux from <a href="http://b.org">b.org</a>. <br>
<br></div>Martijn<br></div>