Vad jag vet ska JBLAS vara ganska hyggligt: https://github.com/mikiobraun/jblas
Har dock inte kört det själv.
Tycker dock att ND4J också ser rätt snabbt ut. NASA ska också ha använt det för simuleringar så det är säkert snabbt, särskilt om du kör på GPU.