Написал вставку на ассемблере для выполнения скалярного перемножения двух массивов на SSE
Код:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 | asm
push esi
push edi
mov ecx,k
lea esi,a
lea edi,b
lea edx,u
xor eax,eax
lea ebx,c
xor eax,eax
@@loop:
movups xmm1,[esi]
movups xmm2,[edi]
mulps xmm1,xmm2
movups [edx],xmm1
add esi, 16
add edi, 16
add ebx, 16
add edx, 16
dec ecx
jne @@loop
pop edi
pop esi
fld x
fld y
fmul
fadd q
fstp z
xor eax,eax
xor ebx,ebx
end ;
|
При вызове процедуры с этой вставкой 98000 раз в переменную Х начинает приходить NAN на процессоре Intel Core 2 Duo E8200, на процессоре Intel i5 M430 такой проблемы не наблюдается, на других процессорах пока не пробовал, в чем может быть дело? Почему всегда на именно на 98001 разе всплывает ошибка? Может какой регистр состояния или какой то флаг надо скинуть? В какую сторону думать?