📄 atl_smm6x1x60_x87.c
字号:
ALIGN8 faddp %st, %st(3) flds 192-BOFF(pA0,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(4) flds 192-BOFF(pA1,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(5) flds 192-BOFF(pA0,ldab,4) fmul %st(1), %st ALIGN8 faddp %st, %st(6) fmuls 192-BOFF(pA1,ldab,4) faddp %st, %st(6) ALIGN8#endif#if (KB > 49) flds 196-BOFF(pB0) flds 196-BOFF(pA0) fmul %st(1), %st faddp %st, %st(2) flds 196-BOFF(pA1) fmul %st(1), %st ALIGN8 faddp %st, %st(3) flds 196-BOFF(pA0,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(4) flds 196-BOFF(pA1,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(5) flds 196-BOFF(pA0,ldab,4) fmul %st(1), %st ALIGN8 faddp %st, %st(6) fmuls 196-BOFF(pA1,ldab,4) faddp %st, %st(6) ALIGN8#endif#if (KB > 50) flds 200-BOFF(pB0) flds 200-BOFF(pA0) fmul %st(1), %st faddp %st, %st(2) flds 200-BOFF(pA1) fmul %st(1), %st ALIGN8 faddp %st, %st(3) flds 200-BOFF(pA0,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(4) flds 200-BOFF(pA1,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(5) flds 200-BOFF(pA0,ldab,4) fmul %st(1), %st ALIGN8 faddp %st, %st(6) fmuls 200-BOFF(pA1,ldab,4) faddp %st, %st(6) ALIGN8#endif#if (KB > 51) flds 204-BOFF(pB0) flds 204-BOFF(pA0) fmul %st(1), %st faddp %st, %st(2) flds 204-BOFF(pA1) fmul %st(1), %st ALIGN8 faddp %st, %st(3) flds 204-BOFF(pA0,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(4) flds 204-BOFF(pA1,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(5) flds 204-BOFF(pA0,ldab,4) fmul %st(1), %st ALIGN8 faddp %st, %st(6) fmuls 204-BOFF(pA1,ldab,4) faddp %st, %st(6) ALIGN8#endif#if (KB > 52) flds 208-BOFF(pB0) flds 208-BOFF(pA0) fmul %st(1), %st faddp %st, %st(2) flds 208-BOFF(pA1) fmul %st(1), %st ALIGN8 faddp %st, %st(3) flds 208-BOFF(pA0,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(4) flds 208-BOFF(pA1,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(5) flds 208-BOFF(pA0,ldab,4) fmul %st(1), %st ALIGN8 faddp %st, %st(6) fmuls 208-BOFF(pA1,ldab,4) faddp %st, %st(6) ALIGN8#endif#if (KB > 53) flds 212-BOFF(pB0) flds 212-BOFF(pA0) fmul %st(1), %st faddp %st, %st(2) flds 212-BOFF(pA1) fmul %st(1), %st ALIGN8 faddp %st, %st(3) flds 212-BOFF(pA0,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(4) flds 212-BOFF(pA1,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(5) flds 212-BOFF(pA0,ldab,4) fmul %st(1), %st ALIGN8 faddp %st, %st(6) fmuls 212-BOFF(pA1,ldab,4) faddp %st, %st(6) ALIGN8#endif#if (KB > 54) flds 216-BOFF(pB0) flds 216-BOFF(pA0) fmul %st(1), %st faddp %st, %st(2) flds 216-BOFF(pA1) fmul %st(1), %st ALIGN8 faddp %st, %st(3) flds 216-BOFF(pA0,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(4) flds 216-BOFF(pA1,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(5) flds 216-BOFF(pA0,ldab,4) fmul %st(1), %st ALIGN8 faddp %st, %st(6) fmuls 216-BOFF(pA1,ldab,4) faddp %st, %st(6) ALIGN8#endif#if (KB > 55) flds 220-BOFF(pB0) flds 220-BOFF(pA0) fmul %st(1), %st faddp %st, %st(2) flds 220-BOFF(pA1) fmul %st(1), %st ALIGN8 faddp %st, %st(3) flds 220-BOFF(pA0,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(4) flds 220-BOFF(pA1,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(5) flds 220-BOFF(pA0,ldab,4) fmul %st(1), %st ALIGN8 faddp %st, %st(6) fmuls 220-BOFF(pA1,ldab,4) faddp %st, %st(6) ALIGN8#endif#if (KB > 56) flds 224-BOFF(pB0) flds 224-BOFF(pA0) fmul %st(1), %st faddp %st, %st(2) flds 224-BOFF(pA1) fmul %st(1), %st ALIGN8 faddp %st, %st(3) flds 224-BOFF(pA0,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(4) flds 224-BOFF(pA1,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(5) flds 224-BOFF(pA0,ldab,4) fmul %st(1), %st ALIGN8 faddp %st, %st(6) fmuls 224-BOFF(pA1,ldab,4) faddp %st, %st(6) ALIGN8#endif#if (KB > 57) flds 228-BOFF(pB0) flds 228-BOFF(pA0) fmul %st(1), %st faddp %st, %st(2) flds 228-BOFF(pA1) fmul %st(1), %st ALIGN8 faddp %st, %st(3) flds 228-BOFF(pA0,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(4) flds 228-BOFF(pA1,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(5) flds 228-BOFF(pA0,ldab,4) fmul %st(1), %st ALIGN8 faddp %st, %st(6) fmuls 228-BOFF(pA1,ldab,4) faddp %st, %st(6) ALIGN8#endif#if (KB > 58) flds 232-BOFF(pB0) flds 232-BOFF(pA0) fmul %st(1), %st faddp %st, %st(2) flds 232-BOFF(pA1) fmul %st(1), %st ALIGN8 faddp %st, %st(3) flds 232-BOFF(pA0,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(4) flds 232-BOFF(pA1,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(5) flds 232-BOFF(pA0,ldab,4) fmul %st(1), %st ALIGN8 faddp %st, %st(6) fmuls 232-BOFF(pA1,ldab,4) faddp %st, %st(6) ALIGN8#endif#if (KB > 59) flds 236-BOFF(pB0) flds 236-BOFF(pA0) fmul %st(1), %st faddp %st, %st(2) flds 236-BOFF(pA1) fmul %st(1), %st ALIGN8 faddp %st, %st(3) flds 236-BOFF(pA0,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(4) flds 236-BOFF(pA1,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(5) flds 236-BOFF(pA0,ldab,4) fmul %st(1), %st ALIGN8 faddp %st, %st(6) fmuls 236-BOFF(pA1,ldab,4) faddp %st, %st(6)/* ALIGN8 */#endif/* *End KLOOP *//* * Write results back to C */ fstps 0(pC0) fstps CMUL(4)(pC0) lea (pA1, ldab, 4), pA0 ALIGN8 fstps CMUL(8)(pC0) fstps CMUL(12)(pC0) lea (pA0, ldab, 2), pA1 ALIGN8 fstps CMUL(16)(pC0) fstps CMUL(20)(pC0) addl ldab, pA0 ALIGN8 addl $CMUL(24), pC0#endif#if (MB > 12)/*KLOOP: */#ifdef BETA0 flds 0-BOFF(pB0) flds 0-BOFF(pA1,ldab,4) fmul %st(1), %st fxch flds 0-BOFF(pA0,ldab,4) fmul %st(1), %st ALIGN8 fxch flds 0-BOFF(pA1,ldab,2) fmul %st(1), %st ALIGN8 fxch flds 0-BOFF(pA0,ldab,2) fmul %st(1), %st ALIGN8 fxch flds 0-BOFF(pA0,ldab) fmul %st(1), %st ALIGN8 fxch fmuls 0-BOFF(pA0) ALIGN8#elif defined(BETA1) flds 0-BOFF(pB0) flds 0-BOFF(pA0,ldab,4) fmul %st(1), %st fadds CMUL(16)(pC0) flds 0-BOFF(pA1,ldab,2) fmul %st(2), %st fadds CMUL(12)(pC0) flds 0-BOFF(pA0,ldab,2) fmul %st(3), %st fadds CMUL(8)(pC0) flds 0-BOFF(pA0,ldab) fmul %st(4), %st fadds CMUL(4)(pC0) flds 0-BOFF(pA0) fmul %st(5), %st fadds 0(pC0) flds 0-BOFF(pA1,ldab,4) fmul %st(6), %st fadds CMUL(20)(pC0) fstp %st(6)#else flds BETAOFF(%esp) flds CMUL(16)(pC0) fmul %st(1), %st flds CMUL(12)(pC0) fmul %st(2), %st flds CMUL(8)(pC0) fmul %st(3), %st flds CMUL(4)(pC0) fmul %st(4), %st ALIGN8 flds 0(pC0) fmul %st(5), %st flds CMUL(20)(pC0) fmul %st(6), %st fxch %st(6) fstp %st ALIGN8 flds 0-BOFF(pB0) flds 0-BOFF(pA0) fmul %st(1), %st faddp %st, %st(2) flds 0-BOFF(pA0,ldab) fmul %st(1), %st ALIGN8 faddp %st, %st(3) flds 0-BOFF(pA0,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(4) flds 0-BOFF(pA1,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(5) flds 0-BOFF(pA0,ldab,4) fmul %st(1), %st ALIGN8 faddp %st, %st(6) fmuls 0-BOFF(pA1,ldab,4) faddp %st, %st(6) ALIGN8#endif#if (KB > 1) flds 4-BOFF(pB0) flds 4-BOFF(pA0) fmul %st(1), %st faddp %st, %st(2) flds 4-BOFF(pA1) fmul %st(1), %st ALIGN8 faddp %st, %st(3) flds 4-BOFF(pA0,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(4) flds 4-BOFF(pA1,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(5) flds 4-BOFF(pA0,ldab,4) fmul %st(1), %st ALIGN8 faddp %st, %st(6) fmuls 4-BOFF(pA1,ldab,4) faddp %st, %st(6) ALIGN8#endif#if (KB > 2) flds 8-BOFF(pB0) flds 8-BOFF(pA0) fmul %st(1), %st faddp %st, %st(2) flds 8-BOFF(pA1) fmul %st(1), %st ALIGN8 faddp %st, %st(3) flds 8-BOFF(pA0,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(4) flds 8-BOFF(pA1,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(5) flds 8-BOFF(pA0,ldab,4) fmul %st(1), %st ALIGN8 faddp %st, %st(6) fmuls 8-BOFF(pA1,ldab,4) faddp %st, %st(6) ALIGN8#endif#if (KB > 3) flds 12-BOFF(pB0) flds 12-BOFF(pA0) fmul %st(1), %st faddp %st, %st(2) flds 12-BOFF(pA1) fmul %st(1), %st ALIGN8 faddp %st, %st(3) flds 12-BOFF(pA0,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(4) flds 12-BOFF(pA1,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(5) flds 12-BOFF(pA0,ldab,4) fmul %st(1), %st ALIGN8 faddp %st, %st(6) fmuls 12-BOFF(pA1,ldab,4) faddp %st, %st(6) ALIGN8#endif#if (KB > 4) flds 16-BOFF(pB0) flds 16-BOFF(pA0) fmul %st(1), %st faddp %st, %st(2) flds 16-BOFF(pA1) fmul %st(1), %st ALIGN8 faddp %st, %st(3) flds 16-BOFF(pA0,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(4) flds 16-BOFF(pA1,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(5) flds 16-BOFF(pA0,ldab,4) fmul %st(1), %st ALIGN8 faddp %st, %st(6) fmuls 16-BOFF(pA1,ldab,4) faddp %st, %st(6) ALIGN8#endif#if (KB > 5) flds 20-BOFF(pB0) flds 20-BOFF(pA0) fmul %st(1), %st faddp %st, %st(2) flds 20-BOFF(pA1) fmul %st(1), %st ALIGN8 faddp %st, %st(3) flds 20-BOFF(pA0,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(4) flds 20-BOFF(pA1,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(5) flds 20-BOFF(pA0,ldab,4) fmul %st(1), %st ALIGN8 faddp %st, %st(6) fmuls 20-BOFF(pA1,ldab,4) faddp %st, %st(6) ALIGN8#endif#if (KB > 6) flds 24-BOFF(pB0) flds 24-BOFF(pA0) fmul %st(1), %st faddp %st, %st(2) flds 24-BOFF(pA1) fmul %st(1), %st ALIGN8 faddp %st, %st(3) flds 24-BOFF(pA0,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(4) flds 24-BOFF(pA1,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(5) flds 24-BOFF(pA0,ldab,4) fmul %st(1), %st ALIGN8 faddp %st, %st(6) fmuls 24-BOFF(pA1,ldab,4) faddp %st, %st(6) ALIGN8#endif#if (KB > 7) flds 28-BOFF(pB0) flds 28-BOFF(pA0) fmul %st(1), %st faddp %st, %st(2) flds 28-BOFF(pA1) fmul %st(1), %st ALIGN8 faddp %st, %st(3) flds 28-BOFF(pA0,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(4) flds 28-BOFF(pA1,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(5) flds 28-BOFF(pA0,ldab,4) fmul %st(1), %st ALIGN8 faddp %st, %st(6) fmuls 28-BOFF(pA1,ldab,4) faddp %st, %st(6) ALIGN8#endif#if (KB > 8) flds 32-BOFF(pB0) flds 32-BOFF(pA0) fmul %st(1), %st faddp %st, %st(2) flds 32-BOFF(pA1) fmul %st(1), %st ALIGN8 faddp %st, %st(3) flds 32-BOFF(pA0,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(4) flds 32-BOFF(pA1,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(5) flds 32-BOFF(pA0,ldab,4) fmul %st(1), %st ALIGN8 faddp %st, %st(6) fmuls 32-BOFF(pA1,ldab,4) faddp %st, %st(6) ALIGN8#endif#if (KB > 9) flds 36-BOFF(pB0) flds 36-BOFF(pA0) fmul %st(1), %st faddp %st, %st(2) flds 36-BOFF(pA1) fmul %st(1), %st ALIGN8 faddp %st, %st(3) flds 36-BOFF(pA0,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(4) flds 36-BOFF(pA1,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(5) flds 36-BOFF(pA0,ldab,4) fmul %st(1), %st ALIGN8 faddp %st, %st(6) fmuls 36-BOFF(pA1,ldab,4) faddp %st, %st(6) ALIGN8#endif#if (KB > 10) flds 40-BOFF(pB0) flds 40-BOFF(pA0) fmul %st(1), %st faddp %st, %st(2) flds 40-BOFF(pA1) fmul %st(1), %st ALIGN8 faddp %st, %st(3) flds 40-BOFF(pA0,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(4) flds 40-BOFF(pA1,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(5) flds 40-BOFF(pA0,ldab,4) fmul %st(1), %st ALIGN8 faddp %st, %st(6) fmuls 40-BOFF(pA1,ldab,4) faddp %st, %st(6) ALIGN8#endif#if (KB > 11) flds 44-BOFF(pB0) flds 44-BOFF(pA0) fmul %st(1), %st faddp %st, %st(2) flds 44-BOFF(pA1) fmul %st(1), %st ALIGN8 faddp %st, %st(3) flds 44-BOFF(pA0,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(4) flds 44-BOFF(pA1,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(5) flds 44-BOFF(pA0,ldab,4) fmul %st(1), %st ALIGN8 faddp %st, %st(6) fmuls 44-BOFF(pA1,ldab,4) faddp %st, %st(6) ALIGN8#endif#if (KB > 12) flds 48-BOFF(pB0) flds 48-BOFF(pA0) fmul %st(1), %st faddp %st, %st(2) flds 48-BOFF(pA1) fmul %st(1), %st ALIGN8 faddp %st, %st(3) flds 48-BOFF(pA0,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(4) flds 48-BOFF(pA1,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(5) flds 48-BOFF(pA0,ldab,4) fmul %st(1), %st ALIGN8 faddp %st, %st(6) fmuls 48-BOFF(pA1,ldab,4) faddp %st, %st(6) ALIGN8#endif#if (KB > 13) flds 52-BOFF(pB0) flds 52-BOFF(pA0) fmul %st(1), %st faddp %st, %st(2) flds 52-BOFF(pA1) fmul %st(1), %st ALIGN8 faddp %st, %st(3) flds 52-BOFF(pA0,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(4) flds 52-BOFF(pA1,ldab,2) fmul %st(1), %st ALIGN8 faddp %st, %st(5) flds 52-BOFF(pA0,ldab,4) fmul %st(1), %st
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -