atl_dmm6x1x60pabc.c
来自「基于Blas CLapck的.用过的人知道是干啥的」· C语言 代码 · 共 3,694 行 · 第 1/5 页
C
3,694 行
fldl 296+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 296+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 296+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 296+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 296+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 304(pB) fldl 304(pA) fmul %st(1), %st faddp %st, %st(2) fldl 304+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 304+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 304+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 304+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 304+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 312(pB) fldl 312(pA) fmul %st(1), %st faddp %st, %st(2) fldl 312+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 312+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 312+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 312+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 312+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 320(pB) fldl 320(pA) fmul %st(1), %st faddp %st, %st(2) fldl 320+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 320+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 320+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 320+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 320+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 328(pB) fldl 328(pA) fmul %st(1), %st faddp %st, %st(2) fldl 328+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 328+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 328+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 328+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 328+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 336(pB) fldl 336(pA) fmul %st(1), %st faddp %st, %st(2) fldl 336+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 336+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 336+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 336+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 336+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 344(pB) fldl 344(pA) fmul %st(1), %st faddp %st, %st(2) fldl 344+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 344+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 344+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 344+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 344+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 352(pB) fldl 352(pA) fmul %st(1), %st faddp %st, %st(2) fldl 352+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 352+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 352+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 352+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 352+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 360(pB) fldl 360(pA) fmul %st(1), %st faddp %st, %st(2) fldl 360+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 360+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 360+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 360+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 360+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 368(pB) fldl 368(pA) fmul %st(1), %st faddp %st, %st(2) fldl 368+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 368+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 368+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 368+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 368+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 376(pB) fldl 376(pA) fmul %st(1), %st faddp %st, %st(2) fldl 376+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 376+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 376+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 376+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 376+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 384(pB) fldl 384(pA) fmul %st(1), %st faddp %st, %st(2) fldl 384+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 384+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 384+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 384+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 384+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 392(pB) fldl 392(pA) fmul %st(1), %st faddp %st, %st(2) fldl 392+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 392+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 392+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 392+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 392+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 400(pB) fldl 400(pA) fmul %st(1), %st faddp %st, %st(2) fldl 400+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 400+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 400+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 400+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 400+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 408(pB) fldl 408(pA) fmul %st(1), %st faddp %st, %st(2) fldl 408+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 408+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 408+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 408+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 408+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 416(pB) fldl 416(pA) fmul %st(1), %st faddp %st, %st(2) fldl 416+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 416+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 416+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 416+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 416+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 424(pB) fldl 424(pA) fmul %st(1), %st faddp %st, %st(2) fldl 424+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 424+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 424+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 424+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 424+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 432(pB) fldl 432(pA) fmul %st(1), %st faddp %st, %st(2) fldl 432+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 432+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 432+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 432+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 432+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 440(pB) fldl 440(pA) fmul %st(1), %st faddp %st, %st(2) fldl 440+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 440+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 440+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 440+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 440+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 448(pB) fldl 448(pA) fmul %st(1), %st faddp %st, %st(2) fldl 448+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 448+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 448+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 448+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 448+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) prefC(48(pC)) fldl 456(pB) fldl 456(pA) fmul %st(1), %st faddp %st, %st(2) fldl 456+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 456+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 456+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 456+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 456+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 464(pB) fldl 464(pA) fmul %st(1), %st faddp %st, %st(2) fldl 464+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 464+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 464+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 464+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 464+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 472(pB) fldl 472(pA) fmul %st(1), %st faddp %st, %st(2) fldl 472+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 472+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 472+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 472+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 472+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6)/* addq $480, pA *//* addq $480, pB *//* * While (pB != stK); *//* cmp pB, stK *//* jne KLOOP *//* * Write results back to C */ fstpl (pC) fstpl 8(pC) fstpl 16(pC) fstpl 24(pC) fstpl 32(pC) fstpl 40(pC)/* * pC += 6; pA += 5*NB; pB -= NB; */ addq $48, pC addq $NB6so, pA#ifdef BETA0 fldz fldz fldz fldz fldz fldz#else fldl 40(pC) fldl 32(pC) fldl 24(pC) fldl 16(pC) fldl 8(pC) fldl (pC) #ifdef BETAX fldl BETAOFF(%rsp) fmul %st, %st(1) fmul %st, %st(2) fmul %st, %st(3) fmul %st, %st(4) fmul %st, %st(5) fmulp %st, %st(6) #endif#endif ALIGN16/*KLOOP: */ fldl (pB) fldl (pA) fmul %st(1), %st faddp %st, %st(2) fldl NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 8(pB) fldl 8(pA) fmul %st(1), %st faddp %st, %st(2) fldl 8+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 8+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 8+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 8+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 8+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 16(pB) fldl 16(pA) fmul %st(1), %st faddp %st, %st(2) fldl 16+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 16+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 16+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 16+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 16+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 24(pB) fldl 24(pA) fmul %st(1), %st faddp %st, %st(2) fldl 24+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 24+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 24+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 24+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 24+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 32(pB) fldl 32(pA) fmul %st(1), %st faddp %st, %st(2) fldl 32+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 32+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 32+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 32+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 32+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 40(pB) fldl 40(pA) fmul %st(1), %st faddp %st, %st(2) fldl 40+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 40+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 40+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 40+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 40+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 48(pB) fldl 48(pA) fmul %st(1), %st faddp %st, %st(2) fldl 48+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 48+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 48+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 48+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 48+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 56(pB) fldl 56(pA) fmul %st(1), %st faddp %st, %st(2) fldl 56+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 56+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 56+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 56+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 56+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 64(pB) fldl 64(pA) fmul %st(1), %st faddp %st, %st(2) fldl 64+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 64+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 64+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 64+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 64+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 72(pB) fldl 72(pA) fmul %st(1), %st faddp %st, %st(2) fldl 72+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 72+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 72+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 72+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 72+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 80(pB) fldl 80(pA) fmul %st(1), %st faddp %st, %st(2) fldl 80+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 80+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 80+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 80+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 80+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 88(pB) fldl 88(pA) fmul %st(1), %st faddp %st, %st(2) fldl 88+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 88+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 88+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 88+NB4so(pA)
⌨️ 快捷键说明
复制代码Ctrl + C
搜索代码Ctrl + F
全屏模式F11
增大字号Ctrl + =
减小字号Ctrl + -
显示快捷键?