atl_dmm6x1x60pabc.c
来自「基于Blas CLapck的.用过的人知道是干啥的」· C语言 代码 · 共 3,694 行 · 第 1/5 页
C
3,694 行
faddp %st, %st(6) fldl 200+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 208(pB) fldl 208(pA) fmul %st(1), %st faddp %st, %st(2) fldl 208+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 208+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 208+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 208+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 208+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 216(pB) fldl 216(pA) fmul %st(1), %st faddp %st, %st(2) fldl 216+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 216+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 216+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 216+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 216+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 224(pB) fldl 224(pA) fmul %st(1), %st faddp %st, %st(2) fldl 224+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 224+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 224+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 224+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 224+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 232(pB) fldl 232(pA) fmul %st(1), %st faddp %st, %st(2) fldl 232+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 232+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 232+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 232+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 232+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 240(pB) fldl 240(pA) fmul %st(1), %st faddp %st, %st(2) fldl 240+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 240+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 240+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 240+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 240+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 248(pB) fldl 248(pA) fmul %st(1), %st faddp %st, %st(2) fldl 248+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 248+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 248+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 248+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 248+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 256(pB) fldl 256(pA) fmul %st(1), %st faddp %st, %st(2) fldl 256+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 256+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 256+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 256+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 256+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 264(pB) fldl 264(pA) fmul %st(1), %st faddp %st, %st(2) fldl 264+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 264+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 264+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 264+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 264+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 272(pB) fldl 272(pA) fmul %st(1), %st faddp %st, %st(2) fldl 272+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 272+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 272+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 272+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 272+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 280(pB) fldl 280(pA) fmul %st(1), %st faddp %st, %st(2) fldl 280+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 280+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 280+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 280+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 280+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 288(pB) fldl 288(pA) fmul %st(1), %st faddp %st, %st(2) fldl 288+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 288+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 288+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 288+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 288+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 296(pB) fldl 296(pA) fmul %st(1), %st faddp %st, %st(2) fldl 296+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 296+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 296+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 296+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 296+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 304(pB) fldl 304(pA) fmul %st(1), %st faddp %st, %st(2) fldl 304+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 304+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 304+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 304+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 304+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 312(pB) fldl 312(pA) fmul %st(1), %st faddp %st, %st(2) fldl 312+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 312+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 312+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 312+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 312+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 320(pB) fldl 320(pA) fmul %st(1), %st faddp %st, %st(2) fldl 320+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 320+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 320+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 320+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 320+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 328(pB) fldl 328(pA) fmul %st(1), %st faddp %st, %st(2) fldl 328+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 328+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 328+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 328+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 328+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 336(pB) fldl 336(pA) fmul %st(1), %st faddp %st, %st(2) fldl 336+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 336+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 336+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 336+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 336+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 344(pB) fldl 344(pA) fmul %st(1), %st faddp %st, %st(2) fldl 344+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 344+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 344+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 344+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 344+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 352(pB) fldl 352(pA) fmul %st(1), %st faddp %st, %st(2) fldl 352+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 352+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 352+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 352+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 352+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 360(pB) fldl 360(pA) fmul %st(1), %st faddp %st, %st(2) fldl 360+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 360+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 360+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 360+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 360+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 368(pB) fldl 368(pA) fmul %st(1), %st faddp %st, %st(2) fldl 368+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 368+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 368+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 368+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 368+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 376(pB) fldl 376(pA) fmul %st(1), %st faddp %st, %st(2) fldl 376+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 376+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 376+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 376+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 376+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 384(pB) fldl 384(pA) fmul %st(1), %st faddp %st, %st(2) fldl 384+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 384+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 384+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 384+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 384+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 392(pB) fldl 392(pA) fmul %st(1), %st faddp %st, %st(2) fldl 392+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 392+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 392+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 392+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 392+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 400(pB) fldl 400(pA) fmul %st(1), %st faddp %st, %st(2) fldl 400+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 400+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 400+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 400+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 400+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 408(pB) fldl 408(pA) fmul %st(1), %st faddp %st, %st(2) fldl 408+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 408+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 408+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 408+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 408+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 416(pB) fldl 416(pA) fmul %st(1), %st faddp %st, %st(2) fldl 416+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 416+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 416+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 416+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 416+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 424(pB) fldl 424(pA) fmul %st(1), %st faddp %st, %st(2) fldl 424+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 424+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 424+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 424+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 424+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 432(pB) fldl 432(pA) fmul %st(1), %st faddp %st, %st(2) fldl 432+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 432+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 432+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 432+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 432+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 440(pB) fldl 440(pA) fmul %st(1), %st faddp %st, %st(2) fldl 440+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 440+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 440+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 440+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 440+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 448(pB) fldl 448(pA) fmul %st(1), %st faddp %st, %st(2) fldl 448+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 448+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 448+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 448+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 448+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) prefC(48(pC)) fldl 456(pB) fldl 456(pA) fmul %st(1), %st faddp %st, %st(2) fldl 456+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 456+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 456+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 456+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 456+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 464(pB) fldl 464(pA) fmul %st(1), %st faddp %st, %st(2) fldl 464+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 464+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 464+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 464+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 464+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6) fldl 472(pB) fldl 472(pA) fmul %st(1), %st faddp %st, %st(2) fldl 472+NBso(pA) fmul %st(1), %st faddp %st, %st(3) fldl 472+NB2so(pA) fmul %st(1), %st faddp %st, %st(4) fldl 472+NB3so(pA) fmul %st(1), %st faddp %st, %st(5) fldl 472+NB4so(pA) fmul %st(1), %st faddp %st, %st(6) fldl 472+NB5so(pA) fmulp %st, %st(1) faddp %st, %st(6)/* addq $480, pA *//* addq $480, pB *//* * While (pB != stK); *//* cmp pB, stK *//* jne KLOOP *//* * Write results back to C */ fstpl (pC) fstpl 8(pC) fstpl 16(pC) fstpl 24(pC) fstpl 32(pC) fstpl 40(pC)/* * pC += 6; pA += 5*NB; pB -= NB; */ addq $48, pC addq $NB6so, pA#ifdef BETA0 fldz fldz fldz fldz fldz fldz#else fldl 40(pC) fldl 32(pC) fldl 24(pC) fldl 16(pC) fldl 8(pC) fldl (pC) #ifdef BETAX fldl BETAOFF(%rsp) fmul %st, %st(1) fmul %st, %st(2) fmul %st, %st(3) fmul %st, %st(4) fmul %st, %st(5) fmulp %st, %st(6) #endif#endif ALIGN16/*KLOOP: */ fldl (pB) fldl (pA) fmul %st(1), %st faddp %st, %st(2) fldl NBso(pA)
⌨️ 快捷键说明
复制代码Ctrl + C
搜索代码Ctrl + F
全屏模式F11
增大字号Ctrl + =
减小字号Ctrl + -
显示快捷键?