atl_dmm6x1x60pabc.c

来自「基于Blas CLapck的.用过的人知道是干啥的」· C语言 代码 · 共 3,694 行 · 第 1/5 页

C
3,694
字号
	fldl	296+NBso(pA)	fmul	%st(1), %st	faddp	%st, %st(3)	fldl	296+NB2so(pA)	fmul	%st(1), %st	faddp	%st, %st(4)	fldl	296+NB3so(pA)	fmul	%st(1), %st	faddp	%st, %st(5)	fldl	296+NB4so(pA)	fmul	%st(1), %st	faddp	%st, %st(6)	fldl	296+NB5so(pA)	fmulp	%st, %st(1)	faddp	%st, %st(6)	fldl	304(pB)	fldl	304(pA)	fmul	%st(1), %st	faddp	%st, %st(2)	fldl	304+NBso(pA)	fmul	%st(1), %st	faddp	%st, %st(3)	fldl	304+NB2so(pA)	fmul	%st(1), %st	faddp	%st, %st(4)	fldl	304+NB3so(pA)	fmul	%st(1), %st	faddp	%st, %st(5)	fldl	304+NB4so(pA)	fmul	%st(1), %st	faddp	%st, %st(6)	fldl	304+NB5so(pA)	fmulp	%st, %st(1)	faddp	%st, %st(6)	fldl	312(pB)	fldl	312(pA)	fmul	%st(1), %st	faddp	%st, %st(2)	fldl	312+NBso(pA)	fmul	%st(1), %st	faddp	%st, %st(3)	fldl	312+NB2so(pA)	fmul	%st(1), %st	faddp	%st, %st(4)	fldl	312+NB3so(pA)	fmul	%st(1), %st	faddp	%st, %st(5)	fldl	312+NB4so(pA)	fmul	%st(1), %st	faddp	%st, %st(6)	fldl	312+NB5so(pA)	fmulp	%st, %st(1)	faddp	%st, %st(6)	fldl	320(pB)	fldl	320(pA)	fmul	%st(1), %st	faddp	%st, %st(2)	fldl	320+NBso(pA)	fmul	%st(1), %st	faddp	%st, %st(3)	fldl	320+NB2so(pA)	fmul	%st(1), %st	faddp	%st, %st(4)	fldl	320+NB3so(pA)	fmul	%st(1), %st	faddp	%st, %st(5)	fldl	320+NB4so(pA)	fmul	%st(1), %st	faddp	%st, %st(6)	fldl	320+NB5so(pA)	fmulp	%st, %st(1)	faddp	%st, %st(6)	fldl	328(pB)	fldl	328(pA)	fmul	%st(1), %st	faddp	%st, %st(2)	fldl	328+NBso(pA)	fmul	%st(1), %st	faddp	%st, %st(3)	fldl	328+NB2so(pA)	fmul	%st(1), %st	faddp	%st, %st(4)	fldl	328+NB3so(pA)	fmul	%st(1), %st	faddp	%st, %st(5)	fldl	328+NB4so(pA)	fmul	%st(1), %st	faddp	%st, %st(6)	fldl	328+NB5so(pA)	fmulp	%st, %st(1)	faddp	%st, %st(6)	fldl	336(pB)	fldl	336(pA)	fmul	%st(1), %st	faddp	%st, %st(2)	fldl	336+NBso(pA)	fmul	%st(1), %st	faddp	%st, %st(3)	fldl	336+NB2so(pA)	fmul	%st(1), %st	faddp	%st, %st(4)	fldl	336+NB3so(pA)	fmul	%st(1), %st	faddp	%st, %st(5)	fldl	336+NB4so(pA)	fmul	%st(1), %st	faddp	%st, %st(6)	fldl	336+NB5so(pA)	fmulp	%st, %st(1)	faddp	%st, %st(6)	fldl	344(pB)	fldl	344(pA)	fmul	%st(1), %st	faddp	%st, %st(2)	fldl	344+NBso(pA)	fmul	%st(1), %st	faddp	%st, %st(3)	fldl	344+NB2so(pA)	fmul	%st(1), %st	faddp	%st, %st(4)	fldl	344+NB3so(pA)	fmul	%st(1), %st	faddp	%st, %st(5)	fldl	344+NB4so(pA)	fmul	%st(1), %st	faddp	%st, %st(6)	fldl	344+NB5so(pA)	fmulp	%st, %st(1)	faddp	%st, %st(6)	fldl	352(pB)	fldl	352(pA)	fmul	%st(1), %st	faddp	%st, %st(2)	fldl	352+NBso(pA)	fmul	%st(1), %st	faddp	%st, %st(3)	fldl	352+NB2so(pA)	fmul	%st(1), %st	faddp	%st, %st(4)	fldl	352+NB3so(pA)	fmul	%st(1), %st	faddp	%st, %st(5)	fldl	352+NB4so(pA)	fmul	%st(1), %st	faddp	%st, %st(6)	fldl	352+NB5so(pA)	fmulp	%st, %st(1)	faddp	%st, %st(6)	fldl	360(pB)	fldl	360(pA)	fmul	%st(1), %st	faddp	%st, %st(2)	fldl	360+NBso(pA)	fmul	%st(1), %st	faddp	%st, %st(3)	fldl	360+NB2so(pA)	fmul	%st(1), %st	faddp	%st, %st(4)	fldl	360+NB3so(pA)	fmul	%st(1), %st	faddp	%st, %st(5)	fldl	360+NB4so(pA)	fmul	%st(1), %st	faddp	%st, %st(6)	fldl	360+NB5so(pA)	fmulp	%st, %st(1)	faddp	%st, %st(6)	fldl	368(pB)	fldl	368(pA)	fmul	%st(1), %st	faddp	%st, %st(2)	fldl	368+NBso(pA)	fmul	%st(1), %st	faddp	%st, %st(3)	fldl	368+NB2so(pA)	fmul	%st(1), %st	faddp	%st, %st(4)	fldl	368+NB3so(pA)	fmul	%st(1), %st	faddp	%st, %st(5)	fldl	368+NB4so(pA)	fmul	%st(1), %st	faddp	%st, %st(6)	fldl	368+NB5so(pA)	fmulp	%st, %st(1)	faddp	%st, %st(6)	fldl	376(pB)	fldl	376(pA)	fmul	%st(1), %st	faddp	%st, %st(2)	fldl	376+NBso(pA)	fmul	%st(1), %st	faddp	%st, %st(3)	fldl	376+NB2so(pA)	fmul	%st(1), %st	faddp	%st, %st(4)	fldl	376+NB3so(pA)	fmul	%st(1), %st	faddp	%st, %st(5)	fldl	376+NB4so(pA)	fmul	%st(1), %st	faddp	%st, %st(6)	fldl	376+NB5so(pA)	fmulp	%st, %st(1)	faddp	%st, %st(6)	fldl	384(pB)	fldl	384(pA)	fmul	%st(1), %st	faddp	%st, %st(2)	fldl	384+NBso(pA)	fmul	%st(1), %st	faddp	%st, %st(3)	fldl	384+NB2so(pA)	fmul	%st(1), %st	faddp	%st, %st(4)	fldl	384+NB3so(pA)	fmul	%st(1), %st	faddp	%st, %st(5)	fldl	384+NB4so(pA)	fmul	%st(1), %st	faddp	%st, %st(6)	fldl	384+NB5so(pA)	fmulp	%st, %st(1)	faddp	%st, %st(6)	fldl	392(pB)	fldl	392(pA)	fmul	%st(1), %st	faddp	%st, %st(2)	fldl	392+NBso(pA)	fmul	%st(1), %st	faddp	%st, %st(3)	fldl	392+NB2so(pA)	fmul	%st(1), %st	faddp	%st, %st(4)	fldl	392+NB3so(pA)	fmul	%st(1), %st	faddp	%st, %st(5)	fldl	392+NB4so(pA)	fmul	%st(1), %st	faddp	%st, %st(6)	fldl	392+NB5so(pA)	fmulp	%st, %st(1)	faddp	%st, %st(6)	fldl	400(pB)	fldl	400(pA)	fmul	%st(1), %st	faddp	%st, %st(2)	fldl	400+NBso(pA)	fmul	%st(1), %st	faddp	%st, %st(3)	fldl	400+NB2so(pA)	fmul	%st(1), %st	faddp	%st, %st(4)	fldl	400+NB3so(pA)	fmul	%st(1), %st	faddp	%st, %st(5)	fldl	400+NB4so(pA)	fmul	%st(1), %st	faddp	%st, %st(6)	fldl	400+NB5so(pA)	fmulp	%st, %st(1)	faddp	%st, %st(6)	fldl	408(pB)	fldl	408(pA)	fmul	%st(1), %st	faddp	%st, %st(2)	fldl	408+NBso(pA)	fmul	%st(1), %st	faddp	%st, %st(3)	fldl	408+NB2so(pA)	fmul	%st(1), %st	faddp	%st, %st(4)	fldl	408+NB3so(pA)	fmul	%st(1), %st	faddp	%st, %st(5)	fldl	408+NB4so(pA)	fmul	%st(1), %st	faddp	%st, %st(6)	fldl	408+NB5so(pA)	fmulp	%st, %st(1)	faddp	%st, %st(6)	fldl	416(pB)	fldl	416(pA)	fmul	%st(1), %st	faddp	%st, %st(2)	fldl	416+NBso(pA)	fmul	%st(1), %st	faddp	%st, %st(3)	fldl	416+NB2so(pA)	fmul	%st(1), %st	faddp	%st, %st(4)	fldl	416+NB3so(pA)	fmul	%st(1), %st	faddp	%st, %st(5)	fldl	416+NB4so(pA)	fmul	%st(1), %st	faddp	%st, %st(6)	fldl	416+NB5so(pA)	fmulp	%st, %st(1)	faddp	%st, %st(6)	fldl	424(pB)	fldl	424(pA)	fmul	%st(1), %st	faddp	%st, %st(2)	fldl	424+NBso(pA)	fmul	%st(1), %st	faddp	%st, %st(3)	fldl	424+NB2so(pA)	fmul	%st(1), %st	faddp	%st, %st(4)	fldl	424+NB3so(pA)	fmul	%st(1), %st	faddp	%st, %st(5)	fldl	424+NB4so(pA)	fmul	%st(1), %st	faddp	%st, %st(6)	fldl	424+NB5so(pA)	fmulp	%st, %st(1)	faddp	%st, %st(6)	fldl	432(pB)	fldl	432(pA)	fmul	%st(1), %st	faddp	%st, %st(2)	fldl	432+NBso(pA)	fmul	%st(1), %st	faddp	%st, %st(3)	fldl	432+NB2so(pA)	fmul	%st(1), %st	faddp	%st, %st(4)	fldl	432+NB3so(pA)	fmul	%st(1), %st	faddp	%st, %st(5)	fldl	432+NB4so(pA)	fmul	%st(1), %st	faddp	%st, %st(6)	fldl	432+NB5so(pA)	fmulp	%st, %st(1)	faddp	%st, %st(6)	fldl	440(pB)	fldl	440(pA)	fmul	%st(1), %st	faddp	%st, %st(2)	fldl	440+NBso(pA)	fmul	%st(1), %st	faddp	%st, %st(3)	fldl	440+NB2so(pA)	fmul	%st(1), %st	faddp	%st, %st(4)	fldl	440+NB3so(pA)	fmul	%st(1), %st	faddp	%st, %st(5)	fldl	440+NB4so(pA)	fmul	%st(1), %st	faddp	%st, %st(6)	fldl	440+NB5so(pA)	fmulp	%st, %st(1)	faddp	%st, %st(6)	fldl	448(pB)	fldl	448(pA)	fmul	%st(1), %st	faddp	%st, %st(2)	fldl	448+NBso(pA)	fmul	%st(1), %st	faddp	%st, %st(3)	fldl	448+NB2so(pA)	fmul	%st(1), %st	faddp	%st, %st(4)	fldl	448+NB3so(pA)	fmul	%st(1), %st	faddp	%st, %st(5)	fldl	448+NB4so(pA)	fmul	%st(1), %st	faddp	%st, %st(6)	fldl	448+NB5so(pA)	fmulp	%st, %st(1)	faddp	%st, %st(6)	prefC(48(pC))	fldl	456(pB)	fldl	456(pA)	fmul	%st(1), %st	faddp	%st, %st(2)	fldl	456+NBso(pA)	fmul	%st(1), %st	faddp	%st, %st(3)	fldl	456+NB2so(pA)	fmul	%st(1), %st	faddp	%st, %st(4)	fldl	456+NB3so(pA)	fmul	%st(1), %st	faddp	%st, %st(5)	fldl	456+NB4so(pA)	fmul	%st(1), %st	faddp	%st, %st(6)	fldl	456+NB5so(pA)	fmulp	%st, %st(1)	faddp	%st, %st(6)	fldl	464(pB)	fldl	464(pA)	fmul	%st(1), %st	faddp	%st, %st(2)	fldl	464+NBso(pA)	fmul	%st(1), %st	faddp	%st, %st(3)	fldl	464+NB2so(pA)	fmul	%st(1), %st	faddp	%st, %st(4)	fldl	464+NB3so(pA)	fmul	%st(1), %st	faddp	%st, %st(5)	fldl	464+NB4so(pA)	fmul	%st(1), %st	faddp	%st, %st(6)	fldl	464+NB5so(pA)	fmulp	%st, %st(1)	faddp	%st, %st(6)	fldl	472(pB)	fldl	472(pA)	fmul	%st(1), %st	faddp	%st, %st(2)	fldl	472+NBso(pA)	fmul	%st(1), %st	faddp	%st, %st(3)	fldl	472+NB2so(pA)	fmul	%st(1), %st	faddp	%st, %st(4)	fldl	472+NB3so(pA)	fmul	%st(1), %st	faddp	%st, %st(5)	fldl	472+NB4so(pA)	fmul	%st(1), %st	faddp	%st, %st(6)	fldl	472+NB5so(pA)	fmulp	%st, %st(1)	faddp	%st, %st(6)/*	addq	$480, pA *//*	addq	$480, pB *//* *      While (pB != stK); *//*	cmp	pB, stK *//*	jne	KLOOP *//* *      Write results back to C */        fstpl	(pC)        fstpl	8(pC)        fstpl	16(pC)        fstpl	24(pC)        fstpl	32(pC)        fstpl	40(pC)/* *      pC += 6;  pA += 5*NB; pB -= NB; */	addq	$48, pC	addq	$NB6so, pA#ifdef BETA0	fldz	fldz	fldz	fldz	fldz	fldz#else	fldl	40(pC)	fldl	32(pC)	fldl	24(pC)	fldl	16(pC)	fldl	8(pC)	fldl	(pC)   #ifdef BETAX	fldl	BETAOFF(%rsp)	fmul	%st, %st(1)	fmul	%st, %st(2)	fmul	%st, %st(3)	fmul	%st, %st(4)	fmul	%st, %st(5)	fmulp	%st, %st(6)   #endif#endif	ALIGN16/*KLOOP: */	fldl	(pB)	fldl	(pA)	fmul	%st(1), %st	faddp	%st, %st(2)	fldl	NBso(pA)	fmul	%st(1), %st	faddp	%st, %st(3)	fldl	NB2so(pA)	fmul	%st(1), %st	faddp	%st, %st(4)	fldl	NB3so(pA)	fmul	%st(1), %st	faddp	%st, %st(5)	fldl	NB4so(pA)	fmul	%st(1), %st	faddp	%st, %st(6)	fldl	NB5so(pA)	fmulp	%st, %st(1)	faddp	%st, %st(6)	fldl	8(pB)	fldl	8(pA)	fmul	%st(1), %st	faddp	%st, %st(2)	fldl	8+NBso(pA)	fmul	%st(1), %st	faddp	%st, %st(3)	fldl	8+NB2so(pA)	fmul	%st(1), %st	faddp	%st, %st(4)	fldl	8+NB3so(pA)	fmul	%st(1), %st	faddp	%st, %st(5)	fldl	8+NB4so(pA)	fmul	%st(1), %st	faddp	%st, %st(6)	fldl	8+NB5so(pA)	fmulp	%st, %st(1)	faddp	%st, %st(6)	fldl	16(pB)	fldl	16(pA)	fmul	%st(1), %st	faddp	%st, %st(2)	fldl	16+NBso(pA)	fmul	%st(1), %st	faddp	%st, %st(3)	fldl	16+NB2so(pA)	fmul	%st(1), %st	faddp	%st, %st(4)	fldl	16+NB3so(pA)	fmul	%st(1), %st	faddp	%st, %st(5)	fldl	16+NB4so(pA)	fmul	%st(1), %st	faddp	%st, %st(6)	fldl	16+NB5so(pA)	fmulp	%st, %st(1)	faddp	%st, %st(6)	fldl	24(pB)	fldl	24(pA)	fmul	%st(1), %st	faddp	%st, %st(2)	fldl	24+NBso(pA)	fmul	%st(1), %st	faddp	%st, %st(3)	fldl	24+NB2so(pA)	fmul	%st(1), %st	faddp	%st, %st(4)	fldl	24+NB3so(pA)	fmul	%st(1), %st	faddp	%st, %st(5)	fldl	24+NB4so(pA)	fmul	%st(1), %st	faddp	%st, %st(6)	fldl	24+NB5so(pA)	fmulp	%st, %st(1)	faddp	%st, %st(6)	fldl	32(pB)	fldl	32(pA)	fmul	%st(1), %st	faddp	%st, %st(2)	fldl	32+NBso(pA)	fmul	%st(1), %st	faddp	%st, %st(3)	fldl	32+NB2so(pA)	fmul	%st(1), %st	faddp	%st, %st(4)	fldl	32+NB3so(pA)	fmul	%st(1), %st	faddp	%st, %st(5)	fldl	32+NB4so(pA)	fmul	%st(1), %st	faddp	%st, %st(6)	fldl	32+NB5so(pA)	fmulp	%st, %st(1)	faddp	%st, %st(6)	fldl	40(pB)	fldl	40(pA)	fmul	%st(1), %st	faddp	%st, %st(2)	fldl	40+NBso(pA)	fmul	%st(1), %st	faddp	%st, %st(3)	fldl	40+NB2so(pA)	fmul	%st(1), %st	faddp	%st, %st(4)	fldl	40+NB3so(pA)	fmul	%st(1), %st	faddp	%st, %st(5)	fldl	40+NB4so(pA)	fmul	%st(1), %st	faddp	%st, %st(6)	fldl	40+NB5so(pA)	fmulp	%st, %st(1)	faddp	%st, %st(6)	fldl	48(pB)	fldl	48(pA)	fmul	%st(1), %st	faddp	%st, %st(2)	fldl	48+NBso(pA)	fmul	%st(1), %st	faddp	%st, %st(3)	fldl	48+NB2so(pA)	fmul	%st(1), %st	faddp	%st, %st(4)	fldl	48+NB3so(pA)	fmul	%st(1), %st	faddp	%st, %st(5)	fldl	48+NB4so(pA)	fmul	%st(1), %st	faddp	%st, %st(6)	fldl	48+NB5so(pA)	fmulp	%st, %st(1)	faddp	%st, %st(6)	fldl	56(pB)	fldl	56(pA)	fmul	%st(1), %st	faddp	%st, %st(2)	fldl	56+NBso(pA)	fmul	%st(1), %st	faddp	%st, %st(3)	fldl	56+NB2so(pA)	fmul	%st(1), %st	faddp	%st, %st(4)	fldl	56+NB3so(pA)	fmul	%st(1), %st	faddp	%st, %st(5)	fldl	56+NB4so(pA)	fmul	%st(1), %st	faddp	%st, %st(6)	fldl	56+NB5so(pA)	fmulp	%st, %st(1)	faddp	%st, %st(6)	fldl	64(pB)	fldl	64(pA)	fmul	%st(1), %st	faddp	%st, %st(2)	fldl	64+NBso(pA)	fmul	%st(1), %st	faddp	%st, %st(3)	fldl	64+NB2so(pA)	fmul	%st(1), %st	faddp	%st, %st(4)	fldl	64+NB3so(pA)	fmul	%st(1), %st	faddp	%st, %st(5)	fldl	64+NB4so(pA)	fmul	%st(1), %st	faddp	%st, %st(6)	fldl	64+NB5so(pA)	fmulp	%st, %st(1)	faddp	%st, %st(6)	fldl	72(pB)	fldl	72(pA)	fmul	%st(1), %st	faddp	%st, %st(2)	fldl	72+NBso(pA)	fmul	%st(1), %st	faddp	%st, %st(3)	fldl	72+NB2so(pA)	fmul	%st(1), %st	faddp	%st, %st(4)	fldl	72+NB3so(pA)	fmul	%st(1), %st	faddp	%st, %st(5)	fldl	72+NB4so(pA)	fmul	%st(1), %st	faddp	%st, %st(6)	fldl	72+NB5so(pA)	fmulp	%st, %st(1)	faddp	%st, %st(6)	fldl	80(pB)	fldl	80(pA)	fmul	%st(1), %st	faddp	%st, %st(2)	fldl	80+NBso(pA)	fmul	%st(1), %st	faddp	%st, %st(3)	fldl	80+NB2so(pA)	fmul	%st(1), %st	faddp	%st, %st(4)	fldl	80+NB3so(pA)	fmul	%st(1), %st	faddp	%st, %st(5)	fldl	80+NB4so(pA)	fmul	%st(1), %st	faddp	%st, %st(6)	fldl	80+NB5so(pA)	fmulp	%st, %st(1)	faddp	%st, %st(6)	fldl	88(pB)	fldl	88(pA)	fmul	%st(1), %st	faddp	%st, %st(2)	fldl	88+NBso(pA)	fmul	%st(1), %st	faddp	%st, %st(3)	fldl	88+NB2so(pA)	fmul	%st(1), %st	faddp	%st, %st(4)	fldl	88+NB3so(pA)	fmul	%st(1), %st	faddp	%st, %st(5)	fldl	88+NB4so(pA)

⌨️ 快捷键说明

复制代码Ctrl + C
搜索代码Ctrl + F
全屏模式F11
增大字号Ctrl + =
减小字号Ctrl + -
显示快捷键?