⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 trsm_kernel_ln.s

📁 Optimized GotoBLAS libraries
💻 S
📖 第 1 页 / 共 4 页
字号:
#ifdef LT	LFD	f16,  0 * SIZE(AO)	LFD	f17,  1 * SIZE(AO)	FMUL	f0,  f16, f0	FMUL	f4,  f16, f4	FMUL	f8,  f16, f8	FMUL	f12, f16, f12	FNMSUB	f1,  f17, f0,  f1	FNMSUB	f5,  f17, f4,  f5	FNMSUB	f9,  f17, f8,  f9	FNMSUB	f13, f17, f12, f13	LFD	f17,  3 * SIZE(AO)	FMUL	f1,  f17, f1	FMUL	f5,  f17, f5	FMUL	f9,  f17, f9	FMUL	f13, f17, f13#endif#ifdef RN	LFD	f16,  0 * SIZE(BO)	LFD	f17,  1 * SIZE(BO)	LFD	f18,  2 * SIZE(BO)	LFD	f19,  3 * SIZE(BO)	FMUL	f0,  f16, f0	FMUL	f1,  f16, f1	FNMSUB	f4,  f17, f0,  f4	FNMSUB	f5,  f17, f1,  f5	FNMSUB	f8,  f18, f0,  f8	FNMSUB	f9,  f18, f1,  f9	FNMSUB	f12, f19, f0,  f12	FNMSUB	f13, f19, f1,  f13	LFD	f16,  5 * SIZE(BO)	LFD	f17,  6 * SIZE(BO)	LFD	f18,  7 * SIZE(BO)	LFD	f19, 10 * SIZE(BO)	LFD	f20, 11 * SIZE(BO)	LFD	f21, 15 * SIZE(BO)	FMUL	f4,  f16, f4	FMUL	f5,  f16, f5	FNMSUB	f8,  f17, f4,  f8	FNMSUB	f9,  f17, f5,  f9	FNMSUB	f12, f18, f4,  f12	FNMSUB	f13, f18, f5,  f13	FMUL	f8,  f19, f8	FMUL	f9,  f19, f9	FNMSUB	f12, f20, f8,  f12	FNMSUB	f13, f20, f9,  f13	FMUL	f12, f21, f12	FMUL	f13, f21, f13#endif#ifdef RT	LFD	f16, 15 * SIZE(BO)	LFD	f17, 14 * SIZE(BO)	LFD	f18, 13 * SIZE(BO)	LFD	f19, 12 * SIZE(BO)	FMUL	f12, f16, f12	FMUL	f13, f16, f13	FNMSUB	f8,  f17, f12, f8	FNMSUB	f9,  f17, f13, f9	FNMSUB	f4,  f18, f12, f4	FNMSUB	f5,  f18, f13, f5	FNMSUB	f0,  f19, f12, f0	FNMSUB	f1,  f19, f13, f1	LFD	f16, 10 * SIZE(BO)	LFD	f17,  9 * SIZE(BO)	LFD	f18,  8 * SIZE(BO)	LFD	f19,  5 * SIZE(BO)	LFD	f20,  4 * SIZE(BO)	LFD	f21,  0 * SIZE(BO)	FMUL	f8,  f16, f8	FMUL	f9,  f16, f9	FNMSUB	f4,  f17, f8,  f4	FNMSUB	f5,  f17, f9,  f5	FNMSUB	f0,  f18, f8,  f0	FNMSUB	f1,  f18, f9,  f1	FMUL	f4,  f19, f4	FMUL	f5,  f19, f5	FNMSUB	f0,  f20, f4,  f0	FNMSUB	f1,  f20, f5,  f1	FMUL	f0,  f21, f0	FMUL	f1,  f21, f1#endif#ifdef LN	subi	CO1, CO1, 2 * SIZE	subi	CO2, CO2, 2 * SIZE	subi	CO3, CO3, 2 * SIZE	subi	CO4, CO4, 2 * SIZE#endif#if defined(LN) || defined(LT)	STFD	f0,   0 * SIZE(BO)	STFD	f4,   1 * SIZE(BO)	STFD	f8,   2 * SIZE(BO)	STFD	f12,  3 * SIZE(BO)	STFD	f1,   4 * SIZE(BO)	STFD	f5,   5 * SIZE(BO)	STFD	f9,   6 * SIZE(BO)	STFD	f13,  7 * SIZE(BO)#else	STFD	f0,   0 * SIZE(AO)	STFD	f1,   1 * SIZE(AO)	STFD	f4,   2 * SIZE(AO)	STFD	f5,   3 * SIZE(AO)	STFD	f8,   4 * SIZE(AO)	STFD	f9,   5 * SIZE(AO)	STFD	f12,  6 * SIZE(AO)	STFD	f13,  7 * SIZE(AO)#endif	STFD	f0,   0 * SIZE(CO1)	STFD	f1,   1 * SIZE(CO1)	STFD	f4,   0 * SIZE(CO2)	STFD	f5,   1 * SIZE(CO2)	STFD	f8,   0 * SIZE(CO3)	STFD	f9,   1 * SIZE(CO3)	STFD	f12,  0 * SIZE(CO4)	STFD	f13,  1 * SIZE(CO4)	lfs	f0,  FZERO 	fmr	f1,  f0	fmr	f2,  f0	fmr	f3,  f0	fmr	f4,  f0	fmr	f5,  f0	fmr	f6,  f0	fmr	f7,  f0	fmr	f8,  f0	fmr	f9,  f0	fmr	f10, f0	fmr	f11, f0	fmr	f12, f0	fmr	f13, f0	fmr	f14, f0	fmr	f15, f0#ifndef LN	addi	CO1, CO1, 2 * SIZE	addi	CO2, CO2, 2 * SIZE	addi	CO3, CO3, 2 * SIZE	addi	CO4, CO4, 2 * SIZE#endif#ifdef RT	slwi	r0, K, 1 + BASE_SHIFT	add	AORIG, AORIG, r0#endif#if defined(LT) || defined(RN)	sub	TEMP, K, KK	slwi	r0,   TEMP, 1 + BASE_SHIFT	slwi	TEMP, TEMP, 2 + BASE_SHIFT	add	AO, AO, r0	add	BO, BO, TEMP#endif#ifdef LN	subi	KK, KK, 2#endif#ifdef LT	addi	KK, KK, 2#endif	.align 4LL(09):	srawi.	I, M,  2	ble	LL(39)	.align 4LL(11):#if defined(LT) || defined(RN)	LFD	f16,  0 * SIZE(AO)	LFD	f17,  1 * SIZE(AO)	LFD	f18,  2 * SIZE(AO)	LFD	f19,  3 * SIZE(AO)	LFD	f20,  0 * SIZE(B)	LFD	f21,  1 * SIZE(B)	LFD	f22,  2 * SIZE(B)	LFD	f23,  3 * SIZE(B)	dcbt	CO1, PREC	dcbt	CO2, PREC	dcbt	CO3, PREC	dcbt	CO4, PREC	srawi.	r0, KK,  2	mtspr	CTR, r0	mr	BO,  B#else#ifdef LN	slwi	r0,   K,  2 + BASE_SHIFT	sub	AORIG, AORIG, r0#endif	slwi	TEMP, KK, 2 + BASE_SHIFT	add	AO, AORIG, TEMP	add	BO, B,     TEMP	sub	TEMP, K, KK	LFD	f16,  0 * SIZE(AO)	LFD	f17,  1 * SIZE(AO)	LFD	f18,  2 * SIZE(AO)	LFD	f19,  3 * SIZE(AO)	LFD	f20,  0 * SIZE(BO)	LFD	f21,  1 * SIZE(BO)	LFD	f22,  2 * SIZE(BO)	LFD	f23,  3 * SIZE(BO)	dcbt	CO1, PREC	dcbt	CO2, PREC	dcbt	CO3, PREC	dcbt	CO4, PREC	srawi.	r0, TEMP,  2	mtspr	CTR, r0#endif	ble	LL(15)	.align 4LL(12):	FMADD	f0,  f16, f20, f0	FMADD	f5,  f17, f21, f5	FMADD	f10, f18, f22, f10	FMADD	f15, f19, f23, f15	LFD	f28,  4 * SIZE(BO)	LFD	f29,  5 * SIZE(BO)	LFD	f30,  6 * SIZE(BO)	LFD	f31,  7 * SIZE(BO)	FMADD	f1,  f17, f20, f1	FMADD	f2,  f18, f20, f2	FMADD	f3,  f19, f20, f3	FMADD	f4,  f16, f21, f4	LFD	f24,  4 * SIZE(AO)	LFD	f25,  5 * SIZE(AO)	LFD	f26,  6 * SIZE(AO)	LFD	f27,  7 * SIZE(AO)	FMADD	f6,  f18, f21, f6	FMADD	f7,  f19, f21, f7	FMADD	f8,  f16, f22, f8	FMADD	f9,  f17, f22, f9	FMADD	f11, f19, f22, f11	FMADD	f12, f16, f23, f12	FMADD	f13, f17, f23, f13	FMADD	f14, f18, f23, f14	LFD	f20,  8 * SIZE(BO)	LFD	f21,  9 * SIZE(BO)	LFD	f22, 10 * SIZE(BO)	LFD	f23, 11 * SIZE(BO)	FMADD	f0,  f24, f28, f0	FMADD	f5,  f25, f29, f5	FMADD	f10, f26, f30, f10	FMADD	f15, f27, f31, f15	LFD	f16,  8 * SIZE(AO)	LFD	f17,  9 * SIZE(AO)	LFD	f18, 10 * SIZE(AO)	LFD	f19, 11 * SIZE(AO)	FMADD	f1,  f25, f28, f1	FMADD	f2,  f26, f28, f2	FMADD	f3,  f27, f28, f3	FMADD	f4,  f24, f29, f4	FMADD	f6,  f26, f29, f6	FMADD	f7,  f27, f29, f7	FMADD	f8,  f24, f30, f8	FMADD	f9,  f25, f30, f9	FMADD	f11, f27, f30, f11	FMADD	f12, f24, f31, f12	FMADD	f13, f25, f31, f13	FMADD	f14, f26, f31, f14	LFD	f28, 12 * SIZE(BO)	LFD	f29, 13 * SIZE(BO)	LFD	f30, 14 * SIZE(BO)	LFD	f31, 15 * SIZE(BO)	FMADD	f0,  f16, f20, f0	FMADD	f5,  f17, f21, f5	FMADD	f10, f18, f22, f10	FMADD	f15, f19, f23, f15	LFD	f24, 12 * SIZE(AO)	LFD	f25, 13 * SIZE(AO)	LFD	f26, 14 * SIZE(AO)	LFD	f27, 15 * SIZE(AO)	FMADD	f1,  f17, f20, f1	FMADD	f2,  f18, f20, f2	FMADD	f3,  f19, f20, f3	FMADD	f4,  f16, f21, f4	FMADD	f6,  f18, f21, f6	FMADD	f7,  f19, f21, f7	FMADD	f8,  f16, f22, f8	FMADD	f9,  f17, f22, f9	FMADD	f11, f19, f22, f11	FMADD	f12, f16, f23, f12	FMADD	f13, f17, f23, f13	FMADD	f14, f18, f23, f14	LFD	f20, 16 * SIZE(BO)	LFD	f21, 17 * SIZE(BO)	LFD	f22, 18 * SIZE(BO)	LFD	f23, 19 * SIZE(BO)	FMADD	f0,  f24, f28, f0	FMADD	f5,  f25, f29, f5	FMADD	f10, f26, f30, f10	FMADD	f15, f27, f31, f15	LFD	f16, 16 * SIZE(AO)	LFD	f17, 17 * SIZE(AO)	LFD	f18, 18 * SIZE(AO)	LFD	f19, 19 * SIZE(AO)	FMADD	f1,  f25, f28, f1	FMADD	f2,  f26, f28, f2	FMADD	f3,  f27, f28, f3	FMADD	f4,  f24, f29, f4	FMADD	f6,  f26, f29, f6	FMADD	f7,  f27, f29, f7	FMADD	f8,  f24, f30, f8	FMADD	f9,  f25, f30, f9	FMADD	f11, f27, f30, f11	FMADD	f12, f24, f31, f12	FMADD	f13, f25, f31, f13	FMADD	f14, f26, f31, f14	addi	AO, AO, 16 * SIZE	addi	BO, BO, 16 * SIZE#ifdef PPC970#ifndef ALLOC_HUGETLB	PREFETCH_A#endif	PREFETCH_B#endif#ifdef POWER4#ifndef ALLOC_HUGETLB	PREFETCH_A#endif	PREFETCH_B#endif#ifdef POWER5	PREFETCH_A	PREFETCH_B#endif	bdnz	LL(12)	.align 4LL(15):#if defined(LT) || defined(RN)	andi.	r0, KK,  3#else	andi.	r0, TEMP, 3#endif	mtspr	CTR, r0	ble+	LL(18)	.align 4LL(16):	FMADD	f0,  f16, f20, f0	FMADD	f5,  f17, f21, f5	FMADD	f10, f18, f22, f10	FMADD	f15, f19, f23, f15	FMADD	f1,  f17, f20, f1	FMADD	f2,  f18, f20, f2	FMADD	f3,  f19, f20, f3	FMADD	f4,  f16, f21, f4	FMADD	f6,  f18, f21, f6	FMADD	f7,  f19, f21, f7	FMADD	f8,  f16, f22, f8	FMADD	f9,  f17, f22, f9	FMADD	f11, f19, f22, f11	FMADD	f12, f16, f23, f12	FMADD	f13, f17, f23, f13	FMADD	f14, f18, f23, f14	LFD	f16,  4 * SIZE(AO)	LFD	f17,  5 * SIZE(AO)	LFD	f18,  6 * SIZE(AO)	LFD	f19,  7 * SIZE(AO)	LFD	f20,  4 * SIZE(BO)	LFD	f21,  5 * SIZE(BO)	LFD	f22,  6 * SIZE(BO)	LFD	f23,  7 * SIZE(BO)	addi	BO, BO,  4 * SIZE	addi	AO, AO,  4 * SIZE	bdnz	LL(16)	.align 4LL(18):#if defined(LN) || defined(RT)	subi	r0, KK, 4	slwi	r0, r0, 2 + BASE_SHIFT	add	AO, AORIG, r0	add	BO, B,     r0#endif#if defined(LN) || defined(LT)	LFD	f16,  0 * SIZE(BO)	LFD	f17,  1 * SIZE(BO)	LFD	f18,  2 * SIZE(BO)	LFD	f19,  3 * SIZE(BO) 	LFD	f20,  4 * SIZE(BO) 	LFD	f21,  5 * SIZE(BO)	LFD	f22,  6 * SIZE(BO)	LFD	f23,  7 * SIZE(BO)	LFD	f24,  8 * SIZE(BO)	LFD	f25,  9 * SIZE(BO)	LFD	f26, 10 * SIZE(BO)	LFD	f27, 11 * SIZE(BO)	LFD	f28, 12 * SIZE(BO)	LFD	f29, 13 * SIZE(BO)	LFD	f30, 14 * SIZE(BO)	LFD	f31, 15 * SIZE(BO)	FSUB	f0,  f16, f0	FSUB	f4,  f17, f4	FSUB	f8,  f18, f8	FSUB	f12, f19, f12	FSUB	f1,  f20, f1	FSUB	f5,  f21, f5	FSUB	f9,  f22, f9	FSUB	f13, f23, f13	FSUB	f2,  f24, f2	FSUB	f6,  f25, f6	FSUB	f10, f26, f10	FSUB	f14, f27, f14	FSUB	f3,  f28, f3	FSUB	f7,  f29, f7	FSUB	f11, f30, f11	FSUB	f15, f31, f15#else	LFD	f16,  0 * SIZE(AO)	LFD	f17,  1 * SIZE(AO)	LFD	f18,  2 * SIZE(AO)	LFD	f19,  3 * SIZE(AO) 	LFD	f20,  4 * SIZE(AO) 	LFD	f21,  5 * SIZE(AO)	LFD	f22,  6 * SIZE(AO)	LFD	f23,  7 * SIZE(AO)	LFD	f24,  8 * SIZE(AO)	LFD	f25,  9 * SIZE(AO)	LFD	f26, 10 * SIZE(AO)	LFD	f27, 11 * SIZE(AO)	LFD	f28, 12 * SIZE(AO)	LFD	f29, 13 * SIZE(AO)	LFD	f30, 14 * SIZE(AO)	LFD	f31, 15 * SIZE(AO)	FSUB	f0,  f16, f0	FSUB	f1,  f17, f1	FSUB	f2,  f18, f2	FSUB	f3,  f19, f3	FSUB	f4,  f20, f4	FSUB	f5,  f21, f5	FSUB	f6,  f22, f6	FSUB	f7,  f23, f7	FSUB	f8,  f24, f8	FSUB	f9,  f25, f9	FSUB	f10, f26, f10	FSUB	f11, f27, f11	FSUB	f12, f28, f12	FSUB	f13, f29, f13	FSUB	f14, f30, f14	FSUB	f15, f31, f15#endif#ifdef LN	LFD	f16, 15 * SIZE(AO)	LFD	f17, 14 * SIZE(AO)	LFD	f18, 13 * SIZE(AO)	LFD	f19, 12 * SIZE(AO)	FMUL	f3,  f16, f3	FMUL	f7,  f16, f7	FMUL	f11, f16, f11	FMUL	f15, f16, f15	FNMSUB	f2,  f17, f3,  f2	FNMSUB	f6,  f17, f7,  f6	FNMSUB	f10, f17, f11, f10	FNMSUB	f14, f17, f15, f14	FNMSUB	f1,  f18, f3,  f1	FNMSUB	f5,  f18, f7,  f5	FNMSUB	f9,  f18, f11, f9	FNMSUB	f13, f18, f15, f13	FNMSUB	f0,  f19, f3,  f0	FNMSUB	f4,  f19, f7,  f4	FNMSUB	f8,  f19, f11, f8	FNMSUB	f12, f19, f15, f12	LFD	f16, 10 * SIZE(AO)	LFD	f17,  9 * SIZE(AO)	LFD	f18,  8 * SIZE(AO)	LFD	f19,  5 * SIZE(AO)	FMUL	f2,  f16, f2	FMUL	f6,  f16, f6	FMUL	f10, f16, f10	FMUL	f14, f16, f14	LFD	f20,  4 * SIZE(AO)	LFD	f21,  0 * SIZE(AO)	FNMSUB	f1,  f17, f2,  f1	FNMSUB	f5,  f17, f6,  f5	FNMSUB	f9,  f17, f10, f9	FNMSUB	f13, f17, f14,  f13	FNMSUB	f0,  f18, f2,  f0	FNMSUB	f4,  f18, f6,  f4	FNMSUB	f8,  f18, f10, f8	FNMSUB	f12, f18, f14, f12	FMUL	f1,  f19, f1	FMUL	f5,  f19, f5	FMUL	f9,  f19, f9	FMUL	f13, f19, f13	FNMSUB	f0,  f20, f1,  f0	FNMSUB	f4,  f20, f5,  f4	FNMSUB	f8,  f20, f9,  f8	FNMSUB	f12, f20, f13, f12	FMUL	f0,  f21, f0	FMUL	f4,  f21, f4	FMUL	f8,  f21, f8	FMUL	f12, f21, f12#endif#ifdef LT	LFD	f16,  0 * SIZE(AO)	LFD	f17,  1 * SIZE(AO)	LFD	f18,  2 * SIZE(AO)	LFD	f19,  3 * SIZE(AO)	FMUL	f0,  f16, f0	FMUL	f4,  f16, f4	FMUL	f8,  f16, f8	FMUL	f12, f16, f12	FNMSUB	f1,  f17, f0,  f1	FNMSUB	f5,  f17, f4,  f5	FNMSUB	f9,  f17, f8,  f9	FNMSUB	f13, f17, f12, f13	FNMSUB	f2,  f18, f0,  f2	FNMSUB	f6,  f18, f4,  f6	FNMSUB	f10, f18, f8,  f10	FNMSUB	f14, f18, f12, f14	FNMSUB	f3,  f19, f0,  f3	FNMSUB	f7,  f19, f4,  f7	FNMSUB	f11, f19, f8,  f11	FNMSUB	f15, f19, f12, f15	LFD	f16,  5 * SIZE(AO)	LFD	f17,  6 * SIZE(AO)	LFD	f18,  7 * SIZE(AO)	LFD	f19, 10 * SIZE(AO)	FMUL	f1,  f16, f1	FMUL	f5,  f16, f5	FMUL	f9,  f16, f9	FMUL	f13, f16, f13	LFD	f20, 11 * SIZE(AO)	LFD	f21, 15 * SIZE(AO)	FNMSUB	f2,  f17, f1,  f2	FNMSUB	f6,  f17, f5,  f6	FNMSUB	f10, f17, f9,  f10	FNMSUB	f14, f17, f13, f14	FNMSUB	f3,  f18, f1,  f3	FNMSUB	f7,  f18, f5,  f7	FNMSUB	f11, f18, f9,  f11	FNMSUB	f15, f18, f13, f15	FMUL	f2,  f19, f2	FMUL	f6,  f19, f6	FMUL	f10, f19, f10	FMUL	f14, f19, f14	FNMSUB	f3,  f20, f2,  f3	FNMSUB	f7,  f20, f6,  f7	FNMSUB	f11, f20, f10, f11	FNMSUB	f15, f20, f14, f15	FMUL	f3,  f21, f3	FMUL	f7,  f21, f7	FMUL	f11, f21, f11	FMUL	f15, f21, f15#endif#ifdef RN	LFD	f16,  0 * SIZE(BO)	LFD	f17,  1 * SIZE(BO)	LFD	f18,  2 * SIZE(BO)	LFD	f19,  3 * SIZE(BO)	FMUL	f0,  f16, f0	FMUL	f1,  f16, f1	FMUL	f2,  f16, f2	FMUL	f3,  f16, f3	FNMSUB	f4,  f17, f0,  f4	FNMSUB	f5,  f17, f1,  f5	FNMSUB	f6,  f17, f2,  f6	FNMSUB	f7,  f17, f3,  f7	FNMSUB	f8,  f18, f0,  f8	FNMSUB	f9,  f18, f1,  f9	FNMSUB	f10, f18, f2,  f10	FNMSUB	f11, f18, f3,  f11	FNMSUB	f12, f19, f0,  f12	FNMSUB	f13, f19, f1,  f13	FNMSUB	f14, f19, f2,  f14	FNMSUB	f15, f19, f3,  f15	LFD	f16,  5 * SIZE(BO)	LFD	f17,  6 * SIZE(BO)	LFD	f18,  7 * SIZE(BO)	LFD	f19, 10 * SIZE(BO)	FMUL	f4,  f16, f4	FMUL	f5,  f16, f5	FMUL	f6,  f16, f6	FMUL	f7,  f16, f7	LFD	f20, 11 * SIZE(BO)	LFD	f21, 15 * SIZE(BO)	FNMSUB	f8,  f17, f4,  f8	FNMSUB	f9,  f17, f5,  f9	FNMSUB	f10, f17, f6,  f10	FNMSUB	f11, f17, f7,  f11	FNMSUB	f12, f18, f4,  f12	FNMSUB	f13, f18, f5,  f13	FNMSUB	f14, f18, f6,  f14	FNMSUB	f15, f18, f7,  f15	FMUL	f8,  f19, f8	FMUL	f9,  f19, f9	FMUL	f10, f19, f10	FMUL	f11, f19, f11	FNMSUB	f12, f20, f8,  f12	FNMSUB	f13, f20, f9,  f13	FNMSUB	f14, f20, f10, f14	FNMSUB	f15, f20, f11, f15	FMUL	f12, f21, f12	FMUL	f13, f21, f13	FMUL	f14, f21, f14	FMUL	f15, f21, f15#endif#ifdef RT	LFD	f16, 15 * SIZE(BO)	LFD	f17, 14 * SIZE(BO)	LFD	f18, 13 * SIZE(BO)	LFD	f19, 12 * SIZE(BO)	FMUL	f12, f16, f12	FMUL	f13, f16, f13	FMUL	f14, f16, f14	FMUL	f15, f16, f15	FNMSUB	f8,  f17, f12, f8	FNMSUB	f9,  f17, f13, f9	FNMSUB	f10, f17, f14, f10	FNMSUB	f11, f17, f15, f11	FNMSUB	f4,  f18, f12, f4	FNMSUB	f5,  f18, f13, f5	FNMSUB	f6,  f18, f14, f6	FNMSUB	f7,  f18, f15, f7	FNMSUB	f0,  f19, f12, f0	FNMSUB	f1,  f19, f13, f1	FNMSUB	f2,  f19, f14, f2	FNMSUB	f3,  f19, f15, f3	LFD	f16, 10 * SIZE(BO)	LFD	f17,  9 * SIZE(BO)	LFD	f18,  8 * SIZE(BO)	LFD	f19,  5 * SIZE(BO)	FMUL	f8,  f16, f8	FMUL	f9,  f16, f9	FMUL	f10, f16, f10	FMUL	f11, f16, f11	LFD	f20,  4 * SIZE(BO)	LFD	f21,  0 * SIZE(BO)	FNMSUB	f4,  f17, f8,  f4	FNMSUB	f5,  f17, f9,  f5	FNMSUB	f6,  f17, f10, f6	FNMSUB	f7,  f17, f11, f7	FNMSUB	f0,  f18, f8,  f0	FNMSUB	f1,  f18, f9,  f1	FNMSUB	f2,  f18, f10, f2	FNMSUB	f3,  f18, f11, f3	FMUL	f4,  f19, f4	FMUL	f5,  f19, f5	FMUL	f6,  f19, f6	FMUL	f7,  f19, f7	FNMSUB	f0,  f20, f4,  f0	FNMSUB	f1,  f20, f5,  f1	FNMSUB	f2,  f20, f6,  f2	FNMSUB	f3,  f20, f7,  f3	FMUL	f0,  f21, f0	FMUL	f1,  f21, f1	FMUL	f2,  f21, f2	FMUL	f3,  f21, f3#endif#ifdef LN	subi	CO1, CO1, 4 * SIZE	subi	CO2, CO2, 4 * SIZE	subi	CO3, CO3, 4 * SIZE	subi	CO4, CO4, 4 * SIZE#endif#if defined(LN) || defined(LT)	STFD	f0,   0 * SIZE(BO)	STFD	f4,   1 * SIZE(BO)	STFD	f8,   2 * SIZE(BO)	STFD	f12,  3 * SIZE(BO)	STFD	f1,   4 * SIZE(BO)	STFD	f5,   5 * SIZE(BO)	STFD	f9,   6 * SIZE(BO)	STFD	f13,  7 * SIZE(BO)	STFD	f2,   8 * SIZE(BO)	STFD	f6,   9 * SIZE(BO)	STFD	f10, 10 * SIZE(BO)	STFD	f14, 11 * SIZE(BO)	STFD	f3,  12 * SIZE(BO)	STFD	f7,  13 * SIZE(BO)	STFD	f11, 14 * SIZE(BO)	STFD	f15, 15 * SIZE(BO)#else	STFD	f0,   0 * SIZE(AO)	STFD	f1,   1 * SIZE(AO)	STFD	f2,   2 * SIZE(AO)	STFD	f3,   3 * SIZE(AO)	STFD	f4,   4 * SIZE(AO)	STFD	f5,   5 * SIZE(AO)	STFD	f6,   6 * SIZE(AO)	STFD	f7,   7 * SIZE(AO)	STFD	f8,   8 * SIZE(AO)	STFD	f9,   9 * SIZE(AO)	STFD	f10, 10 * SIZE(AO)	STFD	f11, 11 * SIZE(AO)	STFD	f12, 12 * SIZE(AO)	STFD	f13, 13 * SIZE(AO)	STFD	f14, 14 * SIZE(AO)	STFD	f15, 15 * SIZE(AO)#endif	STFD	f0,   0 * SIZE(CO1)	STFD	f1,   1 * SIZE(CO1)	STFD	f2,   2 * SIZE(CO1)	STFD	f3,   3 * SIZE(CO1)	STFD	f4,   0 * SIZE(CO2)	STFD	f5,   1 * SIZE(CO2)	STFD	f6,   2 * SIZE(CO2)	STFD	f7,   3 * SIZE(CO2)	STFD	f8,   0 * SIZE(CO3)	STFD	f9,   1 * SIZE(CO3)	STFD	f10,  2 * SIZE(CO3)	STFD	f11,  3 * SIZE(CO3)	STFD	f12,  0 * SIZE(CO4)	STFD	f13,  1 * SIZE(CO4)	STFD	f14,  2 * SIZE(CO4)	STFD	f15,  3 * SIZE(CO4)	lfs	f0,  FZERO 	fmr	f1,  f0	fmr	f2,  f0	fmr	f3,  f0	fmr	f4,  f0	fmr	f5,  f0	fmr	f6,  f0	fmr	f7,  f0	fmr	f8,  f0	fmr	f9,  f0	fmr	f10, f0	fmr	f11, f0	fmr	f12, f0	fmr	f13, f0	fmr	f14, f0	fmr	f15, f0#ifndef LN	addi	CO1, CO1, 4 * SIZE	addi	CO2, CO2, 4 * SIZE	addi	CO3, CO3, 4 * SIZE	addi	CO4, CO4, 4 * SIZE#endif	#ifdef RT	slwi	r0, K, 2 + BASE_SHIFT	add	AORIG, AORIG, r0#endif#if defined(LT) || defined(RN)	sub	TEMP, K, KK	slwi	TEMP, TEMP, 2 + BASE_SHIFT	add	AO, AO, TEMP	add	BO, BO, TEMP#endif#ifdef LT	addi	KK, KK, 4#endif#ifdef LN	subi	KK, KK, 4#endif	addic.	I, I, -1	bgt+	LL(11)	.align 4LL(39):#ifdef LN	slwi	r0, K, 2 + BASE_SHIFT

⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -