sumsq_sse2_assist.s

来自「FEC Optimized viterbi code」· S 代码 · 共 50 行

50 行

# SSE2 assist routines for sumsq# Copyright 2001 Phil Karn, KA9Q# May be used under the terms of the GNU Public License (GPL)	.text# Evaluate sum of squares of signed 16-bit input samples#  long long sumsq_sse2_assist(signed short *in,int cnt);		.global sumsq_sse2_assist	.type sumsq_sse2_assist,@function	.align 16sumsq_sse2_assist:	pushl %ebp	movl %esp,%ebp	pushl %esi	pushl %ecx	movl 8(%ebp),%esi	movl 12(%ebp),%ecx	pxor %xmm2,%xmm2		# zero sum	movaps low,%xmm3		# load mask1:	subl $8,%ecx	jl 2f	movaps (%esi),%xmm0	# S0 S1 S2 S3 S4 S5 S6 S7	pmaddwd %xmm0,%xmm0	# (S0*S0+S1*S1) (S2*S2+S3*S3) (S4*S4+S5*S5) (S6*S6+S7*S7)	movaps %xmm0,%xmm1	pand %xmm3,%xmm1	# (S0*S0+S1*S1) 0 (S4*S4+S5*S5) 0	paddq %xmm1,%xmm2	# sum even-numbered dwords	psrlq $32,%xmm0		# (S2*S2+S3*S3) 0 (S6*S6+S7*S7) 0	paddq %xmm0,%xmm2	# sum odd-numbered dwords	addl $16,%esi	jmp 1b	2:	movaps %xmm2,%xmm0	psrldq $8,%xmm0	paddq %xmm2,%xmm0	# combine 64-bit sums	movd %xmm0,%eax		# low 32 bits of sum	psrldq $4,%xmm0	movd %xmm0,%edx		# high 32 bits of sum		popl %ecx	popl %esi	popl %ebp	ret	.data	.align 16low:	.byte 255,255,255,255,0,0,0,0,255,255,255,255,0,0,0,0

sumsq_sse2_assist.s - 源码说明

本页面展示了「FEC Optimized viterbi code」中的 sumsq_sse2_assist.s 源码文件，采用 S 编程语言编写，共 50 行代码。您可以在线阅读完整代码内容，也可以返回资源详情页下载完整源码包进行本地学习和开发。

虫虫开发者社区收录了大量与FEC相关的技术资源，包括源代码、技术文档、电路图等，是电子工程师和嵌入式开发者的专业学习平台。

⌨️ 快捷键说明

复制代码Ctrl + C

搜索代码Ctrl + F

全屏模式F11

增大字号Ctrl + =

减小字号Ctrl + -

显示快捷键?