⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 idct.cpp

📁 鼎鼎有名的手机mpeg4播放器smart movie-智能影院 解码内核
💻 CPP
📖 第 1 页 / 共 3 页
字号:
/*****************************************************************************
 * This program is free software ; you can redistribute it and/or modify
 * it under the terms of the GNU General Public License as published by
 * the Free Software Foundation; either version 2 of the License, or
 * (at your option) any later version.
 *
 * This program is distributed in the hope that it will be useful,
 * but WITHOUT ANY WARRANTY; without even the implied warranty of
 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
 * GNU General Public License for more details.
 *
 * You should have received a copy of the GNU General Public License
 * along with this program; if not, write to the Free Software
 * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307 USA
 *
 *****************************************************************************
 *
 * Authors:
 *
 *	Andrea	Graziani  (Ag): Original source code (Open Divx Decoder 0.4a).
 *	Pedro	Mateu     (Pm) and
 *	Gabor	Kovacs    (Kg) Heavily modified and optimized code
 * Michal Bacik    Porting into C++
 *
 ****************************************************************************/


#include "Rules.h"
#include "Util.h"

//----------------------------

typedef short idct_block_t;

#if defined _WIN32_WCE || defined __PALMOS__
#define USE_IDCT_WMMX
#endif

//----------------------------
// 2D Inverse Discrete Cosine Transform (iDCT)

#ifdef ARM
#define SAT(Value) Value = Value < 0 ? 0: (Value > 255 ? 255: Value);
#else
  // upper bits are trashed! use only lower 8 bits afterward
#define SAT(Value) Value <<= Value >> 16; Value |= (Value << 23) >> 31;
#endif


#define ADDSAT32(a,Dst,Add32)    \
   b = a + Add32;             \
   c = a & Add32;             \
   a ^= Add32;                \
   a &= ~b;                \
   a |= c;                    \
   a &= MaskCarry;               \
   c = a << 1;                \
   b -= c;  /* adjust neighbour */  \
   b |= c - (a >> 7); /* mask */ \
   Dst = b;                

#define SUBSAT32(a,Dst,Add32)    \
   a = ~a;                    \
   b = a + Add32;             \
   c = a & Add32;             \
   a ^= Add32;                \
   a &= ~b;                \
   a |= c;                    \
   a &= MaskCarry;               \
   c = a << 1;                \
   b -= c;  /* adjust neighbour */  \
   b |= c - (a >> 7); /* mask */ \
   Dst = ~b;                  

//----------------------------
#ifdef ARM
#include "DynamicArmCode.h"
//----------------------------

//r6 Block
//r7,r8 must be saved

static void *BuildMCol8(C_dyn_code &dc){

   const dword pitch = 16;
// r10 = x0
// r4  = x1
// r2  = x2
// r1  = x3
// r3  = x4
// r12 = x5
// r0  = x6
// r5  = x7
// r11 = x8
// r9  = tmp (x567)
   void *mode_1 = dc.Label(false);
   void *mode_2 = dc.Label(false);
   void *mode_3 = dc.Label(false);

   dc.Align(16);

   void *fnc_begin = dc.Label();

   dc.SHalf(); dc.Ldr(dc.r4, dc.r6, 4*pitch);
   dc.SHalf(); dc.Ldr(dc.r0, dc.r6, 5*pitch);
   dc.SHalf(); dc.Ldr(dc.r12,dc.r6, 7*pitch);
   dc.SHalf(); dc.Ldr(dc.r5, dc.r6, 3*pitch);
   dc.SHalf(); dc.Ldr(dc.r2, dc.r6, 6*pitch);
   dc.SHalf(); dc.Ldr(dc.r1, dc.r6, 2*pitch);
   dc.SHalf(); dc.Ldr(dc.r3, dc.r6, 1*pitch);
   dc.SHalf(); dc.Ldr(dc.r10, dc.r6, 0*pitch);

   dc.Orr(dc.r9, dc.r12, dc.r0);
   dc.Orr(dc.r9, dc.r9, dc.r5);
   dc.Orr(dc.r11, dc.r9, dc.r2);
   dc.Orr(dc.r11, dc.r11, dc.r4);
   dc.Set(); dc.Orr(dc.r11, dc.r11, dc.r1);

   dc.Branch(dc.NE, mode_2);
   dc.Cmp(dc.r3, 0);
   dc.Branch(dc.NE, mode_1);
   dc.Cmp(dc.r10, 0);
   dc.Cond(dc.EQ); dc.Mov(dc.pc, dc.lr);
   dc.Mov(dc.r10, dc.r10, dc.LSL, 3);
   dc.Half(); dc.Str(dc.r10, dc.r6, 0);
   dc.Half(); dc.Str(dc.r10, dc.r6, 0x10);
   dc.Half(); dc.Str(dc.r10, dc.r6, 0x20);
   dc.Half(); dc.Str(dc.r10, dc.r6, 0x30);
   dc.Half(); dc.Str(dc.r10, dc.r6, 0x40);
   dc.Half(); dc.Str(dc.r10, dc.r6, 0x50);
   dc.Half(); dc.Str(dc.r10, dc.r6, 0x60);
   dc.Half(); dc.Str(dc.r10, dc.r6, 0x70);
   dc.Mov(dc.pc, dc.lr);

dc.PutLabel(mode_1);
                   //x0,x4
   dc.Mov(dc.r11, dc.r3);
   dc.Mov(dc.r2, 564);
   dc.Orr(dc.r2, dc.r2, 1);
   dc.Mov(dc.r9, dc.r3);
   dc.Mul(dc.r2, dc.r11, dc.r2);
   dc.Mov(dc.r11, 2832);
   dc.Orr(dc.r11, dc.r11, 9);
   dc.Mul(dc.r4, dc.r9, dc.r11);
   dc.Mov(dc.r11, 2400);
   dc.Orr(dc.r11, dc.r11, 8);
   dc.Mul(dc.r5, dc.r9, dc.r11);
   dc.Mov(dc.r11, 1600);
   dc.Mov(dc.r1, dc.r10, dc.LSL, 11);
   dc.Orr(dc.r11, dc.r11, 9);
   dc.Mul(dc.r0, dc.r3, dc.r11);
   dc.Add(dc.r1, dc.r1, 128);

   dc.Add(dc.r3, dc.r4, dc.r1);
   dc.Add(dc.r11, dc.r5, dc.r1);
   dc.Mov(dc.r3, dc.r3, dc.ASR, 8);
   dc.Mov(dc.r11, dc.r11, dc.ASR, 8);
   dc.Half(); dc.Str(dc.r3, dc.r6, 0);
   dc.Half(); dc.Str(dc.r11, dc.r6, 0x10);

   dc.Add(dc.r3, dc.r0, dc.r1);
   dc.Add(dc.r11, dc.r2, dc.r1);
   dc.Mov(dc.r3, dc.r3, dc.ASR, 8);
   dc.Mov(dc.r11, dc.r11, dc.ASR, 8);
   dc.Half(); dc.Str(dc.r3, dc.r6, 0x20);
   dc.Half(); dc.Str(dc.r11, dc.r6, 0x30);

   dc.Sub(dc.r3, dc.r1, dc.r2);
   dc.Sub(dc.r11, dc.r1, dc.r0);
   dc.Mov(dc.r3, dc.r3, dc.ASR, 8);
   dc.Mov(dc.r11, dc.r11, dc.ASR, 8);
   dc.Half(); dc.Str(dc.r3, dc.r6, 0x40);
   dc.Half(); dc.Str(dc.r11, dc.r6, 0x50);

   dc.Sub(dc.r3, dc.r1, dc.r5);
   dc.Sub(dc.r11, dc.r1, dc.r4);
   dc.Mov(dc.r3, dc.r3, dc.ASR, 8);
   dc.Mov(dc.r11, dc.r11, dc.ASR, 8);
   dc.Half(); dc.Str(dc.r3, dc.r6, 0x60);
   dc.Half(); dc.Str(dc.r11, dc.r6, 0x70);
   dc.Mov(dc.pc, dc.lr);

dc.PutLabel(mode_2);
                //x0,x1,x2,x3
   dc.Set(); dc.Orr(dc.r11, dc.r9, dc.r3);
   dc.Branch(dc.NE, mode_3);
   dc.Mov(dc.r3, dc.r10, dc.LSL, 11);
   dc.Add(dc.r3, dc.r3, 128);
   dc.Mov(dc.r9, 1104);
   dc.Add(dc.r5, dc.r3, dc.r4, dc.LSL, 11);
   dc.Add(dc.r11, dc.r2, dc.r1);
   dc.Orr(dc.r9, dc.r9, 4);
   dc.Sub(dc.r3, dc.r3, dc.r4, dc.LSL, 11);
   dc.Mul(dc.r4, dc.r11, dc.r9);
   dc.Mov(dc.r11, 3776);
   dc.Orr(dc.r11, dc.r11, 8);
   dc.Mul(dc.r11, dc.r2, dc.r11);
   dc.Sub(dc.r2, dc.r4, dc.r11);
   dc.Mov(dc.r11, 1568);
   dc.Mul(dc.r11, dc.r1, dc.r11);
   dc.Add(dc.r0, dc.r2, dc.r3);
   dc.Add(dc.r1, dc.r11, dc.r4);
   dc.Add(dc.r4, dc.r5, dc.r1);
   dc.Sub(dc.r3, dc.r3, dc.r2);
   dc.Sub(dc.r5, dc.r5, dc.r1);
   dc.Mov(dc.r1, dc.r4, dc.ASR, 8);
   dc.Mov(dc.r3, dc.r3, dc.ASR, 8);
   dc.Mov(dc.r2, dc.r0, dc.ASR, 8);
   dc.Mov(dc.r4, dc.r5, dc.ASR, 8);
   dc.Half(); dc.Str(dc.r1, dc.r6, 0x00);
   dc.Half(); dc.Str(dc.r2, dc.r6, 0x10);
   dc.Half(); dc.Str(dc.r3, dc.r6, 0x20);
   dc.Half(); dc.Str(dc.r4, dc.r6, 0x30);
   dc.Half(); dc.Str(dc.r4, dc.r6, 0x40); 
   dc.Half(); dc.Str(dc.r3, dc.r6, 0x50); 
   dc.Half(); dc.Str(dc.r2, dc.r6, 0x60); 
   dc.Half(); dc.Str(dc.r1, dc.r6, 0x70); 
   dc.Mov(dc.pc, dc.lr);

dc.PutLabel(mode_3);
                //x0,x1,x2,x3,x4,x5,x6,x7

   dc.Mov(dc.r9, 564);
   dc.Orr(dc.r9, dc.r9, 1);         //W7
   dc.Add(dc.r11, dc.r12, dc.r3);
   dc.Mul(dc.r11, dc.r9, dc.r11);    //x8 = W7 * (x5 + x4)

   dc.Mov(dc.r9, 2272);
   dc.Orr(dc.r9, dc.r9, 4);         //W1_minus_W7
   dc.Mla(dc.r3, dc.r9, dc.r3, dc.r11);    //x4 = x8 + (W1_minus_W7) * x4

   dc.Mvn(dc.r9, 0xd40);
   dc.Eor(dc.r9, dc.r9, 0xd);    //minus_W1_minus_W7
   dc.Mla(dc.r12, dc.r9, dc.r12, dc.r11);  //x5 = x8 + (minus_W1_minus_W7) * x5

   dc.Mov(dc.r9, 2400);      //
   dc.Orr(dc.r9, dc.r9, 8);         //W3
   dc.Add(dc.r11, dc.r0, dc.r5);
   dc.Mul(dc.r11, dc.r9, dc.r11);    //x8 = W3 * (x6 + x7)
                        
   dc.Mvn(dc.r9, 0x310);
   dc.Eor(dc.r9, dc.r9, 0xe);    //W5_minus_W3
   dc.Mla(dc.r0, dc.r9, dc.r0, dc.r11);    //x6 = x8 + (W5_minus_W3) * x6

   dc.Mvn(dc.r9, 0xfb0);         //minus_W3_minus_W5
   dc.Mla(dc.r5, dc.r9, dc.r5, dc.r11);    //x7 = x8 + minus_W3_minus_W5 * x7

   dc.Mov(dc.r10, dc.r10, dc.LSL, 11);
   dc.Add(dc.r10, dc.r10, 128);     //x0 = (x0 << 11) + 128
   dc.Add(dc.r11, dc.r10, dc.r4, dc.LSL, 11); //x8 = x0 + (x1 << 11)
   dc.Sub(dc.r10, dc.r10, dc.r4, dc.LSL, 11); //x0 = x0 - (x1 << 11)

   dc.Mov(dc.r9, 1104);
   dc.Orr(dc.r9, dc.r9, 4);         //W6
   dc.Add(dc.r4, dc.r1, dc.r2);
   dc.Mul(dc.r4, dc.r9, dc.r4);        //x1 = W6 * (x3 + x2)

   dc.Mvn(dc.r9, 0xec0);
   dc.Eor(dc.r9, dc.r9, 7);    //minus_W2_minus_W6
   dc.Mla(dc.r2, dc.r9, dc.r2, dc.r4);     //x2 = x1 + minus_W2_minus_W6 * x2

   dc.Mov(dc.r9, 0x620);         //W2_minus_W6
   dc.Mla(dc.r1, dc.r9, dc.r1, dc.r4);     //x3 = x1 + (W2_minus_W6) * x3

   dc.Add(dc.r4, dc.r3, dc.r0);        //x1 = x4 + x6
   dc.Sub(dc.r3, dc.r3, dc.r0);        //x4 -= x6
   dc.Add(dc.r0, dc.r12, dc.r5);        //x6 = x5 + x7
   dc.Sub(dc.r12, dc.r12, dc.r5);        //x5 -= x7
   dc.Add(dc.r5, dc.r11, dc.r1);        //x7 = x8 + x3
   dc.Sub(dc.r11, dc.r11, dc.r1);        //x8 -= x3
   dc.Add(dc.r1, dc.r10, dc.r2);        //x3 = x0 + x2
   dc.Sub(dc.r10, dc.r10, dc.r2);        //x0 -= x2

   dc.Add(dc.r9, dc.r3, dc.r12);       //x4 + x5
   dc.Sub(dc.r3, dc.r3, dc.r12);       //x4 - x5
   dc.Mov(dc.r12, 181);
   dc.Mul(dc.r2, dc.r9, dc.r12);       //181 * (x4 + x5)
   dc.Mul(dc.r9, dc.r3, dc.r12);       //181 * (x4 - x5)
   dc.Add(dc.r2, dc.r2, 128);      //x2 = 181 * (x4 + x5) + 128
   dc.Add(dc.r3, dc.r9, 128);      //x4 = 181 * (x4 - x5) + 128

   dc.Add(dc.r9, dc.r5, dc.r4);       
   dc.Sub(dc.r5, dc.r5, dc.r4);
   dc.Mov(dc.r9, dc.r9, dc.ASR, 8);      //(x7 + x1) >> 8
   dc.Mov(dc.r5, dc.r5, dc.ASR, 8);      //(x7 - x1) >> 8
   dc.Half(); dc.Str(dc.r9, dc.r6, 0x00);
   dc.Half(); dc.Str(dc.r5, dc.r6, 0x70);

   dc.Add(dc.r9, dc.r1, dc.r2, dc.ASR, 8);
   dc.Sub(dc.r1, dc.r1, dc.r2, dc.ASR, 8);
   dc.Mov(dc.r9, dc.r9, dc.ASR, 8);      //(x3 + x2) >> 8
   dc.Mov(dc.r1, dc.r1, dc.ASR, 8);      //(x3 - x2) >> 8
   dc.Half(); dc.Str(dc.r9, dc.r6, 0x10);
   dc.Half(); dc.Str(dc.r1, dc.r6, 0x60);

   dc.Add(dc.r9, dc.r10, dc.r3, dc.ASR, 8);
   dc.Sub(dc.r10, dc.r10, dc.r3, dc.ASR, 8);
   dc.Mov(dc.r9, dc.r9, dc.ASR, 8);      //(x0 + x4) >> 8
   dc.Mov(dc.r10, dc.r10, dc.ASR, 8);    //(x0 - x4) >> 8
   dc.Half(); dc.Str(dc.r9, dc.r6, 0x20);
   dc.Half(); dc.Str(dc.r10, dc.r6, 0x50);

   dc.Add(dc. r9, dc.r11, dc.r0);
   dc.Sub(dc.r11, dc.r11, dc.r0);
   dc.Mov(dc.r9, dc.r9, dc.ASR, 8);      //(x8 + x6) >> 8
   dc.Mov(dc.r11, dc.r11, dc.ASR, 8);    //(x8 - x6) >> 8
   dc.Half(); dc.Str(dc.r9, dc.r6, 0x30);
   dc.Half(); dc.Str(dc.r11, dc.r6, 0x40);

   dc.Mov(dc.pc, dc.lr);

   return fnc_begin;
}

//----------------------------

static void *BuildRowConst(C_dyn_code &dc){

// r0 Block[0]
// r6 Block
// r7 Src
// r8 Dst
   void *l_no_src = dc.Label(false);
   void *l_zero = dc.Label(false);
   void *l_sub = dc.Label(false);
   void *CarryMask = dc.DeclareData(0x80808080);

   dc.Align(16);

   void *fnc_begin = dc.Label();

   dc.Add(dc.r0, dc.r0, 32);
   dc.Cmp(dc.r7, 0);
   dc.Mov(dc.r3, dc.r0, dc.ASR, 6);
   dc.Branch(dc.EQ, l_no_src);
   dc.Cmp(dc.r3, 0);
   dc.Branch(dc.EQ, l_zero);
   dc.Ldr(dc.r0, CarryMask);
   dc.LdrAdvance(dc.r2, dc.r7, 8);  //source stride
   dc.Branch(dc.LT, l_sub);

                              //add:
   dc.Orr(dc.r3, dc.r3, dc.r3, dc.LSL, 8);
   dc.Orr(dc.r3, dc.r3, dc.r3, dc.LSL, 16);
   dc.Add(dc.r4, dc.r2, dc.r3);
   dc.Eor(dc.r11, dc.r2, dc.r3);
   dc.And(dc.r2, dc.r3, dc.r2);
   dc.Bic(dc.r11, dc.r11, dc.r4);
   dc.Orr(dc.r11, dc.r11, dc.r2);
   dc.And(dc.r5, dc.r11, dc.r0);
   dc.Mov(dc.r12, dc.r5, dc.LSL, 1);
   dc.Sub(dc.r10, dc.r4, dc.r12);
   dc.Sub(dc.r11, dc.r12, dc.r5, dc.LSR, 7);
   dc.Ldr(dc.r2, dc.r7, -4);
   dc.Orr(dc.r11, dc.r11, dc.r10);
   dc.Str(dc.r11, dc.r8, 0);
   dc.Add(dc.r4, dc.r2, dc.r3);
   dc.Eor(dc.r11, dc.r2, dc.r3);
   dc.And(dc.r2, dc.r3, dc.r2);
   dc.Bic(dc.r11, dc.r11, dc.r4);
   dc.Orr(dc.r11, dc.r11, dc.r2);
   dc.And(dc.r5, dc.r11, dc.r0);
   dc.Mov(dc.r12, dc.r5, dc.LSL, 1);
   dc.Sub(dc.r10, dc.r4, dc.r12);
   dc.Sub(dc.r11, dc.r12, dc.r5, dc.LSR, 7);
   dc.Orr(dc.r11, dc.r11, dc.r10);
   dc.Str(dc.r11, dc.r8, 4);
   dc.Mov(dc.pc, dc.lr);

dc.PutLabel(l_sub);
   dc.Rsb(dc.r3, dc.r3, 0);
   dc.Orr(dc.r3, dc.r3, dc.r3, dc.LSL, 8);
   dc.Orr(dc.r3, dc.r3, dc.r3, dc.LSL, 16);
   dc.Mvn(dc.r2, dc.r2);
   dc.Add(dc.r4, dc.r2, dc.r3);
   dc.Eor(dc.r11, dc.r2, dc.r3);
   dc.And(dc.r2, dc.r3, dc.r2);
   dc.Bic(dc.r11, dc.r11, dc.r4);
   dc.Orr(dc.r11, dc.r11, dc.r2);
   dc.And(dc.r5, dc.r11, dc.r0);
   dc.Mov(dc.r12, dc.r5, dc.LSL, 1);
   dc.Sub(dc.r10, dc.r4, dc.r12);
   dc.Sub(dc.r11, dc.r12, dc.r5, dc.LSR, 7);
   dc.Ldr(dc.r2, dc.r7, -4);
   dc.Orr(dc.r11, dc.r11, dc.r10);
   dc.Mvn(dc.r11, dc.r11);
   dc.Str(dc.r11, dc.r8, 0);
   dc.Mvn(dc.r2, dc.r2);
   dc.Add(dc.r4, dc.r2, dc.r3);
   dc.Eor(dc.r11, dc.r2, dc.r3);
   dc.And(dc.r2, dc.r3, dc.r2);
   dc.Bic(dc.r11, dc.r11, dc.r4);
   dc.Orr(dc.r11, dc.r11, dc.r2);
   dc.And(dc.r5, dc.r11, dc.r0);
   dc.Mov(dc.r12, dc.r5, dc.LSL, 1);
   dc.Sub(dc.r10, dc.r4, dc.r12);
   dc.Sub(dc.r11, dc.r12, dc.r5, dc.LSR, 7);
   dc.Orr(dc.r11, dc.r11, dc.r10);
   dc.Mvn(dc.r11, dc.r11);
   dc.Str(dc.r11, dc.r8, 4);
   dc.Mov(dc.pc, dc.lr);

dc.PutLabel(l_zero);
   dc.Ldr(dc.r2, dc.r7, 4);
   dc.LdrAdvance(dc.r1, dc.r7, 8);  //source stride
   dc.Str(dc.r2, dc.r8, 4);
   dc.Str(dc.r1, dc.r8, 0);
   dc.Mov(dc.pc, dc.lr);

dc.PutLabel(l_no_src);
   dc.Cmp(dc.r3, 0);
   dc.Cond(dc.MI); dc.Mov(dc.r3, 0);
   dc.Cond(dc.PL); dc.Cmp(dc.r3, 255);
   dc.Cond(dc.GT); dc.Mov(dc.r3, 255);
   dc.Orr(dc.r3, dc.r3, dc.r3, dc.LSL, 8);
   dc.Orr(dc.r3, dc.r3, dc.r3, dc.LSL, 16);
   dc.Str(dc.r3, dc.r8, 0);
   dc.Str(dc.r3, dc.r8, 4);
   dc.Mov(dc.pc, dc.lr);

   dc.PutLabel(CarryMask);

   return fnc_begin;
}

//----------------------------

static void BuildIDCT_Block4x8(C_dyn_code &dc, void *l_MCol8, void *l_RowConst){

// r6 Block
// r7 Src
// r8 Dst
   void *W1 = dc.DeclareData(2841);             // 2048*sqrt(2)*cos(1*pi/16)
   void *W2 = dc.DeclareData(2676);                 // 2048*sqrt(2)*cos(2*pi/16)
   void *W3 = dc.DeclareData(2408);                 // 2048*sqrt(2)*cos(3*pi/16)
   void *W6 = dc.DeclareData(1108);                 // 2048*sqrt(2)*cos(6*pi/16)
   void *W7 = dc.DeclareData(565);  //2048*sqrt(2)*cos(7*pi/16)
   void *minus_W5 = dc.DeclareData((dword)-1609);        // 2048*sqrt(2)*cos(5*pi/16)
   void *Row4_NoSrc = dc.Label(false);
   void *Row4_Sat = dc.Label(false);

   struct S_stack{
      void *end_ptr;
      dword dst_pitch;
      dword saved_regs[C_dyn_code::STACKFRAME];
   };

   dc.Align(16);

   dc.FunctionBegin(OffsetOf(S_stack, saved_regs));

   dc.Mov(dc.r6, dc.r0);      //Block
   dc.Add(dc.r0, dc.r0, 128);
   dc.Str(dc.r2, dc.sp, OffsetOf(S_stack, dst_pitch));
   dc.Str(dc.r0, dc.sp, OffsetOf(S_stack, end_ptr));

   dc.Mov(dc.r7, dc.r3);         //Src
   dc.Mov(dc.r8, dc.r1);        //Dst

   dc.BranchLink(l_MCol8);
   dc.Add(dc.r6, dc.r6, 2);
   dc.BranchLink(l_MCol8);
   dc.Add(dc.r6, dc.r6, 2);
   dc.BranchLink(l_MCol8);  
   dc.Add(dc.r6, dc.r6, 2);
   dc.BranchLink(l_MCol8); 
   dc.Sub(dc.r6, dc.r6, 6);
   {
      void *Row4_Loop = dc.Label();

      dc.SHalf(); dc.Ldr(dc.r4, dc.r6, 4);    //x3
      dc.SHalf(); dc.Ldr(dc.r5, dc.r6, 6);    //x7
      dc.SHalf(); dc.Ldr(dc.r3, dc.r6, 2);    //x4
      dc.SHalf(); dc.Ldr(dc.r0, dc.r6, 0);    //x0

      dc.Orr(dc.r11, dc.r5, dc.r4);
      dc.Set(); dc.Orr(dc.r11, dc.r11, dc.r3);
      void *Row4_NoConst = dc.Label(false);
      dc.Branch(dc.NE, Row4_NoConst);

      dc.BranchLink(l_RowConst);
      void *Row4_Next = dc.Label(false);
      dc.Branch(Row4_Next);

   dc.PutLabel(Row4_NoConst);
      dc.Cmp(dc.r7, 0);

⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -