📄 newfft.cpp

📁 各种矩阵算法库。支持UpperTriangularMatrix,LowerTriangularMatrix, DiagonalMatrix, SymmetricMatrix, BandMatrix,U
💻 CPP
📖 第 1 页 / 共 3 页
字号:
12 3 下一页
//$ newfft.cpp// This is originally by Sande and Gentleman in 1967! I have translated from// Fortran into C and a little bit of C++.// It takes about twice as long as fftw// (http://theory.lcs.mit.edu/~fftw/homepage.html)// but is much shorter than fftw  and so despite its age// might represent a reasonable// compromise between speed and complexity.// If you really need the speed get fftw.//    THIS SUBROUTINE WAS WRITTEN BY G.SANDE OF PRINCETON UNIVERSITY AND//    W.M.GENTLMAN OF THE BELL TELEPHONE LAB.  IT WAS BROUGHT TO LONDON//    BY DR. M.D. GODFREY AT THE IMPERIAL COLLEGE AND WAS ADAPTED FOR//    BURROUGHS 6700 BY D. R. BRILLINGER AND J. PEMBERTON//    IT REPRESENTS THE STATE OF THE ART OF COMPUTING COMPLETE FINITE//    DISCRETE FOURIER TRANSFORMS AS OF NOV.1967.//    OTHER PROGRAMS REQUIRED.//                                 ONLY THOSE SUBROUTINES INCLUDED HERE.//                      USAGE.//       CALL AR1DFT(N,X,Y)//            WHERE  N IS THE NUMBER OF POINTS IN THE SEQUENCE .//                   X - IS A ONE-DIMENSIONAL ARRAY CONTAINING THE REAL//                       PART OF THE SEQUENCE.//                   Y - IS A ONE-DIMENSIONAL ARRAY CONTAINING THE//                       IMAGINARY PART OF THE SEQUENCE.//    THE TRANSFORM IS RETURNED IN X AND Y.//            METHOD//               FOR A GENERAL DISCUSSION OF THESE TRANSFORMS AND OF//    THE FAST METHOD FOR COMPUTING THEM, SEE GENTLEMAN AND SANDE,//    @FAST FOURIER TRANSFORMS - FOR FUN AND PROFIT,@ 1966 FALL JOINT//    COMPUTER CONFERENCE.//    THIS PROGRAM COMPUTES THIS FOR A COMPLEX SEQUENCE Z(T) OF LENGTH//    N WHOSE ELEMENTS ARE STORED AT(X(I) , Y(I)) AND RETURNS THE//    TRANSFORM COEFFICIENTS AT (X(I), Y(I)).//        DESCRIPTION//    AR1DFT IS A HIGHLY MODULAR ROUTINE CAPABLE OF COMPUTING IN PLACE//    THE COMPLETE FINITE DISCRETE FOURIER TRANSFORM  OF A ONE-//    DIMENSIONAL SEQUENCE OF RATHER GENERAL LENGTH N.//       THE MAIN ROUTINE , AR1DFT ITSELF, FACTORS N. IT THEN CALLS ON//    ON GR 1D FT TO COMPUTE THE ACTUAL TRANSFORMS, USING THESE FACTORS.//    THIS GR 1D FT DOES, CALLING AT EACH STAGE ON THE APPROPRIATE KERN//    EL R2FTK, R4FTK, R8FTK, R16FTK, R3FTK, R5FTK, OR RPFTK TO PERFORM//    THE COMPUTATIONS FOR THIS PASS OVER THE SEQUENCE, DEPENDING ON//    WHETHER THE CORRESPONDING FACTOR IS 2, 4, 8, 16, 3, 5, OR SOME//    MORE GENERAL PRIME P. WHEN GR1DFT IS FINISHED THE TRANSFORM IS//    COMPUTED, HOWEVER, THE RESULTS ARE STORED IN "DIGITS REVERSED"//    ORDER. AR1DFT THEREFORE, CALLS UPON GR 1S FS TO SORT THEM OUT.//    TO RETURN TO THE FACTORIZATION, SINGLETON HAS POINTED OUT THAT//    THE TRANSFORMS ARE MORE EFFICIENT IF THE SAMPLE SIZE N, IS OF THE//    FORM B*A**2 AND B CONSISTS OF A SINGLE FACTOR.  IN SUCH A CASE//    IF WE PROCESS THE FACTORS IN THE ORDER ABA  THEN//    THE REORDERING CAN BE DONE AS FAST IN PLACE, AS WITH SCRATCH//    STORAGE.  BUT AS B BECOMES MORE COMPLICATED, THE COST OF THE DIGIT//    REVERSING DUE TO B PART BECOMES VERY EXPENSIVE IF WE TRY TO DO IT//    IN PLACE.  IN SUCH A CASE IT MIGHT BE BETTER TO USE EXTRA STORAGE//    A ROUTINE TO DO THIS IS, HOWEVER, NOT INCLUDED HERE.//    ANOTHER FEATURE INFLUENCING THE FACTORIZATION IS THAT FOR ANY FIXED//    FACTOR N WE CAN PREPARE A SPECIAL KERNEL WHICH WILL COMPUTE//    THAT STAGE OF THE TRANSFORM MORE EFFICIENTLY THAN WOULD A KERNEL//    FOR GENERAL FACTORS, ESPECIALLY IF THE GENERAL KERNEL HAD TO BE//    APPLIED SEVERAL TIMES. FOR EXAMPLE, FACTORS OF 4 ARE MORE//    EFFICIENT THAN FACTORS OF 2, FACTORS OF 8 MORE EFFICIENT THAN 4,ETC//    ON THE OTHER HAND DIMINISHING RETURNS RAPIDLY SET IN, ESPECIALLY//    SINCE THE LENGTH OF THE KERNEL FOR A SPECIAL CASE IS ROUGHLY//    PROPORTIONAL TO THE FACTOR IT DEALS WITH. HENCE THESE PROBABLY ARE//    ALL THE KERNELS WE WISH TO HAVE.//            RESTRICTIONS.//    AN UNFORTUNATE FEATURE OF THE SORTING PROBLEM IS THAT THE MOST//    EFFICIENT WAY TO DO IT IS WITH NESTED DO LOOPS, ONE FOR EACH//    FACTOR. THIS PUTS A RESTRICTION ON N AS TO HOW MANY FACTORS IT//    CAN HAVE.  CURRENTLY THE LIMIT IS 16, BUT THE LIMIT CAN BE READILY//    RAISED IF NECESSARY.//    A SECOND RESTRICTION OF THE PROGRAM IS THAT LOCAL STORAGE OF THE//    THE ORDER P**2 IS REQUIRED BY THE GENERAL KERNEL RPFTK, SO SOME//    LIMIT MUST BE SET ON P.  CURRENTLY THIS IS 19, BUT IT CAN BE INCRE//    INCREASED BY TRIVIAL CHANGES.//       OTHER COMMENTS.//(1) THE ROUTINE IS ADAPTED TO CHECK WHETHER A GIVEN N WILL MEET THE//    ABOVE FACTORING REQUIREMENTS AN, IF NOT, TO RETURN THE NEXT HIGHER//    NUMBER, NX, SAY, WHICH WILL MEET THESE REQUIREMENTS.//    THIS CAN BE ACCHIEVED BY   A STATEMENT OF THE FORM//            CALL FACTR(N,X,Y).//    IF A DIFFERENT N, SAY NX, IS RETURNED THEN THE TRANSFORMS COULD BE//    OBTAINED BY EXTENDING THE SIZE OF THE X-ARRAY AND Y-ARRAY TO NX,//    AND SETTING X(I) = Y(I) = 0., FOR I = N+1, NX.//(2) IF THE SEQUENCE Z IS ONLY A REAL SEQUENCE, THEN THE IMAGINARY PART//    Y(I)=0., THIS WILL RETURN THE COSINE TRANSFORM OF THE REAL SEQUENCE//    IN X, AND THE SINE TRANSFORM IN Y.#define WANT_STREAM#define WANT_MATH#include "newmatap.h"#ifdef use_namespacenamespace NEWMAT {#endifinline Real square(Real x) { return x*x; }inline int square(int x) { return x*x; }static void GR_1D_FS (int PTS, int N_SYM, int N_UN_SYM,   const SimpleIntArray& SYM, int P_SYM, const SimpleIntArray& UN_SYM,   Real* X, Real* Y);static void GR_1D_FT (int N, int N_FACTOR, const SimpleIntArray& FACTOR,   Real* X, Real* Y);static void R_P_FTK (int N, int M, int P, Real* X, Real* Y);static void R_2_FTK (int N, int M, Real* X0, Real* Y0, Real* X1, Real* Y1);static void R_3_FTK (int N, int M, Real* X0, Real* Y0, Real* X1, Real* Y1,   Real* X2, Real* Y2);static void R_4_FTK (int N, int M,   Real* X0, Real* Y0, Real* X1, Real* Y1,   Real* X2, Real* Y2, Real* X3, Real* Y3);static void R_5_FTK (int N, int M,   Real* X0, Real* Y0, Real* X1, Real* Y1, Real* X2, Real* Y2,   Real* X3, Real* Y3, Real* X4, Real* Y4);static void R_8_FTK (int N, int M,   Real* X0, Real* Y0, Real* X1, Real* Y1,   Real* X2, Real* Y2, Real* X3, Real* Y3,   Real* X4, Real* Y4, Real* X5, Real* Y5,   Real* X6, Real* Y6, Real* X7, Real* Y7);static void R_16_FTK (int N, int M,   Real* X0, Real* Y0, Real* X1, Real* Y1,   Real* X2, Real* Y2, Real* X3, Real* Y3,   Real* X4, Real* Y4, Real* X5, Real* Y5,   Real* X6, Real* Y6, Real* X7, Real* Y7,   Real* X8, Real* Y8, Real* X9, Real* Y9,   Real* X10, Real* Y10, Real* X11, Real* Y11,   Real* X12, Real* Y12, Real* X13, Real* Y13,   Real* X14, Real* Y14, Real* X15, Real* Y15);static int BitReverse(int x, int prod, int n, const SimpleIntArray& f);bool FFT_Controller::ar_1d_ft (int PTS, Real* X, Real *Y){//    ARBITRARY RADIX ONE DIMENSIONAL FOURIER TRANSFORM   int  F,J,N,NF,P,PMAX,P_SYM,P_TWO,Q,R,TWO_GRP;   // NP is maximum number of squared factors allows PTS up to 2**32 at least   // NQ is number of not-squared factors - increase if we increase PMAX   const int NP = 16, NQ = 10;   SimpleIntArray PP(NP), QQ(NQ);   TWO_GRP=16; PMAX=19;   // PMAX is the maximum factor size   // TWO_GRP is the maximum power of 2 handled as a single factor   // Doesn't take advantage of combining powers of 2 when calculating   // number of factors   if (PTS<=1) return true;   N=PTS; P_SYM=1; F=2; P=0; Q=0;   // P counts the number of squared factors   // Q counts the number of the rest   // R = 0 for no non-squared factors; 1 otherwise   // FACTOR holds all the factors - non-squared ones in the middle   //   - length is 2*P+Q   // SYM also holds all the factors but with the non-squared ones   //   multiplied together - length is 2*P+R   // PP holds the values of the squared factors - length is P   // QQ holds the values of the rest - length is Q   // P_SYM holds the product of the squared factors   // find the factors - load into PP and QQ   while (N > 1)   {      bool fail = true;      for (J=F; J<=PMAX; J++)         if (N % J == 0) { fail = false; F=J; break; }      if (fail || P >= NP || Q >= NQ) return false; // can't factor      N /= F;      if (N % F != 0) QQ[Q++] = F;      else { N /= F; PP[P++] = F; P_SYM *= F; }   }   R = (Q == 0) ? 0 : 1;  // R = 0 if no not-squared factors, 1 otherwise   NF = 2*P + Q;   SimpleIntArray FACTOR(NF + 1), SYM(2*P + R);   FACTOR[NF] = 0;                // we need this in the "combine powers of 2"   // load into SYM and FACTOR   for (J=0; J<P; J++)      { SYM[J]=FACTOR[J]=PP[P-1-J]; FACTOR[P+Q+J]=SYM[P+R+J]=PP[J]; }   if (Q>0)   {      for (J=0; J<Q; J++) FACTOR[P+J]=QQ[J];      SYM[P]=PTS/square(P_SYM);   }   // combine powers of 2   P_TWO = 1;   for (J=0; J < NF; J++)   {      if (FACTOR[J]!=2) continue;      P_TWO=P_TWO*2; FACTOR[J]=1;      if (P_TWO<TWO_GRP && FACTOR[J+1]==2) continue;      FACTOR[J]=P_TWO; P_TWO=1;   }   if (P==0) R=0;   if (Q<=1) Q=0;   // do the analysis   GR_1D_FT(PTS,NF,FACTOR,X,Y);                 // the transform   GR_1D_FS(PTS,2*P+R,Q,SYM,P_SYM,QQ,X,Y);      // the reshuffling   return true;}static void GR_1D_FS (int PTS, int N_SYM, int N_UN_SYM,   const SimpleIntArray& SYM, int P_SYM, const SimpleIntArray& UN_SYM,   Real* X, Real* Y){//    GENERAL RADIX ONE DIMENSIONAL FOURIER SORT// PTS = number of points// N_SYM = length of SYM// N_UN_SYM = length of UN_SYM// SYM: squared factors + product of non-squared factors + squared factors// P_SYM = product of squared factors (each included only once)// UN_SYM: not-squared factors   Real T;   int  JJ,KK,P_UN_SYM;   // I have replaced the multiple for-loop used by Sande-Gentleman code   // by the following code which does not limit the number of factors   if (N_SYM > 0)   {      SimpleIntArray U(N_SYM);      for(MultiRadixCounter MRC(N_SYM, SYM, U); !MRC.Finish(); ++MRC)      {         if (MRC.Swap())         {            int P = MRC.Reverse(); int JJ = MRC.Counter(); Real T;            T=X[JJ]; X[JJ]=X[P]; X[P]=T; T=Y[JJ]; Y[JJ]=Y[P]; Y[P]=T;         }      }   }   int J,JL,K,L,M,MS;   // UN_SYM contains the non-squared factors   // I have replaced the Sande-Gentleman code as it runs into   // integer overflow problems   // My code (and theirs) would be improved by using a bit array   // as suggested by Van Loan   if (N_UN_SYM==0) return;   P_UN_SYM=PTS/square(P_SYM); JL=(P_UN_SYM-3)*P_SYM; MS=P_UN_SYM*P_SYM;   for (J = P_SYM; J<=JL; J+=P_SYM)   {      K=J;      do K = P_SYM * BitReverse(K / P_SYM, P_UN_SYM, N_UN_SYM, UN_SYM);      while (K<J);      if (K!=J)      {         for (L=0; L<P_SYM; L++) for (M=L; M<PTS; M+=MS)         {            JJ=M+J; KK=M+K;            T=X[JJ]; X[JJ]=X[KK]; X[KK]=T; T=Y[JJ]; Y[JJ]=Y[KK]; Y[KK]=T;         }      }   }   return;}static void GR_1D_FT (int N, int N_FACTOR, const SimpleIntArray& FACTOR,   Real* X, Real* Y){//    GENERAL RADIX ONE DIMENSIONAL FOURIER TRANSFORM;   int  M = N;   for (int i = 0; i < N_FACTOR; i++)   {      int P = FACTOR[i]; M /= P;      switch(P)      {      case 1: break;      case 2: R_2_FTK (N,M,X,Y,X+M,Y+M); break;      case 3: R_3_FTK (N,M,X,Y,X+M,Y+M,X+2*M,Y+2*M); break;      case 4: R_4_FTK (N,M,X,Y,X+M,Y+M,X+2*M,Y+2*M,X+3*M,Y+3*M); break;      case 5:         R_5_FTK (N,M,X,Y,X+M,Y+M,X+2*M,Y+2*M,X+3*M,Y+3*M,X+4*M,Y+4*M);         break;      case 8:         R_8_FTK (N,M,X,Y,X+M,Y+M,X+2*M,Y+2*M,            X+3*M,Y+3*M,X+4*M,Y+4*M,X+5*M,Y+5*M,            X+6*M,Y+6*M,X+7*M,Y+7*M);         break;      case 16:         R_16_FTK (N,M,X,Y,X+M,Y+M,X+2*M,Y+2*M,            X+3*M,Y+3*M,X+4*M,Y+4*M,X+5*M,Y+5*M,            X+6*M,Y+6*M,X+7*M,Y+7*M,X+8*M,Y+8*M,            X+9*M,Y+9*M,X+10*M,Y+10*M,X+11*M,Y+11*M,            X+12*M,Y+12*M,X+13*M,Y+13*M,X+14*M,Y+14*M,            X+15*M,Y+15*M);         break;      default: R_P_FTK (N,M,P,X,Y); break;      }   }}static void R_P_FTK (int N, int M, int P, Real* X, Real* Y)//    RADIX PRIME FOURIER TRANSFORM KERNEL;// X and Y are treated as M * P matrices with Fortran storage{   bool NO_FOLD,ZERO;   Real ANGLE,IS,IU,RS,RU,T,TWOPI,XT,YT;   int  J,JJ,K0,K,M_OVER_2,MP,PM,PP,U,V;   Real AA [9][9], BB [9][9];   Real A [18], B [18], C [18], S [18];   Real IA [9], IB [9], RA [9], RB [9];   TWOPI=8.0*atan(1.0);   M_OVER_2=M/2+1; MP=M*P; PP=P/2; PM=P-1;
12 3 下一页
⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -