📄 lantranform.cpp
字号:
/////////////////////////////////////////////////////////////////
// BIG5与GB2312编码转换程序
// 作者: Janhail Luo
// 最后整理: 2003-03-03
/////////////////////////////////////////////////////////////////
#include <stdio.h>
#include "LanTranform.h"
// 构造函数
CLanTransform::CLanTransform()
{
pBIG5 = 0;
pGB2312 = 0;
}
// 析构函数
CLanTransform::~CLanTransform()
{
// 释放码表
FreeTableBuf(true);
FreeTableBuf(false);
}
// 初始化转换程序,读入转换码表文件
bool CLanTransform::Init(const char* lpszBig2GBFile, const char* lpszGB2BigFile)
{
// 读入BIG5转换GB2312的码表文件
if (lpszBig2GBFile)
{
if (false==this->LoadTable(lpszBig2GBFile, true))
{
return false; // 读入失败
}
}
// 读入GB2312转换BIG5的码表文件
if (lpszGB2BigFile)
{
if (false==this->LoadTable(lpszGB2BigFile, false))
{
return false; // 读入失败
}
}
// 读入成功
return true;
}
// 转换一个指定的BIG5编码的字符串到GB2312编码的字符串
// lpBuf 是指定字符串的指针
// 如果不能转换就返回0, 否则返回lpBuf指向的地址
char* CLanTransform::BIG2GB(char* lpBuf)
{
unsigned char *pCur, *pDest, bFirst, bSecond, bIndex ;
// 如果没有初始化数据或者没有需要转换的数据,就直接返回
if (pBIG5==0 || lpBuf==0)
{
return 0;
}
pCur = (unsigned char*)lpBuf;
while(*pCur) // 处理到字符串结束
{
bFirst = *pCur; // 取得第一个字节的值
bSecond = *(pCur+1); // 取得第二个字节的值
if (bFirst<0xA1 || bFirst>0xFE) // 如果是英文字符
{
// 不转换,直接跳到下一个字符
pCur++;
}else if (bSecond<0x40 // 如果是非BIG5的其他字符
|| bSecond>0xFE || (bSecond>0X7E&&bSecond<0XA1))
{
// 不转换,直接跳到下一个字符
pCur++;
}else // 是BIG5字符,需要转换
{
bIndex = bFirst-0xA1;
// 由
// if (bSecond<0x7F)
// {
// d = pBIG5 + ((temp*0xA0 + (bSecond-0x40))<<1);
// }else
// {
// d = pBIG5 + ((temp*0xA0 +
// (bSecond+(0x7F-0x40)-0xA1))<<1);
// }
// 可以优化成为下面语句
//pDest = pBIG5 + ((bIndex<<7)+(bIndex<<5))<<1;
pDest = pBIG5 + (((bIndex<<7)+(bIndex<<5))<<1);
if (bSecond<0x7F)
{
pDest += (bSecond-0x40)<<1;
}else
{
pDest += (bSecond+0x3F-0xA1)<<1;
}
*pCur++ = *pDest++; // 第一个字节
*pCur++ = *pDest; // 第二个字节
}
}
return lpBuf;
}
// 转换一个指定的GB2312编码的字符串到BIG5编码的字符串
// lpBuf 是指定字符串的指针
// 如果不能转换就返回0, 否则返回lpBuf指向的地址
char* CLanTransform::GB2BIG(char* lpBuf)
{
unsigned char *pCur, *pDest, bFirst, bSecond, bIndex ;
// 如果没有初始化数据或者没有需要转换的数据,就直接返回
if (pGB2312==0 || lpBuf==0)
{
return 0;
}
pCur = (unsigned char*)lpBuf;
while(*pCur) // 如果字符串结束
{
bFirst = *pCur; // 取得第一个字节的值
bSecond = *(pCur+1); // 取得第二个字节的值
if (bFirst<0xA1 || bFirst>0xF7) // 如果是英文字符
{
pCur++; // 不转换,直接跳到下一个字符
}else if (bSecond<0xA1 || bSecond>0xFE) // 如果是非GB2312的其他字符
{
pCur++; // 不转换,直接跳到下一个字符
}else // 是GB2312字符,需要转换
{
bIndex = bFirst-0xA1;
// 由 d = pGB2312 + ((temp*0x5E + (bSecond-0xA1))<<1);
// 可以优化成为下面语句
pDest = pGB2312 + (((bIndex<<6)+(bIndex<<5)
+ (bSecond-0xA1))<<1);
*pCur++ = *pDest++; // 第一个字节
*pCur++ = *pDest; // 第二个字节
}
}
return lpBuf;
}
// 从指定文件中读入字符转换表。
// lpFileName 字符转换表的文件名
// bIsBIG5 是否是BIG5的转换表
// 返回true读入成功,否则失败
bool CLanTransform::LoadTable(const char* lpFileName, const bool bIsBIG5)
{
FILE* fp;
fpos_t pos;
unsigned long fileSize;
unsigned char* pData;
if (bIsBIG5)
{
// 如果数据已经有读入
if (pBIG5)
{
// 释放原来读入的数据准备重新读入
this->FreeTableBuf(bIsBIG5);
pBIG5 = 0;
}
}else
{
// 如果数据已经有读入
if (pGB2312)
{
// 释放原来读入的数据准备重新读入
this->FreeTableBuf(bIsBIG5);
pGB2312 = 0;
}
}
// 打开文件
if ((fp=fopen(lpFileName, "rb"))==NULL)
{
return false; // 文件打开失败
}
// 取得文件大小
fseek(fp, 0, SEEK_END);
fgetpos( fp, &pos );
fileSize = (unsigned long)(pos&0x00000000FFFFFFFF);
// 跳回到文件头部
fseek(fp, 0, SEEK_SET);
// 在这里跳过文件头部信息
// ...
// 分配內存
pData = new unsigned char[fileSize];
if (pData==NULL) // 如果內存分配失败
{
fclose(fp); // 关闭文件
return false; // 内存分配失败
}
// 读取文件数据到内存中
fread(pData, fileSize, 1, fp);
// 关闭文件
fclose(fp);
if (bIsBIG5)
{
pBIG5 = pData;
}else
{
pGB2312 = pData;
}
return true; // 完成
}
// 释放字符表
// bIsBIG5 是否是BIG5的字符表
bool CLanTransform::FreeTableBuf(const bool bIsBIG5)
{
if (bIsBIG5)
{
if (pBIG5) // 如果有数据
{
delete[] pBIG5; // 刪除数据
pBIG5 = 0 ; // 清空指针
}
}else
{
if (pGB2312) // 如果有数据
{
delete[] pGB2312; // 刪除数据
pGB2312 = 0 ; // 清空指针
}
}
return true;
}
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -