⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 汉字处理的问题.doc

📁 黑魔方JSP基础教程源代码(耿祥义编著)是这里有课件和jsp源代码
💻 DOC
字号:
 看到很多文章在问和答关于java网页汉字乱码的情况,有些甚至认为这是servlet包容器实现上的错误。
可是如果读过servlet规格说明书,关于java网页编码的问题就应该迎刃而解了。
编写java网页(servlet\jsp),需要关心response(反馈给客户端的页面)和request(来自客户端的数据)的编码问题。
response的编码可以直接用代码实现。而request的编码怎么办呢?
以下是servlet规范书上的文字(我粗略翻译一下吧,不怕见笑):
-- 整理自 SRV.4.9 --
当前,很多浏览器并不发送带有“Content-Type”头信息的字符编码限定符,
而由读取HTTP请求的代码来决定字符的编码方式。如果客户端请求未定义编码限定符,
则包容器(如tomcat)用于创建request reader和分析POST数据的request的缺省编码
方式必须是“ISO-8859-1”。然而,为了向开发者指明客户端没有发送字符编码信息的
情况,包容器对getCharacterEncoding方法返回null。
如果客户端不设置字符编码方式,并且request不是按照以上缺省编码方式
(iso-8859-1)来编码,则会发生问题。为了解决这个问题,在接口
ServletRequest中加入了一个新的方法setCharacterEncoding(String enc)。
开发者可以调用这个方法来替换包容器提供的缺省字符编码方式。但是,
必须在从request中分析任何POST数据或者读取任何输入之前,调用这个方法。
一旦数据已被读取,则调用这个方法将不会影响编码方式。 

通用字符集ISO/IEC-1062.,也即统一字符编码标准Unicode 2.0。
其他系列的字符集子集,例如UTF-8、ISO-8859-1或UCS-2等。其中:
UTF-8是指通用字符集UCS(Universal Character Set)的转换格式8(Transformation Format 8),主要传输国际字符集的转换编码。UTF-8采用了UCS字符的8位编码,提供了十分安全的编码格式,可以有效避免数据传输过程中的窃听、截取及非法解密。同时,UTF-8与7位ACSII码完全兼容,不会影响此类编码实现的程序;它的编码规则十分严格,能够有效避免同步传输错误,而且还会支持其它字符集提供了足够的空间。

ISO-8859-1字符集是国际标准化组织ISO(International Standardization Organization)制定的ACSII字符集的扩展集,能够表示所有西欧语言的字符。与ISO Latin-1一样,ISO-8859-1与Windows环境中普遍使用的美国国家标准协会ANSI(American National Standards Institute)的字符集极为类似,绝大多数情况下无需区分。在不特别指明的情况下,HTTP协议均使用ISOLatin-1字符集。因此,为了WML页面中表示非ACSII(non-ACSII)字符,开发人员需要使用相应的ISO Latin-1编码的字符。

UCS-2是ISO 1062.标准中自定义的通用多8位编码字符集(Universal Multiple-Octer Coded Character Set)的2字节(即16位)编码标准,其字符编码值与Unicode字符的标准编码值相等。

⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -