改进java字符串分解的方法-java面向对象 - it电子教育门户 高端java培训.htm
来自「这是我自己认真整理的java面向对象的各个方面的知识.想和大家一起来分享我的快乐」· HTM 代码 · 共 674 行 · 第 1/3 页
HTM
674 行
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<!-- saved from url=(0060)http://www.mldn.cn/articleview/2007-1-7/article_view_272.htm -->
<HTML><HEAD><TITLE>改进JAVA字符串分解的方法/JAVA面向对象 - IT电子教育门户 高端JAVA培训</TITLE>
<STYLE type=text/css>BODY {
FONT-SIZE: 12px
}
TD {
FONT-SIZE: 12px
}
TH {
FONT-SIZE: 12px
}
.STYLE1 {
FONT-WEIGHT: bold; FONT-SIZE: 18px; COLOR: #003399
}
.STYLE2 {
FONT-SIZE: 14px
}
</STYLE>
<META content="MSHTML 6.00.2900.2180" name=GENERATOR>
<META content=g0IGIjwMtoTt4TksXOL7QykvujGWD7D0AoPDPWEsjRs= name=verify-v1>
<META http-equiv=Content-Type content="text/html; charset=utf-8">
<META http-equiv=Content-Language content=zh-CN>
<META content=java培训,mldn,JAVA教程,北京JAVA培训,IT电子教育门户,北京JAVA培训,java语法
name=keywords>
<META
content=大多数Java程序员都曾经使用过java.util.StringTokenizer类。它是一个很方便的字符串分解器,主要用来根据分隔符把字符串分割成标记(Token),然后按照请求返回各个标记。
name=description>
<META content=all name=robots>
<META content=www.mldn.cn,所有版权 name=Copyright>
<STYLE type=text/css>BODY {
MARGIN: 0px
}
</STYLE>
<STYLE type=text/css>IMG {
BORDER-TOP-STYLE: none; BORDER-RIGHT-STYLE: none; BORDER-LEFT-STYLE: none; BORDER-BOTTOM-STYLE: none
}
A:link {
TEXT-DECORATION: none
}
BODY {
FONT-SIZE: 12px
}
TD {
FONT-SIZE: 12px
}
TH {
FONT-SIZE: 12px
}
A:visited {
TEXT-DECORATION: none
}
A:hover {
TEXT-DECORATION: underline
}
A:active {
TEXT-DECORATION: none
}
.input {
BORDER-RIGHT: #acb4b7 1px solid; PADDING-RIGHT: 0px; BORDER-TOP: #9aa1a9 1px solid; PADDING-LEFT: 0px; FONT-SIZE: 14px; BACKGROUND-ATTACHMENT: fixed; BACKGROUND-IMAGE: url(image/search/input.gif); PADDING-BOTTOM: 5px; BORDER-LEFT: #9aa1a9 1px solid; WIDTH: 550px; PADDING-TOP: 5px; BORDER-BOTTOM: #acb4b7 1px solid; BACKGROUND-REPEAT: no-repeat; HEIGHT: 30px; TEXT-ALIGN: left
}
</STYLE>
</STYLE><!--系统js,必须调用-->
<SCRIPT src="改进JAVA字符串分解的方法-JAVA面向对象 - IT电子教育门户 高端JAVA培训.files/public.js"
type=text/javascript></SCRIPT>
<LINK title=rss href="http://www.mldn.cn/rssfeed.asp" type=application/rss+xml
rel=alternate></HEAD>
<BODY><!--头部代码结束-->
<TABLE cellSpacing=0 cellPadding=0 width=890 align=center border=0>
<TBODY>
<TR>
<TD width=274><A href="http://www.mldn.cn/"><IMG height=79 alt=MLDN
src="改进JAVA字符串分解的方法-JAVA面向对象 - IT电子教育门户 高端JAVA培训.files/logo.gif" width=274
border=0></A></TD>
<TD width=616><IMG height=79
src="改进JAVA字符串分解的方法-JAVA面向对象 - IT电子教育门户 高端JAVA培训.files/main_r1_c2.gif"
width=616 useMap=#Map border=0></TD></TR></TBODY></TABLE><MAP name=Map><AREA
shape=RECT coords=8,22,45,49 href="http://www.mldn.cn/"><AREA shape=RECT
coords=53,22,113,50
href="http://www.mldn.cn/articlelist/article_3_adddate_desc_1.htm"><AREA
shape=RECT coords=116,20,177,51
href="http://www.mldn.cn/articlelist/article_4_adddate_desc_1.htm"><AREA
shape=RECT alt=java培训 coords=181,21,242,51
href="http://www.mldn.cn/articlelist/article_58_adddate_desc_1.htm"><AREA
shape=RECT coords=245,21,307,52 href="http://www.mldnjava.cn/"><AREA
shape=RECT coords=309,21,374,51 href="http://www.zhinangtuan.net.cn/"><AREA
shape=RECT target=_blank coords=376,21,439,50
href="http://www.mldnjava.cn/java/index.htm"></MAP>
<SCRIPT language=javascript></SCRIPT>
<TABLE cellSpacing=0 cellPadding=0 width=890 align=center border=0>
<TBODY>
<TR>
<TD><A href="http://www.mldnjava.cn/java/" target=blank><IMG height=150
alt=远程JAVA培训
src="改进JAVA字符串分解的方法-JAVA面向对象 - IT电子教育门户 高端JAVA培训.files/index_banner.jpg"
width=890></A></TD></TR></TBODY></TABLE>
<TABLE cellSpacing=0 cellPadding=0 width=890 align=center bgColor=#f1f1f1
border=0>
<TBODY>
<TR>
<TD vAlign=top width=670>
<TABLE cellSpacing=1 cellPadding=0 width="99%" align=center
bgColor=#cccccc border=0>
<TBODY>
<TR>
<TD bgColor=#ffffff>
<TABLE cellSpacing=0 cellPadding=0 width="98%" align=center
border=0>
<TBODY>
<TR>
<TD bgColor=#e4e4e4 colSpan=2><A
href="http://www.mldn.cn/"><B>IT电子教育门户 高端JAVA培训</B></A> -=>
<A
href="http://www.mldn.cn/articlelist/article_4_adddate_desc_1.htm"><B>资源中心</B></A>
-=> <A
href="http://www.mldn.cn/articlelist/article_11_adddate_desc_1.htm"><B>JAVA
SE技术专区</B></A> -=> <A
href="http://www.mldn.cn/articlelist/article_18_adddate_desc_1.htm"><B>JAVA面向对象</B></A>
-=> 正文</TD></TR>
<TR>
<TD align=middle colSpan=2 height=40>
<H1>改进JAVA字符串分解的方法</H1></TD></TR>
<TR align=middle>
<TD colSpan=2 height=40>
<SCRIPT type=text/javascript><!--
google_ad_client = "pub-8263014661871932";
google_ad_width = 468;
google_ad_height = 60;
google_ad_format = "468x60_as";
google_ad_type = "text_image";
//2007-02-14: 新闻内容页面上面
google_ad_channel = "8423241514";
google_color_border = "FFFFFF";
google_color_bg = "FFFFFF";
google_color_link = "333333";
google_color_text = "333333";
google_color_url = "003366";
//--></SCRIPT>
<SCRIPT
src="改进JAVA字符串分解的方法-JAVA面向对象 - IT电子教育门户 高端JAVA培训.files/show_ads.js"
type=text/javascript>
</SCRIPT>
</TD></TR>
<TR>
<TD colSpan=2 height=40> 发布日期:2007-1-7
19:12:00 发布者:[<A
href="http://www.mldn.cn/florilegium.jtml?a_name=IT电子教育门户&a_id=0"
rel=external>IT电子教育门户</A>] 评论:[
<SCRIPT
src="改进JAVA字符串分解的方法-JAVA面向对象 - IT电子教育门户 高端JAVA培训.files/error.htm"
type=text/javascript></SCRIPT>
] 浏览:
<SCRIPT
src="C:\Documents and Settings\elibuser\桌面\面向对象学习文档\改进JAVA字符串分解的方法-JAVA面向对象 - IT电子教育门户 高端JAVA培训.files\error(1).htm"
type=text/javascript></SCRIPT>
</TD></TR>
<TR>
<TD colSpan=2><SPAN class=STYLE2>
<DIV id=article>
<DIV><B>改进</B><B>JAVA</B><B>字符串分解的方法</B><B></B></DIV>
<DIV>一、概述 </DIV>
<DIV> </DIV>
<DIV> 大多数Java程序员都曾经使用过java.util.StringTokenizer类。它是一个很方便的字符串分解器,主要用来根据分隔符把字符串分割成标记(Token),然后按照请求返回各个标记。这个过程称为Tokenization,实际上就是把字符序列转换成应用程序能够理解的多个标记。
</DIV>
<DIV> </DIV>
<DIV> 虽然StringTokenizer用起来很方便,但它的功能却很有限。这个类只是简单地在输入字符串中查找分隔符,一旦找到了分隔符就分割字符串。它不会检查分隔符是否在子串之中这类条件,当输入字符串中出现两个连续的分隔符时,它也不会返回""(字符串长度为0)形式的标记。
</DIV>
<DIV> </DIV>
<DIV> 为了突破这些局限,Java
2平台提供了BreakIterator类,它是在StringTokenizer之上改进的字符串分解器。由于JDK
1.1.x没有提供这个类,为了满足自己的需要,开发者经常花费很多时间从头开始编写分解器。在涉及到数据格式化处理的大型工程中,这类定制的字符串分解器有时随处可见,而且这种情况并不罕见。
</DIV>
<DIV> </DIV>
<DIV> 本文的目标是帮助你利用现有的StringTokenizer类,编写一个高级字符串分解器。 </DIV>
<DIV> </DIV>
<DIV>二、StringTokenizer的局限 </DIV>
<DIV> </DIV>
<DIV> 你可以用以下三种构造函数中的任意一种创建StringTokenizer分解器: </DIV>
<DIV> </DIV>
<DIV> </DIV>
<DIV>StringTokenizer(String sInput):以空白字符(“
”,“\t”,“\n”)为分隔符分割字符串。 </DIV>
<DIV>StringTokenizer(String sInput, String
sDelimiter):以sDelimiter为分隔符分割字符串。 </DIV>
<DIV>StringTokenizer(String sInput, String sDelimiter, boolean
bReturnTokens):以sDelimiter为分隔符分割字符串,但如果bReturnTokens为true,则分隔符也作为标记返回。
</DIV>
<DIV> 第一个构造函数不检查输入字符串是否包含子串。例如,如果以空白字符为分隔符分割“hello. Today \"I
am \" going to my home
town”,则字符串分解结果是hello.、Today、"I、am、"、going等,而不是hello.、Today、"I
am "、going等。 </DIV>
<DIV> </DIV>
<DIV> 第二个构造函数不检查两个分隔符连续出现的情况。例如,如果以“,”为分隔符分割“book, author,
publication,,,date
published”这个字符串,则StringTokenizer返回book、author、publication和date
published这四个标记,而不是book、author、publication、""、""和date
published这6个标记(其中""表示0长度字符串)。要得到6个标记的答案,你必须把StringTokenizer的bReturnTokens参数设置为true。
</DIV>
<DIV> </DIV>
<DIV> 允许设置值为true的bReturnTokens参数是一个重要的功能,因为它考虑到了分隔符连续出现的情况。例如,使用第二个构造函数时,如果数据是动态收集得到而且要用来更新数据库中的表,输入字符串中的标记对应着表里面列的值,那么当我们不能确定哪一个列应该设置为""时,我们就无法把输入串中的标记映射到数据库列。假设我们要把记录插入到一个有6个列的表,而输入数据中包含两个连续的分隔符。此时,StringTokenizer的分解结果是5个标记(两个连续的分隔符代表""标记,它将被StringTokenizer忽略),而我们却有6个字段需要设置。同时,我们也不知道连续分隔符在哪里出现,所以也就不知道哪一个列应该设置成""。
</DIV>
<DIV> </DIV>
<DIV> 当标记本身等同于分隔符(无论是长度还是值)且位于子串之内时,第三个构造函数无效。例如,如果我们要以“,”为分隔符分解字符串“book,
author, publication,\",\",date
published”(这个字符串包含一个“,”标记,它与分隔符一样),结果是book、author、publication、"、"、date
published这六个标记,而不是book、author、publication、,(逗号字符)、date
published这五个标记。再提醒一下,即使我们把StringTokenizer的bReturnTokens参数设置设置成了true,在这种情况下也没有什么帮助。
</DIV>
<DIV> </DIV>
<DIV>三、高级字符串分解器 </DIV>
<DIV> </DIV>
<DIV> 在编写代码之前,你必须搞清楚一个好的分解器有哪些基本要求。因为Java开发者已经习惯于使用StringTokenizer类,所以一个好的分解器应该提供StringTokenizer类提供的所有实用方法,比如hasMoreTokens()、nextToken()、countTokens()。
</DIV>
<DIV> </DIV>
<DIV> 本文提供的代码很简单,而且大部分代码足以自我解释。在这里,我主要利用了StringTokenizer类(创建类实例时bReturnTokens参数设置为true),并提供了上面提到的几个方法。大多数时候标记与分隔符不同,有些时候分隔符却要作为标记输出(尽管非常罕见),此时如果出现了对标记的请求,分解器要把分隔符作为标记输出。创建PowerfulTokenizer对象时,你只需要提供输入字符串和分隔符这两个参数,PowerfulTokenizer将在内部使用bReturnTokens设置成true的StringTokenizer。(这么做的原因在于,如果不是用bReturnTokens设置成true的方式创建StringTokenizer,那么它将在解决先前提出的问题时受到限制)。为了正确地控制分解器,代码在几个地方(计算标记的总数量以及nextToken())检查bReturnTokens是否设置成了true。
</DIV>
<DIV> </DIV>
<DIV> 你可能已经发现,PowerfulTokenizer实现了Enumeration接口,从而也就实现了hasMoreElements()和nextElement()这两个方法,而这两个方法又分别把调用直接委托给hasMoreTokens()和nextToken()。(由于实现了Enumeration接口,PowerfulTokenizer实现了与StringTokenizer的向后兼容。)
</DIV>
<DIV> </DIV>
<DIV> 我们来看一个例子,假设输入字符串是“hello, Today,,, \"I, am \", going
⌨️ 快捷键说明
复制代码Ctrl + C
搜索代码Ctrl + F
全屏模式F11
增大字号Ctrl + =
减小字号Ctrl + -
显示快捷键?