新建文本文档.txt

来自「提取HTML代码中文字的C#函数在做一些网站（特别是bbs之类）时」· 文本代码 · 共 71 行

TXT

71 行

提取HTML代码中文字的C#函数 
评论(0)发表时间：2006年12月21日 14时3分  
  
[%repeat_0 match="/data/option"%] [%=@title%] [%=@count%]票 [[%=@percent%]％]  
[%_repeat_0%]  
  
  
提取HTML代码中文字的C#函数  
-------------------------------------------------------------------------------- 
  
  /// <summary> 
  /// 去除HTML标记 
  /// </summary> 
  /// <param name="strHtml">包括HTML的源码 </param> 
  /// <returns>已经去除后的文字</returns> 
  public static string StripHTML(string strHtml) 
  { 
   string [] aryReg ={ 
          @"<script[^>]*?>.*?</script>", 

          @"<(\/\s*)?!?((\w+:)?\w+)(\w+(\s*=?\s*(([""'])(\\[""'tbnr]|[^\7])*?\7|\w+)|.{0})|\s)*?(\/\s*)?>", 
          @"([\r\n])[\s]+", 
          @"&(quot|#34);", 
          @"&(amp|#38);", 
          @"&(lt|#60);", 
          @"&(gt|#62);",  
          @"&(nbsp|#160);",  
          @"&(iexcl|#161);", 
          @"&(cent|#162);", 
          @"&(pound|#163);", 
          @"&(copy|#169);", 
          @"&#(\d+);", 
          @"-->", 
          @"<!--.*\n" 
          
         }; 

   string [] aryRep = { 
           "", 
           "", 
           "", 
           "\"", 
           "&", 
           "<", 
           ">", 
           " ", 
           "\xa1",//chr(161), 
           "\xa2",//chr(162), 
           "\xa3",//chr(163), 
           "\xa9",//chr(169), 
           "", 
           "\r\n", 
           "" 
          }; 

   string newReg =aryReg[0]; 
   string strOutput=strHtml; 
   for(int i = 0;i<aryReg.Length;i++) 
   { 
    Regex regex = new Regex(aryReg[i],RegexOptions.IgnoreCase ); 
    strOutput = regex.Replace(strOutput,aryRep[i]); 
   } 

   strOutput.Replace("<",""); 
   strOutput.Replace(">",""); 
   strOutput.Replace("\r\n",""); 


   return strOutput; 
  }

新建文本文档.txt - 源码说明

本页面展示了「提取HTML代码中文字的C#函数在做一些网站（特别是bbs之类）时」中的新建文本文档.txt 源码文件，采用文本编程语言编写，共 71 行代码。您可以在线阅读完整代码内容，也可以返回资源详情页下载完整源码包进行本地学习和开发。

虫虫下载站收录了大量与HTML相关的技术资源，包括源代码、技术文档、电路图等，是电子工程师和嵌入式开发者的专业学习平台。

⌨️ 快捷键说明

复制代码Ctrl + C

搜索代码Ctrl + F

全屏模式F11

增大字号Ctrl + =

减小字号Ctrl + -

显示快捷键?

新建 文本文档.txt

新建 文本文档.txt - 源码说明

⌨️ 快捷键说明

新建文本文档.txt

新建文本文档.txt - 源码说明