📄 cc.txt

📁 http server实现原理,核心算法,测试过程,测试结果等内容附源代码
💻 TXT
字号:
网络:
     
    http://doc.chinahtml.com/Manual/ApacheManual/
    http://blog.csdn.net/bjbs_270/archive/2004/11/05/168155.aspx
    http://www.myfaq.com.cn/Net/xieyi/
导引:

    http://www.linuxdiyf.com/bbs/redirect.php?fid=9&tid=1137&goto=nextnewset
 
    编制一个HTTP Server,语言不限. 
    
    要求: 提交报告,包括实现原理,核心算法,测试过程,测试结果等内容;附源代码;

    9月底前交.
   
http.cs 
---------------------------- 
using System; 
using System.Collections; 
using System.IO; 
using System.Net; 
using System.Net.Sockets; 
using System.Threading; 

class HttpProcessor { 
private Socket s; 
private BufferedStream bs; 
private StreamReader sr; 
private StreamWriter sw; 
private String method; 
private String url; 
private String protocol; 
private Hashtable hashTable; 

public HttpProcessor(Socket s) { 
this.s = s; 
hashTable = new Hashtable(); 
} 

public void process() { 
NetworkStream ns = new NetworkStream(s, FileAccess.ReadWrite); 
bs = new BufferedStream(ns); 
sr = new StreamReader(bs); 
sw = new StreamWriter(bs); 
parseRequest(); 
readHeaders(); 
writeURL(); 
s.Shutdown(SocketShutdown.SdBoth); 
ns.Close(); 
} 

public void parseRequest() { 
String request = sr.ReadLine(); 
string[] tokens = request.Split(new char[]{'' ''}); 
method = tokens[0]; 
url = tokens[1]; 
protocol = tokens[2]; 
} 

public void readHeaders() { 
String line; 
while((line = sr.ReadLine()) != null && line != "") { 
string[] tokens = line.Split(new char[]{'':''}); 
String name = tokens[0]; 
String value = ""; 
for(int i = 1; i < tokens.Length; i++) { 
value += tokens[i]; 
if(i < tokens.Length - 1) tokens[i] += ":"; 
} 
hashTable[name] = value; 
} 
} 

public void writeURL() { 
try { 
FileStream fs = new FileStream(url.Substring(1), FileMode.Open, FileAccess.Read); 
writeSuccess(); 
BufferedStream bs2 = new BufferedStream(fs); 
byte[] bytes = new byte[4096]; 
int read; 
while((read = bs2.Read(bytes, 0, bytes.Length)) != 0) { 
bs.Write(bytes, 0, read); 
} 
bs2.Close(); 
} catch(FileNotFoundException) { 
writeFailure(); 
sw.WriteLine("File not found: " + url); 
} 
sw.Flush(); 
} 

public void writeSuccess() { 
sw.WriteLine("HTTP/1.0 200 OK"); 
sw.WriteLine("Connection: close"); 
sw.WriteLine(); 
} 

public void writeFailure() { 
sw.WriteLine("HTTP/1.0 404 File not found"); 
sw.WriteLine("Connection: close"); 
sw.WriteLine(); 
} 
} 

public class HttpServer { 

// ============================================================ 
// Data 

protected int port; 

// ============================================================ 
// Constructor 

public HttpServer() : this(80) { 
} 

public HttpServer(int port) { 
this.port = port; 
} 

// ============================================================ 
// Listener 

public void listen() { 
Socket listener = new Socket(0, SocketType.SockStream, ProtocolType.ProtTCP); 
IPAddress ipaddress = new IPAddress("127.0.0.1"); 
IPEndPoint endpoint = new IPEndPoint(ipaddress, port); 
listener.Bind(endpoint); 
listener.Blocking = true; 
listener.Listen(-1); 
while(true) { 
Socket s = listener.Accept(); 
HttpProcessor processor = new HttpProcessor(s); 
Thread thread = new Thread(new ThreadStart(processor.process)); 
thread.Start(); 
} 
} 

// ============================================================ 
// Main 

public static int Main(String[] args) { 
HttpServer httpServer; 
if(args.GetLength(0) > 0) { 
httpServer = new HttpServer(args[0].ToUInt16()); 
} else { 
httpServer = new HttpServer(); 
} 
Thread thread = new Thread(new ThreadStart(httpServer.listen)); 
thread.Start(); 
return 0; 
} 
} 





HTTP 协议的简介 

　　HTTP协议是一种超文本传输协议（Hypertext Transfer Protocol），工作于网络应用层，自1990年起广泛应用于WWW 的全球信息服务，HTTP协议的详细说明可以在网上查阅RFC2518、RFC2616等文档。 


　　HTTP 协议老的标准是HTTP/1.0，目前最通用的标准是HTTP/1.1。HTTP/1.1是在HTTP/1.0基础上的升级，增加了一些功能，全面兼容HTTP/1.0。HTTP/1.0不支持文件断点续传，如果服务器使用HTTP/1.0，“网络蚂蚁”的任何多线程下载程序都只能按单线程下载；好在目前的Web服务器绝大多数都采用了HTTP/1.1，所以，下面将基于HTTP/1.1进行介绍。 

　　HTTP协议的相关重要命令 

　　基于HTTP的浏览器浏览网页、下载文件时，工作原理类似客户机/服务器模式：浏览器向Web服务器发出一个HTTP请求行；Web服务器在收到有效的请求后，返回一个状态行或多个响应标题、一个空白行和相关文档。根据这一工作原理，下载程序必须实现向服务器发送请求和获取服务器响应状态的功能。 

　　1.向服务器发送 GET请求命令 

　　一个HTTP请求由一个请求行、可选数目的请求标题、一个空白行，以及在POST情况下的一些额外的数据组成。请求行的格式是： 

　　请求方法　URI　 HTTP/版本号 

　　GET 命令是浏览器常用的文档请求方法，在程序中间使用 

　　GET　URI　 HTTP/1.1 

　　向Web服务器发送请求行（行号3），Java 代码如下： 


．．．． 
clientSocket = new Socket(host, port);//打开要下载文件服务器的Socket 
outStream = new PrintStream(clientSocket.getOutputStream()); 
．．．． 
outStream.println(“GET”+uri+“ HTTP/1.1”); 
outStream.println(“Host:”+host); 
outStream.println(“Accept:*/* ”); 
outStream.println(“Referer:”); 
outStream.println(); 
．．．． 


　　注：第4行给出URL中的主机名和端口号，第5行说明客户端接收所有MIME类型，第7行方送一个空白行，表明请求行结束。 

　　2.获取服务器响应状态 

　　在发送HTTP请求行以后，程序就可以读取服务器的响应状态了。HTTP响应状态行包括：HTTP 状态码和一些HTTP响应标题。 

　　1) HTTP状态码 

　　HTTP状态码格式是 HTTP/版本信息的数字表示。状态码例子如下： 

　　HTTP/1.0 200 OK // 表示服务器支持HTTP/1.0 协议，成功 

　　HTTP/1.1 200 OK // 表示服务器支持HTTP/1.1 协议，成功 

　　HTTP/1.0 404 Not Found // 表示服务器支持HTTP/1.0 协议，访问文件没有找到 

　　在程序中间，如果读到“HTTP/1.1 200 OK”这样的字符串，表明欲下载文件存在、该服务器支持断点续传，可以使用多线程下载。如果读到“HTTP/1.0 200 OK”这样的字符串，表明欲下载文件存在、但该服务器不支持断点续传，只可以使用单线程下载。 


．．．．． 
while ((line=inStream.readLine()) != null)　//将服务器响应状态读到line 
．．．．．．．． 
if(line.substring(0,7).equals(“HTTP/1.”) )　//判断是否支持HTTP/1.1 
{ if(line.charAt(7)==‘0’) 
{ 
System.out.println(“server use http/1.0”); 
threadcount=1; 
} 
if(!(line.substring(9,12)).equals(“200”)) //判断请求是否成功 
{ System.out.println(“ERROR:”+line); 
return false; 
} 
} 

　　2) 读取重要的响应标题，获得要下载文档的文件长度 

　　如果HTTP状态码表明访问成功，服务器会回送一些标题行，我们最关注的是Content-Length　这一行，比如，如果服务器回送“Content-Length:1000”，表明请求文件的长度是１０００字节，所以读取这一行信息，可以得到文件的长度信息： 


．．．． 
if(line.substring(0,15).equals(“Content-Length:”) ) 
{ filelength=Long.parseLong(line.substring(15).trim()); 
System.out.println(“file length:” +filelength); 
} 
．．．．．． 

　　向服务器发送断点续传请求 

　　如上所述，如果服务器支持HTTP/1.1，再次向服务器发送GET请求： 


．．．．． 
outStream.println(“GET ”+uri+“HTTP/1.1 ”); 
outStream.println(“Host:”+host); 
outStream.println(“Accept:*/* ”); 
outStream.println(“RANGE:bytes=”+(fileblocklength)*thisthreadid+“-”); 
outStream.println(); 
．．．．． 

　　第4行是关键，“RANGE:bytes=”是HTTP/1.1新增内容，HTTP/1.0每次传送文件都是从文件头开始，即０字节处开始，“RANGE:bytes=XXXX”表示要求服务器从文件XXXX字节处开始传送，这就是我们平时所说的断点续传！ 

　　分割文件，多线程下载 

　　使用多线程编程技术，同时启动多个线程，根据线程个数，计算文件分割位置，向服务器发送几个不同的下载断点，同时接受数据并写入文件，就可以实现多线程下载了。 


..... 
raf=new RandomAccessFile(file,“rw”);//以随机存取方式打开文件 
..... 
synchronized(raf) //按同步方式把各个线程得到数据分别写入文件 
{ raf.seek(thisthreadid*(filelength/threadcount)+k*buflength); 
raf.write(readbytes); 
...... 
} 
...... 
////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////
下面是用PHP模拟的POST中的构造Http协议部分
  $request = "POST /happy/member.php HTTP/1.1\r\n";
  $request .= "Pragma: no cache\r\n";
  $request .= "Host: phpx.com\r\n";
  $request .= "User-Agent: " . $_SERVER['HTTP_USER_AGENT'] . "\r\n";
  $request .= "Accept: */*\r\n";
  $request .= "Accept-Language: " . $_SERVER['HTTP_ACCEPT_LANGUAGE'] . "\r\n";
  $request .= "Keep-Alive: 300\r\n";
  $request .= "Connection: keep-alive\r\n";
  $request .= "Cache-Control: max-age=0\r\n";
  $request .= "Content-Type: application/x-www-form-urlencoded\r\n";
  $request .= "Content-Length: $lenght\r\n";
  $request .= "\r\n";
  $request .= $postValues;
＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝
下面是响应成功返回的信息
HTTP/1.1 200 OK
Date: Fri, 05 Nov 2004 01:06:59 GMT
Server: Apache
Set-Cookie: bblastvisit=1099616819; expires=Sat, 05-Nov-2005 01:06:59 GMT; path=/
Set-Cookie: bbuserid=17027; expires=Sat, 05-Nov-2005 01:06:59 GMT; path=/
Set-Cookie: bbpassword=3332def6f45e948bd403276b3b2002d4; expires=Sat, 05-Nov-2005 01:06:59 GMT; path=/
Set-Cookie: sessionhash=53a2b0ee3798fe2ca15342541b62f823; path=/
Content-Length: 3325
Keep-Alive: timeout=5, max=100
Connection: Keep-Alive
Content-Type: text/html; charset=GB2312
..........................................


Trackback: http://tb.blog.csdn.net/TrackBack.aspx?PostId=168155
⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -