基于Python编写一个简单的http服务器
本篇文章的python版本为:
什么是http
http是一个应用层协议,准确的来说是基于TCP/IP4层网络协议中的传输层中的TCP应用层协议。
额,4层模型大概是这样的:
在网络通信中,用户的数据是以报文来传输的,但是在实际通信中,每一层都会对包进行封装,从而形成段、数数据报、帧,最后是以比特流(二进制)进行传输,到了目标主机后,会对每一层又进行拆解,从而得到最后的报文。
http就在最上层,就是应用层那里。
http到底离我们多近呢? 甚至于你现在看到的文章,使用的就是http协议,它还有一个名字,叫做超文本传输协议,为什么叫超文本呢? 因为最开始的是时候,http是被用来传输Hypertext文档的,所以被叫做超文本协议,当然现在可以传输其他类型的数据,如: 视频、音频、图片等,但是它依然被称之为超文本协议。
很难理解吧,没关系,继续往下看。
分析http请求报文和响应报文格式
通过上面的简介,我们知道http是应用层协议,它在网络协议中,是被称之为报文的,让我们来看一下http的请求报文 和 响应报文吧。
http报文由4部分组成,分别是起始行、首部行、空白行 以及 实体组成。以\r\n(也称之为CRLF)进行分割。
让我们来看一下实际的报文呢。
在linux中,我们可以使用curl -v 网址来打印详细的请求信息,其中就包括了报文。
命令:
curl -v http://juejin.cn
请求信息:
其中输出的结果中> 代表我们发出的报文,而< 代表服务器发送给我们的响应信息。下面我们将结合报文来看上面的数据信息。
请求报文格式如下:
其中请求行会指定http的请求方法,如: GET、POST、HEAD等, URL则是请求的文件路径,协议版本需要指定http的版本,最后是以CRLF结束。
首部行可以有多个,以 (字段名: 值) 的方式出现,每一个首部行同样是以CRLF结束。
而后是空行。空行则代表http报文头结束了,接下来该是发送的报文主体了,接下来,我们将上述请求http://juejin.cn的例子,填入表格来看下:
上述是我们使用curl工具请求的http://juejin.cn请求报文整体形式,我们可以看到,我们使用了GET方法,获取服务器的/信息,使用的协议是HTTP/1.1,而后携带了3个首部行,分别是User-Agent、Host以及Accept。
响应报文格式如下:
将响应报文和请求报文进行对比,我们不难发现,除了第一行以外,其他的格式都是一样的,所以,我们仅介绍响应行的信息,在响应报行中,第一个是协议的版本,这个是服务器的协议版本,而后便是状态码,用于告知客户端,服务器响应的信息,最后是短语,短语的作用是告知使用者,这个返回信息大概是什么意思。
好了,我们将上述juejin.cn响应给我们的报文,我们填到表格中呢:
上述是我们使用curl请求http://juejin.cn/,服务器返回的信息,我们逐行来看下,响应行,告知了我们http版本是HTTP/1.1,状态码是301,短语是 链接被转移了。
上述我们若仅通过状态码的话,是很难get到整个报文的意思的,不过有短语,就可以猜一下了。
首部行,告知了我们服务器 、时间 、 报文类型 以及 报文长度。还记得我们第一段落介绍过得,http现在除了发送超文本以外,还可以发送图片、视频等,就是通过首部行Content-Type来确定的。
接着是空白行,最后是报文主体,哎,有没有感觉奇怪呢?为什么请求报文主体是空的呢?这是因为报文主体长度是由首部行Content-Length来定义的,如上报文展示的是,我们报文主体有262个字符。
手写一个简单的http服务器
上述,我们介绍了,什么是http以及初略的看了一下 http的请求报文和响应报文,那么,我们如何构建一个http服务器呢?
我们知道,http是应用层协议,是基于传输层tcp来实现的,所以,我们若想构建一个http服务器,那么应该写一个socket程序出来吧。
import socket import threading def handle(client , addr): print("from " , addr) data = client.recv(1024) for k,v in enumerate(data.decode().split("\r\n")): print(k ,v) def main(): s = socket.socket(socket.AF_INET,socket.SOCK_STREAM) s.bind(("127.0.0.1",8080)) s.listen() while True: client , addr = s.accept() t = threading.Thread(target=handle,args=(client,addr)) t.start() if __name__ == '__main__' main()
上述,我们写了一个tcp程序,它将监听本地回环地址的8080端口,若此时我们使用curl -v 127.0.0.1:8080请求一下该接口,我们将会得到请求报文了,如下:
我们得到请求报文后,可以构建一个响应报文发送回去,例如: Hello, Destined Person.,我们就可以这样来构建http 请求报文信息:
import socket import threading def handle(client , addr): print("from " , addr) data = client.recv(1024) #请求报文 for k,v in enumerate(data. decode() .split("\r\n")): print(k ,v) bodyText = "He1lo,Destined Person." #响应报文 #响应行 client.send(b"HTTP/1.1 200 OK\r\n") #首部行 client. send(b"Server: pdudo_web_sites\r\n") client. send(b"Content-Type: text/html\r\n") client. send(("Content-Length: %s\r\n" % (len(bodyText) + 2)).encode()) client. send(b"\r\n") client. send(("%s\r\n" %(bodyText)).encode()) def main(): try: s = socket.socket(socket.AF_INET,socket.SOCK_STREAM) s .bind(("127.0.0.1"8080)) s .listen() while True: client,addr = s.accept() t = threading.Thread(target=handle,args=(client,addr)) t.start() finally: s.close() if __name__ == '__main__': main()
最后我们使用curl再来测试一下,是可以得到消息的。
总结
该篇文章,我们仅介绍了什么是http,http的请求报文以及响应报文,最后我们使用python,创建了一个tcp服务器来发送响应客户的响应报文。总体而言,http的报文还是非常简单的。我们只是写了一个非常简单的http服务器,其实在python中,web是有一个标准的,它称之为WSGI,哎,扯远了。
关于基于Python编写一个简单的http服务器的文章就介绍至此,更多相关Python http服务器内容请搜索编程宝库以前的文章,希望以后支持编程宝库!
文本特征提取作用:对文本数据进行特征化(句子、短语、单词、字母)一般选用单词作为特征值方法一:CountVectorizersklearn.feature_extraction ...