什么是Socket?
socket本质上就是在2台网络互通的电脑之间,架设一个通道,两台电脑通过这个通道来实现数据的互相传递。 我们知道网络 通信 都 是基于 ip+port 方能定位到目标的具体机器上的具体服务,操作系统有0-65535个端口,每个端口都可以独立对外提供服务,如果 把一个公司比做一台电脑 ,那公司的总机号码就相当于ip地址, 每个员工的分机号就相当于端口, 你想找公司某个人,必须 先打电话到总机,然后再转分机 。
建立一个socket必须至少有2端, 一个服务端,一个客户端, 服务端被动等待并接收请求,客户端主动发起请求, 连接建立之后,双方可以互发数据。
网络套接字是跨计算机网络连接的端点。今天,大多数计算机之间的通信都基于Internet协议;因此,大多数网络套接字都是Internet套接字。更准确地说,套接字是一个句柄(抽象引用),本地程序可以将其传递到网络应用程序编程接口(API)以使用连接,例如“在这个套接字上发送此数据”。套接字内部通常是简单的整数,用来标识要使用的连接。
例如,要通过TCP将“Hello, world!”发送到地址为1.2.3.4的主机端口80,可以获取一个套接字,连接到远程主机,发送字符串,然后关闭套接字:
Socket socket = getSocket(type = "TCP")connect(socket, address = "1.2.3.4", port = "80")send(socket, "Hello, world!")close(socket)
套接字API是应用程序编程接口(API),通常由操作系统提供,允许应用程序控制和使用网络套接字。Internet套接字api通常基于Berkeley sockets标准。在Berkeley套接字标准中,套接字是文件描述符(文件句柄)的一种形式,因为Unix的哲学是“一切都是文件”,套接字和文件之间的类比是:您可以读取、写入、打开和关闭这两个文件。在实践中,这些差异意味着这个类比是紧张的,相反,一个人会在一个套接字上使用不同的接口(发送和接收)。在进程间通信中,每个端通常都有自己的套接字,但是这些接口可能使用不同的api:它们被网络协议抽象出来。
一个套接字地址是一个IP地址和一个端口号的组合,就像电话连接的一端是一个电话号码和一个特定的扩展的组合。套接字不需要有地址(例如仅用于发送数据),但是如果程序将套接字绑定到一个地址,套接字可以用来接收发送到该地址的数据。基于此地址,internet套接字将传入的数据包发送到适当的应用程序进程或线程。
Socket Families(地址簇)
socket.AF_UNIX unix本机进程间通信
socket.AF_INET IPV4
socket.AF_INET6 IPV6
这些常量表示用于套接字()的第一个参数的地址(和协议)族。如果没有定义AF_UNIX常量,那么该协议就不受支持。根据系统的不同,可能会有更多的常量可用。
Socket Types
socket.SOCK_STREAM #for tcp
socket.SOCK_DGRAM #for udp
socket.SOCK_RAW #原始套接字,普通的套接字无法处理ICMP、IGMP等网络报文,而SOCK_RAW可以;其次,SOCK_RAW也可以处理特殊的IPv4报文;此外,利用原始套接字,可以通过IP_HDRINCL套接字选项由用户构造IP头。
socket.SOCK_RDM #是一种可靠的UDP形式,即保证交付数据报但不保证顺序。SOCK_RAM用来提供对原始协议的低级访问,在需要执行某些特殊操作时使用,如发送ICMP报文。SOCK_RAM通常仅限于高级用户或管理员运行的程序使用。
socket.SOCK_SEQPACKET #废弃了
这些常量表示套接字类型,用于套接字()的第二个参数。根据系统的不同,可能会有更多的常量可用。(只有SOCK_STREAM和SOCK_DGRAM通常是有用的。)
Socket 方法
socket.socket(family=AF_INET, type=SOCK_STREAM, proto=0, fileno=None)
使用给定的地址族、套接字类型和协议号创建一个新的套接字。地址族应该是AF_INET(默认)、AF_INET6、AF_UNIX、AF_CAN或AF_RDS。套接字类型应该是beSOCK_STREAM(默认)、SOCK_DGRAM、SOCK_RAW或其他SOCK_常量之一。协议号通常为零,可以省略,或者在地址族为AF_CAN的情况下,协议应该是CAN_RAW或CAN_BCM。如果指定了fileno,则忽略其他参数,从而导致带有指定文件描述符的套接字返回。与socket.fromfd()不同,fileno将返回相同的套接字,而不是重复的套接字。这可能有助于使用socket.close()关闭分离的套接字。
socket.socketpair([family[, type[, proto]]])
使用给定的地址家族、套接字类型和协议编号构建一对连接的套接字对象。地址族、套接字类型和协议号与上面的套接字()函数相同。如果在平台上定义,默认的族是AF_UNIX;否则,默认是AF_INET。
socket.create_connection(address[, timeout[, source_address]])
连接到监听Internet地址(一个2元组(主机,端口))的TCP服务,并返回套接字对象。这是一个比socket.connect()更高级别的函数:如果主机是一个非数字主机名,它将尝试为AF_INET和AF_INET6解析它,然后尝试依次连接到所有可能的地址,直到连接成功。这使得编写与IPv4和IPv6兼容的客户机变得很容易。
传递可选的超时参数将在尝试连接之前设置套接字实例的超时。如果没有提供超时,则使用getdefaulttimeout()返回的全局默认超时设置。
如果提供了source_address,那么在连接之前,套接字必须是一个2元组(主机、端口)来绑定到它的源地址。如果主机或端口分别为“或0”,则将使用OS默认行为。socket.getaddrinfo(host, port, family=0, type=0, proto=0, flags=0) #获取要连接的对端主机地址
sk.bind(address)
s.bind(address) 将套接字绑定到地址。address地址的格式取决于地址族。在AF_INET下,以元组(host,port)的形式表示地址。
sk.listen(backlog)
开始监听传入连接。backlog指定在拒绝连接之前,可以挂起的最大连接数量。
backlog等于5,表示内核已经接到了连接请求,但服务器还没有调用accept进行处理的连接个数最大为5
这个值不能无限大,因为要在内核中维护连接队列sk.setblocking(bool)
是否阻塞(默认True),如果设置False,那么accept和recv时一旦无数据,则报错。
sk.accept()
接受连接并返回(conn,address),其中conn是新的套接字对象,可以用来接收和发送数据。address是连接客户端的地址。
接收TCP 客户的连接(阻塞式)等待连接的到来
sk.connect(address)
连接到address处的套接字。一般,address的格式为元组(hostname,port),如果连接出错,返回socket.error错误。
sk.connect_ex(address)
同上,只不过会有返回值,连接成功时返回 0 ,连接失败时候返回编码,例如:10061
sk.close()
关闭套接字
sk.recv(bufsize[,flag])
接受套接字的数据。数据以字符串形式返回,bufsize指定最多可以接收的数量。flag提供有关消息的其他信息,通常可以忽略。
sk.recvfrom(bufsize[.flag])
与recv()类似,但返回值是(data,address)。其中data是包含接收数据的字符串,address是发送数据的套接字地址。
sk.send(string[,flag])
将string中的数据发送到连接的套接字。返回值是要发送的字节数量,该数量可能小于string的字节大小。即:可能未将指定内容全部发送。
sk.sendall(string[,flag])
将string中的数据发送到连接的套接字,但在返回之前会尝试发送所有数据。成功返回None,失败则抛出异常。
内部通过递归调用send,将所有内容发送出去。
sk.sendto(string[,flag],address)
将数据发送到套接字,address是形式为(ipaddr,port)的元组,指定远程地址。返回值是发送的字节数。该函数主要用于UDP协议。
sk.settimeout(timeout)
设置套接字操作的超时期,timeout是一个浮点数,单位是秒。值为None表示没有超时期。一般,超时期应该在刚创建套接字时设置,因为它们可能用于连接的操作(如 client 连接最多等待5s )
sk.getpeername()
返回连接套接字的远程地址。返回值通常是元组(ipaddr,port)。
sk.getsockname()
返回套接字自己的地址。通常是一个元组(ipaddr,port)
sk.fileno()
套接字的文件描述符
socket.sendfile(file, offset=0, count=None)
发送文件 ,但目前多数情况下并无什么卵用。
下面的程序实现了简单的发送和接收(发送的是英文):
## 客户端 ##import socketclient = socket.socket() # 生命socket类型 同时 生成socket连接对相client.connect(('HW-20180425SPSL',6969)) # 连接6969端口client.send(b"word") # 发送worddata = client.recv(1024) #print(data)client.close()## 服务端 ##import socketserver = socket.socket()server.bind(("HW-20180425SPSL",6969)) # 绑定要监听的端口server.listen() # 监听print("我要开始时等电话!")conn,addr = server.accept() # 等电话打进来# conn 客户端连过来而在服务器端为其生成的连接实例print(conn,addr)print("电话来了!")data = conn.recv(1024)print(data)conn.send(data.upper())server.close()
若想发送中文,该怎么发送呢?
## 客户端 ##import socketclient = socket.socket() # 生命socket类型 同时 生成socket连接对相client.connect(('HW-20180425SPSL',6969)) # 连接6969端口# client.send(b"word") # 发送wordclient.send("我要发送中文!".encode("utf-8"))data = client.recv(1024) #print(data.decode())client.close()## 服务端 ##import socketserver = socket.socket()server.bind(("HW-20180425SPSL",6969)) # 绑定要监听的端口server.listen() # 监听print("我要开始时等电话!")conn,addr = server.accept() # 等电话打进来# conn 客户端连过来而在服务器端为其生成的连接实例print(conn,addr)print("电话来了!")data = conn.recv(1024)print(data.decode())conn.send(data.upper())server.close()
现在只是发一次收一次,那么我想发多少就发多少,同时发多少就能接收多少,那么该怎么实现呢?
## 客户端 ##import socketclient = socket.socket() # 生命socket类型 同时 生成socket连接# 对相client.connect(('HW-20180425SPSL',6969)) # 连接6969端口while True: msg = input(">>:").strip() client.send(msg.encode("utf-8")) data = client.recv(1024) # print(data.decode())client.close()## 服务端 ##import socketserver = socket.socket()server.bind(("HW-20180425SPSL",6969)) # 绑定要监听的端口server.listen(5) # 监听 最大允许多少监听print("我要开始时等电话!")while True: # 大循环 conn, addr = server.accept() # 等电话打进来 # conn 客户端连过来而在服务器端为其生成的连接实例 print(conn, addr) print("电话来了!") counnt = 0 while True: # 这个循环 是为了 和客户端 不断的接收 data = conn.recv(1024) print(data.decode()) if not data: print("client has lost....") break conn.send(data.upper()) counnt += 1 if counnt > 10 : breakserver.close()
结果显示:
客户端:
服务端: