Socket 套接字:通訊端點 簡介
socket起源于Unix,而Unix/Linux基本哲學(xué)之一就是“一切皆文件”,對于文件用【打開】【讀寫】【關(guān)閉】模式來操作。socket就是該模式的一個實現(xiàn),socket即是一種特殊的文件,一些socket函數(shù)就是對其進(jìn)行的操作(讀/寫IO、打開、關(guān)閉)。
Socket 是任何一種計算機(jī)網(wǎng)絡(luò)通訊中最基礎(chǔ)的內(nèi)容。Socket通訊一般用戶C/S結(jié)構(gòu)系統(tǒng)的網(wǎng)絡(luò)通訊。
Socket 網(wǎng)絡(luò)通訊是基于TCP(傳輸控制協(xié)議)或UDP(用戶數(shù)據(jù)報協(xié)議)兩種協(xié)議通訊,所以有 面向連接(TCP )與無連接(UDP ) 兩種通訊方式。
Python 要創(chuàng)建TCP 套接字就得在創(chuàng)建的時候,指定套接字類型為SOCK_STREAM,它使用 TCP/IP通訊協(xié)議。
socket庫提供了一個底層C API,可以使用BSD套接字接口實現(xiàn)網(wǎng)絡(luò)通信。它包括socket類,用于處理具體的數(shù)據(jù)通道,還包括用來完成網(wǎng)絡(luò)相關(guān)任務(wù)的函數(shù),如將一個服務(wù)器名轉(zhuǎn)換為一個地址以及格式化數(shù)據(jù)以便在網(wǎng)絡(luò)上發(fā)送。
套接字是程序在本地或者通過互聯(lián)網(wǎng)來回傳遞數(shù)據(jù)時所用通信通道的一個端點。
套接字有2個主要屬性用于控制如何發(fā)送數(shù)據(jù):地址簇(address family)控制所用的OSI網(wǎng)絡(luò)層協(xié)議;套接字類型(socket type)控制傳輸層協(xié)議。(參考《計算機(jī)網(wǎng)絡(luò)》7層協(xié)議)
Python支持3個地址簇:
套接字類型有兩種:
大多數(shù)應(yīng)用協(xié)議(如HTTP)都建立在TCP基礎(chǔ)上,因為這樣更容易創(chuàng)建自動處理消息排序和傳送的復(fù)雜應(yīng)用。
UDP通常用于順序不太重要的協(xié)議(如DNS交換)。UDP與TCP都支持IPv4與IPv6。
socket庫包含一些與網(wǎng)絡(luò)上的域名服務(wù)交互的函數(shù),比如解析域名為IP地址可以用到gethostbyname_ex(),示例如下:
import socket host_str = [ 'www.baidu.com', 'cloud.tencent.com', 'www.csdn.net' ] for host in host_str: try: name, aliases, addresses = socket.gethostbyname_ex(host) print(host) print("主機(jī)名:", name) print("所有別名:", aliases) print("所有可用IP地址:", addresses) except socket.error as msg: print(host, msg)
運行之后,效果如下:
gethostbyname_ex:該函數(shù)返回3個參數(shù),主機(jī)名,別名,以及解析能跳轉(zhuǎn)到當(dāng)前主機(jī)的IP地址。
gethostbyname:類似的函數(shù),只返回當(dāng)前主機(jī)的IP地址。
socket庫提供getservbyname()函數(shù)用于查找網(wǎng)絡(luò)服務(wù)的端口號和標(biāo)準(zhǔn)名,示例如下所示:
import socket from urllib.parse import urlparse url_str = [ 'https://www.baidu.com', 'https://www.csdn.net', 'smtp://smtp.qq.com', ] for url in url_str: try: parsed_url = urlparse(url) port = socket.getservbyname(parsed_url.scheme) print(url) print("端口號:", port) except socket.error as msg: print(url, msg)
運行之后,效果如下:
當(dāng)然,其實最有用的并不是給定一個鏈接去查詢端口號,而是逆向操作。(因為標(biāo)準(zhǔn)化服務(wù)端口號一般都是固定的)
socket庫提供getservbyport()函數(shù)用于完成逆向的服務(wù)端口查找,示例代碼如下所示:
import socket url = '{}://smtp.qq.com'.format(socket.getservbyport(25)) print(url)
運行之后,效果如下:
socket庫還可以使用getprotobyname()函數(shù)獲取分配給一個傳輸協(xié)議的端口號,示例如下:
import socket #獲取匹配開頭字符串的所有屬性值 def getConstants(prefix): return { getattr(socket, n): n for n in dir(socket) if n.startswith(prefix) } ipproto_str = getConstants("IPPROTO_") for agree in ['tcp', 'udp']: num = socket.getprotobyname(agree) name = ipproto_str[num] print(name, num)
運行之后,效果如下:
對于協(xié)議碼,在程序定義中一般都是標(biāo)準(zhǔn)化常量,這就是意味著,它們的常量名都有一定的規(guī)律,而socket協(xié)議碼前綴是IPPROTO_。
getaddrinfo()函數(shù)用于將一個服務(wù)的基本地址轉(zhuǎn)換為一個元組列表,其中包含建立一個連接所需要的全部信息。比如其網(wǎng)絡(luò)簇與協(xié)議等,示例如下:
import socket # 獲取匹配開頭字符串的所有屬性值 def getConstants(prefix): return { getattr(socket, n): n for n in dir(socket) if n.startswith(prefix) } ipproto_str = getConstants("IPPROTO_") family_str = getConstants("AF_") type_str = getConstants("SOCK_") for response in socket.getaddrinfo('www.csdn.net', 'http', family=socket.AF_INET, type=socket.SOCK_STREAM, proto=socket.IPPROTO_TCP, flags=socket.AI_CANONNAME): family, socktype, ipproto, canonname, sockaddr = response print("地址簇: ", family_str[family]) print("套接字類型: ", type_str[socktype]) print("協(xié)議碼: ", ipproto_str[ipproto]) print("主機(jī)規(guī)范名: ", canonname) print("ip地址與端口號:", sockaddr)
運行之后,效果如下:
這里如果只用socket.getaddrinfo(‘www.csdn.net', ‘http'),表示不需要過濾任何連接信息,但大型的網(wǎng)站一般都有幾個IP或者域名跳轉(zhuǎn)到主頁的。
所以通過后面的參數(shù),可以篩選自己需要的鏈接信息。
其中,最后一個參數(shù)socket.AI_CANONNAME表示如果主機(jī)有別名,那么結(jié)果中會包含服務(wù)器的標(biāo)準(zhǔn)名。所有沒有這個標(biāo)志,標(biāo)準(zhǔn)名為空。
如果讀者有C的經(jīng)驗,那么肯定知道,通過C語言編寫的套接字程序是使用struct sockaddr結(jié)構(gòu)體,它將IP地址表示為二進(jìn)制,而不是上面顯示的Python字符串形式。
如果想在Python和C之間轉(zhuǎn)換IPv4地址,可以使用inet_aton()和inet_ntoa()。示例如下:
import socket import binascii ip_list = [ "192.168.50.1", "127.0.0.1" ] for ip in ip_list: packed = socket.inet_aton(ip) print("原始字符串ip地址:", ip) print("C庫能識別的ip地址", binascii.hexlify(packed)) print("還原C庫ip地址字符串", socket.inet_ntoa(packed)) print()
運行之后,效果如下:
相信讀者如果在測試上面代碼,那么輸入上面inet_aton()函數(shù)時,一定看到提醒中還有inet_pton()與inet_ntop()函數(shù)。
這2個函數(shù)既能處理IPv4也能處理IPv6,而inet_aton()和inet_ntoa()只能處理IPv4。它們的使用方式如下:
import socket import binascii ipv6_str = "2001:0db8:3c4d:0015:0000:0000:1a2f:1a2b" packed = socket.inet_pton(socket.AF_INET6, ipv6_str) print("原始字符串ip地址:", ipv6_str) print("C庫能識別的ip地址", binascii.hexlify(packed)) print("還原C庫ip地址字符串", socket.inet_ntop(socket.AF_INET6, packed)) print() ipv4_str = "192.168.50.1" packed = socket.inet_pton(socket.AF_INET, ipv4_str) print("原始字符串ip地址:", ipv4_str) print("C庫能識別的ip地址", binascii.hexlify(packed)) print("還原C庫ip地址字符串", socket.inet_ntop(socket.AF_INET, packed)) print()
運行之后,效果如下:
以上就是Python實現(xiàn)socket庫網(wǎng)絡(luò)通信套接字的詳細(xì)內(nèi)容,更多關(guān)于Python socket庫的資料請關(guān)注腳本之家其它相關(guān)文章!
標(biāo)簽:云南 龍巖 酒泉 寧夏 金融催收 定西 江蘇 商丘
巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《Python實現(xiàn)socket庫網(wǎng)絡(luò)通信套接字》,本文關(guān)鍵詞 Python,實現(xiàn),socket,庫,網(wǎng)絡(luò)通信,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。