第2章 应用层
发表于:2023-08-16 | 分类: 计算机网络
字数统计: 4.2k | 阅读时长: 15分钟 | 阅读量:

In Process

创建一个新的网络应用

编程

  • 在不同的端系统上运行
  • 通过网络基础设施提供的服务,应用进程彼此通信
  • 如Web:
    • Web 服务器软件与浏览器软件通信

网络核心中没有应用层软件

  • 网络核心没有应用层功能
  • 网络应用只在端系统上存在 ,快速网络应用开发和部署

2.1 应用层协议原理

体系结构

客户-服务器(C/S)

C/S

  • 服务器:
    • 一直运行
    • 固定的IP地址和周知的端口号(约定)
    • 扩展性:服务器场
      • 数据中心进行扩展
      • 扩展性差
  • 客户端:
    • 主动与服务器通信
    • 与互联网有间歇性的连接
    • 可能是动态IP地址
    • 不直接与其它客户端通信

对等体(P2P)

P2P

  • (几乎)没有一直运行的服务器
  • 任意端系统之间可以进行通信
  • 每一个节点既是客户端又是服务器
    • 自扩展性:新peer节点带来新的服务能力,当然也带来新的服务请求
  • 参与的主机间歇性连接且可以 改变IP 地址
    • 难以管理
  • 例子: Gnutella,迅雷

C/S和P2P体系结构的混合体

Napster

  • 文件搜索:集中
    • 主机在中心服务器上注册其资源
    • 主机向中心服务器查询资源位置
  • 文件传输:P2P
    • 任意Peer节点之间

即时通信

  • 在线检测:集中
    • 当用户上线时,向中心服务器注册其IP地址
    • 用户与中心服务器联系,以找到其在线好友的位置
  • 两个用户之间聊天:P2P

进程通信

进程:在主机上运行的应用程序

  • 在同一个主机内,使用进程间通信机制通信( 操作系统定义)

  • 不同主机,通过交换报文(Message)来通信

    • 使用OS提供的通信服务
    • 按照应用协议交换报文
      • 借助传输层提供的服务
  • 注意:P2P架构的应用也 有客户端进程和服务器进 程之分

需要解决的问题

问题1:对进程进行编址(addressing)

  • 进程为了接收报文,必须有一个标识 即:SAP(发送也需要标示)
    • 主机:唯一的 32位IP地址
      • 仅仅有IP地址不能够唯一标示一个进程;在一台端系统上有很 多应用进程在运行
    • 所采用的传输层协议:TCP or UDP
    • 端口号(Port Numbers)
  • 一些知名端口号的例子:
    • HTTP: TCP 80 Mail: TCP25 ftp:TCP 2
  • 一个进程:用 IP+port 标示 端节点
  • 本质上,一对主机进程之间的通信由2个端节点构 成

问题2:传输层提供的服务

需要穿过层间的信息

  • 层间接口必须要携带的信息
    • 要传输的报文(对于本层来说:SDU)
    • 谁传的:对方的应用进程的标示:IP+TCP(UDP) 端口
    • 传给谁:对方的应用进程的标示:对方的IP+TCP(UDP)端口号
  • 传输层实体(tcp或者udp实体)根据这些信息进行TCP 报文段(UDP数据报)的封装
    • 源端口号,目标端口号,数据等
    • 将IP地址往下交IP实体,用于封装IP数据报:源IP,目标IP

层间信息的代表

  • 如果Socket API 每次传输报文,都携带如此多 的信息,太繁琐易错,不便于管理
  • 用个代号标示通信的双方或者单方:socket
  • 就像OS打开文件返回的句柄一样
    • 对句柄的操作,就是对文件的操作
  • TCP socket:
    • TCP服务,两个进程之间的通信需要之前要建立连接
      • 两个进程通信会持续一段时间,通信关系稳定
    • 可以用一个整数表示两个应用实体之间的通信关系 ,本地标示
    • 穿过层间接口的信息量最小
    • TCP socket:源IP,源端口,目标IP,目标IP,目标 端口

TCP之上的套接字(socket)

  • 对于使用面向连接服务(TCP)的应用而言,套接字是4元组的一个具有本地意义的标示
    • 4元组:(源IP,源port,目标IP,目标port)
    • 唯一的指定了一个会话(2个进程之间的会话关系)
    • 应用使用这个标示,与远程的应用进程通信
    • 不必在每一个报文的发送都要指定这4元组  就像使用操作系统打开一个文件,OS返回一个文件句 柄一样,以后使用这个文件句柄,而不是使用这个文件 的目录名、文件名
    • 简单,便于管理

image-20230821123908882

传输过程

除了TCP,还有UDP

UDP socket:

  • UDP服务,两个进程之间的通信需要之前无需建立连接
    • 每个报文都是独立传输的
    • 前后报文可能给不同的分布式进程
  • 因此,只能用一个整数表示本应用实体的标示
    • 因为这个报文可能传给另外一个分布式进程 ·1
  • 穿过层间接口的信息大小最小
  • UDP socket:本IP,本端口
  • 但是传输 报文时:必须要提供对方IP,port
    • 接收报文时: 传输层需要上传对方的IP,port

UDP之上的套接字(socket)

  • 对于使用无连接服务(UDP)的应用而言,套接字是2元组的一个具有本地意义的标示
    • 2元组:IP,port (源端指定)
    • UDP套接字指定了应用所在的一个端节点(end point)
    • 在发送数据报时,采用创建好的本地套接字(标示 ID),就不必在发送每个报文中指明自己所采用的 ip和port
    • 但是在发送报文时,必须要指定对方的ip和udp port(另外一个段节点)

image-20230821124042283

问题3:如何使用传输层提供的服务实现应用

  1. 定义应用层协议:报文格式,解释,时序等。
  2. 编制程序,通过API调用网络基础设施提供通信 服务传报文,解析报文,实现应用时序等。

应用层协议是什么?

  • 定义了:运行在不同端系统上的应用进程如何相互交换报文
    • 交换的报文类型:请求和应答报文
    • 各种报文类型的语法:报文中的 各个字段及其描述
    • 字段的语义:即字段取值的含义
    • 同步,进程何时、如何发送报文及对报 文进行响应的规则
  • 应用协议仅仅是应用的一个组 成部分
    • Web应用:HTTP协议,web客 户端,web服务器,HTML

公开协议:

  • 由RFC文档定义
  • 允许互操作
  • 如HTTP, SMTP

专用(私有)协议:

  • 协议不公开
  • 如:Skype

应用需要传输层提供什么样的服务?如何描述传输层的服务?

数据丢失率

  • 有些应用则要求100%的可 靠数据传输(如文件)
  • 有些应用(如音频)能容忍 一定比例以下的数据丢失

延迟

  • 一些应用 出于有效性考虑,对数据传输有严格的时间限制
    • Internet 电话、交互式游戏
    • 延迟、延迟差

吞吐

  • 一些应用(如多媒体)必须 需要最小限度的吞吐,从而使得应用能够有效运转
  • 一些应用能充分利用可供使用的吞吐(弹性应用)

安全性

  • 机密性
  • 完整性
  • 可认证性(鉴别)

Internet 传输层提供的服务

TCP 服务:

  • 可靠的传输服务
  • 流量控制:发送方不会淹没接受方
  • 拥塞控制:当网络出现拥塞时,能抑制发送方
  • 不能提供的服务:时间保证、最小吞吐保证和安全
  • 面向连接:要求在客户端进程和服务器进程之间建立连接

UDP 服务:

  • 不可靠数据传输
  • 不提供的服务:可靠,流量控制、拥塞控制、时间、带宽保证、建立连接

虽然UDP不可靠,但还是有应用场景的,以下是UDP存在的必要性:

  • 能够区分不同的进程,而IP服务不能
    • 在IP提供的主机到主机端到端功能的基础上,区分了主机的应用进程
  • 无需建立连接,省去了建立连接时间,适合事务性的应用
  • 不做可靠性的工作,例如检错重发,适合那些对实时性要求比较高而对正确性要求不高的应用
    • 因为为了实现可靠性(准确性、保序等),必须付出时间代
      价(检错重发)
  • 没有拥塞控制和流量控制,应用能够按照设定的速度发送数据
    • 而在TCP上面的应用,应用发送数据的速度和主机向网络发送的实际速度是不一致的,因为有流量控制和拥塞控制

安全TCP

TCP & UDP

  • 都没有加密
  • 明文通过互联网传输 ,甚至密码

SSL

  • 在TCP上面实现,提供加密的TCP连接
  • 私密性
  • 数据完整性
  • 端到端的鉴别

SSL在应用层

  • 应用采用SSL库,SSL库使用TCP通信

SSL socket API

  • 应用通过API将明文交给socket,SSL将其加密在互联网上传输

2.2 Web and HTTP

一些术语

  • Web页:由一些对象组成
  • 对象可以是HTML文件、JPEG图像、Java小程序、声 音剪辑文件等
  • Web页含有一个基本的HTML文件,该基本HTML文 件又包含若干对象的引用(链接)
  • 通过URL对每个对象进行引用
    • 访问协议,用户名,口令字,端口等;
  • URL格式
协议名 用户:口令 主机名 端口 路径名
Prot:// user:psw@ www.someSchool.edu :prot /someDept.gif

HTTP概况

HTTP: 超文本传输协议,是Web的应用层协议,使用客户/服务器模式

  • 客户: 请求、接收和显示 Web对象的浏览器
  • 服务器: 对请求进行响应, 发送对象的Web服务器

发送请求

电脑或手机上的浏览器就是客户端,客户端向Web服务器发送请求,服务器接收到请求,返回响应给客户端,浏览器根据响应的html来画出页面,此时电脑或手机就能看到网页了。

不过,在发送请求前,HTTP需要建立TCP连接

  1. 客户发起一个与服务器的TCP连接 (建立套接字) ,端口号为 80
  2. 服务器接受客户的TCP连接
  3. 在浏览器(HTTP客户端)与 Web服务器(HTTP服务器 server)交换HTTP报文 (应用层协议报文)
  4. TCP连接关闭

同时,HTTP是无状态的,服务器并不维护关于客户的任何信息。

而且,维护状态的协议很复杂!

  1. 必须维护历史信息(状态)
  2. 如果服务器/客户端死机,它们的状态信息可能不一致,二者的信息必须是一致
  3. 无状态的服务器能够支持更多的客户端

HTTP有两个版本,HTTP1.0和HTTP1.1,1.0是非持久HTTP,1.1是持久HTTP,有下列区别:

非持久HTTP(HTTP/1.0) 持久HTTP(HTTP/1.1)
最多只有一个对象在 TCP连接上发送
下载多个对象需要多 个TCP连接
多个对象可以在一个 (在客户端和服务器之间的)TCP连接上传输
请求后关闭TCP连接,下一次请求重新建立TCP连接 建立TCP连接后,会保持一段时间,下一次请求不需要重新建立TCP连接

客户端发送请求 和 接收服务器的响应 都需要时间,这个时间叫做往返时间RTT(round-trip time),即一个小的分组从客户端到服务器,在回到客户端的时间(传输时间忽略)。

客户端发送请求 和 接收服务器的响应 的时间:2RTT + 传输时间。

  1. 一个RTT用来发起TCP连接
  2. 一个 RTT用来HTTP请求并等待HTTP响应
  3. 文件传输时间

HTTP报文

下面我们来看一下HTTP报文,分为两种类:请求、响应

先来看HTTP请求报文

image-20230823110040960

网页通常包括表单输入,提交表单的方式有两种:

  1. POST方式
    • 包含在实体主体 (entity body )中的 输入被提交到服务器
  2. URL方式
    • 方法:GET
    • 输入通过请求行的 URL字段上载

B站视频的URL,https://www.bilibili.com/video/BV1JV411t7ow/?p=14&spm_id_from=pageDrive,后面这一段?p=14&spm_id_from=pageDrive就是参数,使用了URL方式输入。

除了这两种请求方式,还有其他请求方式

HTTP 1.0 HTTP 1.1
GET GET, POST, HEAD
POST PUT
HEAD
要求服务器在响应报文中不包含请求对象
故障跟踪
DELETE
删除URL字段规定的文件

再来看HTTP响应报文

HTTP响应报文

响应报文中的第一行是状态行,常见的状态码:

200 OK

  • 请求成功,请求对象包含在响应报文的后续部分

301 Moved Permanently

  • 请求的对象已经被永久转移了;新的URL在响应报文的Location:首部行中指定

  • 客户端软件自动用新的URL去获取对象

400 Bad Request

  • 一个通用的差错代码,表示该请求不能被服务器解读

404 Not Found

  • 请求的文档在该服务上没有找到

505 HTTP Version Not Supported

Cookies

HTTP是无状态的,下次访问就不认识了,就不能想B站、抖音那样给你个性化推荐。这时可以使用Cookies,不过目前技术先进网站使用的是token,这里就介绍一下Cookies。

Cookie 4个组成部分:

  1. 在HTTP响应报文中有一个cookie的首部行
  2. 在HTTP请求报文含有一个cookie的首部行
  3. 在用户端系统中保留有一个cookie文件,由用户的浏览器管理
  4. 在Web站点有一个后端数据库

例子:

  • Susan总是用同一个PC使用Internet Explore上网
  • 她第一次访问了一个使用了Cookie的电子商务网站
  • 当最初的HTTP请求到达服务器时,该Web站点产生一个唯一的ID,并以此作为索引在它的后端数据库中产生一个项。

image-20230903170932801

Web缓存

Web缓存也叫代理服务器。缓存既是客户端又是服务器,通常缓存是由ISP安装 (大学、公司、居民区ISP)。

目标:不访问原始服务器,就满足客户的请求

  • 用户设置浏览器: 通过缓存访问Web

  • 浏览器将所有的HTTP请求发给缓存

    • 在缓存中的对象:缓存直接返回对象
    • 如对象不在缓存,缓存请求原始服务器,然后再将对象返回给客户端

    Web缓存的作用

  • 降低客户端的请求响应时间

  • 可以大大减少一个机构内部网络与Internent接入链路上的流量

  • 互联网大量采用了缓存:可以使较弱的ICP也能够有效提供内容


2.3 FTP

先来看看FTP是什么?FTP是文件传输协议,很明显是用来传文件的。现在分享文件都用什么?迅雷、百度云盘、QQ、微信群文件等。

image-20231029120024400

FTP连接过程:

  1. FTP客户端(电脑)通过端口21FTP服务器连接,TCP作为传输协议。

  2. 客户端通过TCP控制连接

    • 2.1 进行身份认证。由于FTP比较古老,用户名和密码都是是明文传输,只需抓个包,账号就被看得一清二楚。

    • 2.2 浏览远程目录,下载文件。

  3. 服务器打开客户端的数据连接,端口20,发送文件给客户端。

  4. 发送完文件后,服务器关闭连接。

另外,FTP连接是有状态的

  • FTP服务器维护用户的状态信息: 当前路径、用户帐户与控制连接对应。

2.4 EMail

三个组成部分

  • 用户代理

    • 电子邮件客户端软件,作为代理取执行写、读邮件动作,如qq邮箱、outlook、Gmail。

    • 输出和输入邮件保存在服务器上

  • 邮件服务器

    • 你所接受的邮箱不存储在你的电脑上,而是在邮件服务器上。从客户端软件中看到的邮件,都是从邮件服务器上拉取过来的。
  • 邮件协议

    • 邮件传输协议:SMTP

    • 邮箱访问协议:POP3、IMAP


2.5 DNS


2.6 P2P 应用
2.7 CDN
2.8 TCP 套接字编程
2.9 UDP 套接字编程


视频

上一篇:
2019-2023 CSP-J1 考点统计
下一篇:
2019CSP-J1真题