IP是TCP/IP协议族中最为核心的协议。所有的TCP、UDP、ICMP以及IGMP数据都以IP数据报格式传输。IP提供了不可靠、无连接的数据报传送服务。
不可靠(unreliable)的意思是它不能保证IP数据报能成功地到达目的地。IP仅提供最好的传输服务。任何可靠性要求必须由上层来提供。
无连接(connectionless)是指IP并不维护任何关于后续数据报的状态信息。每个数据报的处理是相互独立的,这也就是说IP数据报可以不按发送顺序接收。
IP首部
普通的IP首部长为20个字节,除非含有选项字段。IP数据报格式:
在上图中,高位在左,记为0 bit;低位在右,记为31 bit。4个字节的32 bit值以下面的次序传输:首先是 0 – 7 bit,其次是 8 – 15 bit、16 – 23 bit,最后是24 – 31 bit,这种传输次序称作 big endian 字节序,也称为网络字节序。
- 目前的协议版本号是4,因此IP有时也称作IPv4。最新的是IPv6。
-
首部长度指首部占32 bit字的数目,包括任何选项。首部最长为60(
(2^4 - 1) * 4
)个字节。 -
服务类型(TOS)字段包括一个3bit的优先权字段(现已被忽略),4 bit的TOS子字段和 1 bit未用位但必须置 0。4 bit的TOS分别代表:最小时延、最大吞吐量、最高可靠性和最小费用。4 bit中只能置其中 1 bit;如果所有 4 bit均为 0,则表示是一般服务。
不同应用建议的TOS值:
-
总长度字段是指整个IP数据报的长度,以字节为单位。利用首部长度字段和总长度字段,就可以知道IP数据报中数据内容的起始位置和长度。该字段长16bit,所以IP数据报最长可达 65535字节。当数据报被分片时,该字段的值也随着变化。总长度字段是IP首部中必要的内容,因为一些数据链路(如以太网)需要填充一些数据以达到最小长度。这样可以知道实际有效数据的长度。
-
标识字段唯一地标识主机发送的每一份数据报。通常每发送一份报文它的值就会加 1。
-
TTL(time-to-live)生存时间字段设置了数据报可以经过的最多路由器。它指定了数据报的生存时间。TTL的初始值由源主机设置,一旦经过一个处理它的路由器,它的值就减 1,当该字段的值为 0 时,数据报就被丢弃,并发送ICMP报文通知源主机。
-
协议字段被IP用来对数据报进行分用,根据它可以识别是哪个协议向IP传送数据。
-
首部校验和字段是根据IP首部计算的校验和码,它不对首部后面的数据进行计算。ICMP、IGMP、UDP和TCP在它们各自的首部中均含有同时覆盖首部和数据的校验和码。
为了计算一份数据报的IP校验和,首先把校验和字段置为 0。然后,对首部中每个16 bit进行二进制反码求和(整个首部看成是由一串 16bit的字组成),结果存在校验和字段中。当收到一份IP数据报后,同样对首部中每个 16 bit进行二进制反码的求和。由于接收方在计算过程中包含了发送方存在首部中的校验和,因此,如果首部在传输过程中没有发生任何差错,那么接收方计算的结果应该为全 1。如果结果不是全 1,那么IP就丢弃收到的数据报。但是不生成差错报文,由上层去发现丢失的数据报并进行重传。
由于路由器经常只修改TTL字段(减1),因此当路由器转发一份报文时可以增加它的校验和,而不需要对IP整个首部进行重新计算。
二进制反码求和算法:0和0相加是0,0和1相加是1,1和1相加是0但要产生一个进位1,加到下一列。若最高位相加后产生进位,则最后得到的结果要加1。
基于维基百科里的IPv4_header_checksum的说明 实现的代码:
public class IPv4HeaderChecksum { public static void main(String[] args) { // 发送方的IP头部,十六进制字,0x0000 是校验和的占位 int[] sendHeader = new int[] { 0x4500, 0x0073, 0x0000, 0x4000, 0x4011, 0x0000, 0xc0a8, 0x0001, 0xc0a8, 0x00c7 }; int sum = checksum(sendHeader); // 接收方接收到的头部 int[] receiveHeader = new int[] { 0x4500, 0x0073, 0x0000, 0x4000, 0x4011, sum, 0xc0a8, 0x0001, 0xc0a8, 0x00c7 }; boolean isOk = verifyChecksum(receiveHeader); System.out.println(isOk); } public static int checksum(int[] header) { int sum = 0; for (int i : header) { sum += i; } sum = (sum >>> 16) + (sum & 0xffff); sum = (~sum) & 0xffff; return sum; } public static boolean verifyChecksum(int[] header) { int sum = 0; for (int i : header) { sum += i; } sum = (sum >>> 16) + (sum & 0xffff); return sum == 0xffff; } }
- 每一份IP数据报都包含源IP地址和目的IP地址。
-
最后一个字段是选项,是数据库中一个可变长的可选信息。选项定义如下:
- 安全和处理限制(用于军事领域)。
- 记录路径(让每个路由器都记下它的IP地址)。
- 时间戳(让每个路由器都记下它的IP地址和时间)
- 宽松的源站选路(为数据报指定一序列必须经过的IP地址)。
- 严格的源站选路(为数据报指定一序列必须经过的IP地址,且不能经过其他的地址)。
选项很少被使用,并非所有的主机和路由器都支持这些选项。选项字段一直都以32bit作为界限,在必要的时候插入值为 0 的填充字节。这可保证IP首部始终是32bit的整数倍(首部长度字段要求)。
IP路由选择
如果目的主机与源主机直接相连或都在一个共享网络上,那么IP数据报就直接发送到目的主机上。否则,主机把数据报发往一个默认的路由器上,由路由器来转发该数据报。大多数的主机都是采用这种简单机制。
在一般体制中,IP可以从TCP、UDP、ICMP和IGMP接收数据报(本地生成的数据报)并进行发送,或者从一个网络接口接收数据报(待转发的数据报)并进行发送。IP层在内存中有一个路由表,当收到一份数据报并进行发送时,它都要对该表搜索一次。当数据报来自某个网络接口时,IP首先检查目的IP地址是否为本机的IP地址之一或者IP广播地址,如果是,数据报就被送到由IP首部字段所指定的协议模块进行处理。如果数据报的目的不是这些地址,那么:1)、如果IP层被设置为路由器的刚才,那么就对数据报进行转发;2)、否则,数据报被丢弃。
路由表中的每一项都包含下面这些信息:
- 目的IP地址。既可以是一个完整的主机地址,也可以是一个网络地址,由该表目中的标志字段来指定。主机地址有一个非0的主机号,以指定某一特定的主机,而网络地址中的主机号为0,以指定网络中的所有主机。
- 下一跳路由器(next-hop router)的IP地址,或者有直接连接的网络IP地址。下一跳路由器是指一个在直接相连网络上的路由器,通过它可以转发数据报。下一跳路由器不是最终的目的,但是它可以把传送给它的数据报转发到最终目的。
- 标志。其中一个标志指明目的IP地址是网络地址还是主机地址,另一个标志指明下一跳路由器是否为真正的下一跳路由器,还是一个直接相连的接口。
- 为数据报的传输指定一个网络接口。
IP路由选择是逐跳地(hop-by-hop)进行的。IP并不知道到达任何目的的完整路径(除了那些与主机直接相连的目的)。所有的IP路由选择只为数据报传输提供了下一站路由器的IP地址。它假定下一站路由器比发送数据报的主机更接近目的,而且下一站路由器与该主机是直接相连的。
IP路由选择要完成的功能:
- 搜索路由表,寻找能与目的IP地址完全匹配的表目(网络号和主机号都要匹配)。如果找到,则把报文发送给该表目指定的下一跳路由器或直接连接的网络接口(取决于标志字段的值)。
- 搜索路由表,寻找能与目的网络号相匹配的表目。如果找到,则把报文发送给该表目指定的下一跳路由器或直接连接的网络接口(取决于标志字段的值)。目的网络上的所有主机都可以通过这个表目来处置。这种搜索网络的匹配方法必须考虑可能的子网掩码。
- 搜索路由表,寻找标为“默认(default)”的表目。如果找到,则把报文发送给该表目指定的下一跳路由器。
- 如果上面的步骤都没有成功,那么该数据报就不能被传送。如果不能传送的数据报来自本机,那么一般会向生成数据报的应用程序返回一个“主机不可达”或“网络不可达”的错误。
完整主机地址匹配在网络号怕之前执行,只有当它们都失败后才选择默认路由。默认路由以及下一跳路由器发送的ICMP间接报文(如果为数据报选择了错误的默认路由)是IP路由选择机制中功能强大的特性。
为一个网络指定一个路由器,而不必为每个主机指定一个路由器,这是IP路由选择机制的另一个基本特性。这样可以极大地缩小路由表的规模。
子网寻址
子网寻址不再把IP地址看出由单纯的一个网络号和一个主机号组成,而是把主机号再分层一个子网号和一个主机号。原因是A类和B类地址为主机号分配了太多的空间,可容纳的主机数分别为 2^32-2
和 2^16-2
(主机号全0或全1的都是无效的)。
子网对外部路由器来说隐藏了内部网络组织的细节。缩减了路由表的规模。
子网掩码
任何主机在进行引导时进行的部分配置是指定主机IP地址。主机还需要指导多少比特用于子网号及多少比特用于主机号,这是在引导过程中通过子网掩码来确定的。
子网掩码是一个32bit的值,其中值为1的比特留给网络号和子网号,为0的比特留给主机号。
IP地址一般以点分十进制方法表示,但是子网掩码一般用十六进制表示,特别是当界限不是一个字节时,因为子网掩码是一个比特掩码。
给定IP地址和子网掩码以后,主机就可以确定IP数据报的目的是:1)、本子网上的主机;2)、本网络中其他子网中的主机;3)、其他网络上的主机。
如果知道本机的IP地址,那么就知道它是否为A类、B类或C类地址(从IP地址的高位可以得知),也就知道网络号和子网号之间的分界线。根据子网掩码就可知道子网号与主机号之间的分界线。
特殊情况的IP地址
上图中,0表示所有的比特位全为0;-1表示所有的比特位全为1;netid、subnetid和hostid分别表示不为全0或全1的对应字段。子网号栏为空表示该地址没有进行子网划分。
表的头两项是特殊的源地址,如主机使用BOOTP协议确定本机IP地址时只能作为初始化过程中的源地址出现;中间项是特殊的环回地址;最后四项是广播地址。
欢迎关注我的微信公众号: coderbee笔记,可以更及时回复你的讨论。