×

一文带您详细了解缓存机制以及“强制缓存和协商缓存”的应用和区别

作者:Terry2023.05.29来源:Web前端之家浏览:2241评论:0

500.jpg

今天被人问到关于强制缓存和协商缓存的问题,其实我们在项目开发的时候也会遇到,也用到过。只是突然被问到这个问题的时候,脑子里突然有点空白,对于这些专业性技术名字,有时候我们还得去了解和认知。今天我们一起来了解下强制缓存和协商缓存的知识点。

在介绍强制缓存和协商缓存之前,我们先要了解缓存的意义在哪里?

为什么需要缓存机制?

众所周知,对于用户来说,想要访问某个网站那肯定是越快越好。对于服务器来说,肯定是响应速度越快好,压力越少越好。有了缓存这些问题可以迎刃而解~。

当浏览器第一次访问服务器的时候,服务器返回对应资源的同时告诉浏览器把这个资源保存起来,下次你需要的时候只要没过期你就自己用,不需要再问我了。你知道的,我很忙的~

第一次进入某个网站的时候会比较慢,因为本地没有缓存,全部需要去麻烦服务器。再次访问这个网站的时候,大部分静态文件浏览器已经缓存起来了,直接自取自用,会发现打开速度就快很多,这就是缓存带来的好处。

什么是浏览器缓存?

浏览器缓存(Brower Caching)是浏览器在本地磁盘对用户最近请求过的文档进行存储,当访问者再次访问同一页面时,浏览器就可以直接从本地磁盘加载文档。

浏览器是如何判断是否使用缓存的

我们通过一张图,就可以很清晰的看出来。如下:

image.png

浏览器缓存的优点有:

1.减少了冗余的数据传输,节省了网费

2.减少了服务器的负担,大大提升了网站的性能

3.加快了客户端加载网页的速度

浏览器缓存主要有两类:缓存协商和彻底缓存,也有称之为协商缓存和强缓存。

1.强缓存:不会向服务器发送请求,直接从缓存中读取资源,在chrome控制台的network选项中可以看到该请求返回200的状态码;

2.协商缓存:向服务器发送请求,服务器会根据这个请求的request header的一些参数来判断是否命中协商缓存,如果命中,则返回304状态码并带上新的response header通知浏览器从缓存中读取资源;

两者的共同点是,都是从客户端缓存中读取资源;区别是强缓存不会发请求,协商缓存会发请求。

缓存中header的参数:

强制缓存

Expires:response header里的过期时间,浏览器再次加载资源时,如果在这个过期时间内,则命中强缓存。

Cache-Control:当值设为max-age=300时,则代表在这个请求正确返回时间(浏览器也会记录下来)的5分钟内再次加载资源,就会命中强缓存。

cache-control除了该字段外,还有下面几个比较常用的设置值:

-no-cache:不使用本地缓存。需要使用缓存协商,先与服务器确认返回的响应是否被更改,如果之前的响应中存在ETag,那么请求的时候会与服务端验证,如果资源未被更改,则可以避免重新下载。

-no-store:直接禁止浏览器缓存数据,每次用户请求该资源,都会向服务器发送一个请求,每次都会下载完整的资源。

-public:可以被所有的用户缓存,包括终端用户和CDN等中间代理服务器。

-private:只能被终端用户的浏览器缓存,不允许CDN等中继缓存服务器对其缓存。

协商缓存

Last-Modify/If-Modify-Since:浏览器第一次请求一个资源的时候,服务器返回的header中会加上Last-Modify,Last-modify是一个时间标识该资源的最后修改时间;当浏览器再次请求该资源时,request的请求头中会包含If-Modify-Since,该值为缓存之前返回的Last-Modify。服务器收到If-Modify-Since后,根据资源的最后修改时间判断是否命中缓存

Etag:web服务器响应请求时,告诉浏览器当前资源在服务器的唯一标识(生成规则由服务器决定)。

If-None-Match:当资源过期时(使用Cache-Control标识的max-age),发现资源具有Etage声明,则再次向web服务器请求时带上头If-None-Match (Etag的值)。web服务器收到请求后发现有头If-None-Match 则与被请求资源的相应校验串进行比对,决定是否命中协商缓存;

ETag和Last-Modified的作用和用法,他们的区别:

1. Etag要优于Last-Modified。Last-Modified的时间单位是秒,如果某个文件在1秒内改变了多次,那么他们的Last-Modified其实并没有体现出来修改,但是Etag每次都会改变确保了精度;

2. 在性能上,Etag要逊于Last-Modified,毕竟Last-Modified只需要记录时间,而Etag需要服务器通过算法来计算出一个hash值;

3. 在优先级上,服务器校验优先考虑Etag。

浏览器缓存过程

1.浏览器第一次加载资源,服务器返回200,浏览器将资源文件从服务器上请求下载下来,并把response header及该请求的返回时间一并缓存;

2.下一次加载资源时,先比较当前时间和上一次返回200时的时间差,如果没有超过cache-control设置的max-age,则没有过期,命中强缓存,不发请求直接从本地缓存读取该文件(如果浏览器不支持HTTP1.1,则用expires判断是否过期);如果时间过期,则向服务器发送header带有If-None-Match和If-Modified-Since的请求

3.服务器收到请求后,优先根据Etag的值判断被请求的文件有没有做修改,Etag值一致则没有修改,命中协商缓存,返回304;如果不一致则有改动,直接返回新的资源文件带上新的Etag值并返回200;;

4.如果服务器收到的请求没有Etag值,则将If-Modified-Since和被请求文件的最后修改时间做比对,一致则命中协商缓存,返回304;不一致则返回新的last-modified和文件并返回200。

强制缓存、协商缓存到底有什么区别和联系?

image.png

主要有2点:

1. 触发的先后顺序不同

先去判断文件是否过期(下面会说如何判断是否过期),没过期触发强制缓存,浏览器直接读取本地文件,http状态码200 (from memory cache)或者 (from disk cache)

from memory cache:从本地读取缓存,本会话由于访问过该网站,部分文件加载到内存中了,可以直接内存中读取,关闭浏览器或tab页后清空,不会出现from memory cache。

from dist cache:从本地读取缓存,内存中没有,读取磁盘中的缓存文件。

文件已经过期了,触发协商缓存,发起请求询问服务器该文件是否有更新,没有更新则使用浏览器本地缓存文件,文件有更新则服务器返回新的文件给客户端,且更新新的过期时间并缓存起来。

2. 强制缓存不访问服务器、协商缓存需要访问服务器

强制缓存是浏览器 自导自演 的行为,发起请求时看该文件是否过期,没过期直接使用。

协商缓存是浏览器发现文件过期了,需要和 服务器端通讯 ,让服务器判断是否过期,没过期就还是用浏览器缓存,过期了就用服务器新返回的文件。

浏览器如何知道一个资源是否过期?

在请求的Reponse Header中,有2个头部字段我们并不陌生:expires、cache-control。

image.png

expires是http1.0的产物,代表资源过期的绝对时间,但是每个机器本地时间是不同的会造成不必要的麻烦。固http1.1增加了cache-control代表相对时间,从客户端接收到资源的那一刻起,经过多少时间(秒)才过期。

当 expires和 cache-control都存在, cache-control优先级高。

浏览器在请求一个资源前,通过浏览器本地时间和上次接口返回的Reponse Header中的expires、cache-control时间做判断,就知道是否过期了。

这下知道了判断资源是否过期的方法,没过期就触发强制缓存。

通过上面介绍,我们知道当资源过期后会触发协商缓存,会发起一个请求询问服务器这个资源是否有更新(有变动),那么服务器怎么知道这个资源是否有更新呢?往下看

如何判断一个资源是否更新?

通过请求的Reponse Header2个字段:最后更新时间(last-modified)和文件标识(ETag)来记录。如何实现的呢?

首先在一个请求中,Reponse Header里面服务器会返回文件最后修改时间: Last-Modified 或者最新文件标识ETag。

为什么  Last-Modified不够还需要 ETag呢?是因为某些文件虽然更新时间变化了,但是内容其实并没有变化。所以用 ETag表示文件内容是否变更,相当于一个版本号。

Reponse Header内容如下:

image.png

当下次发送相同的请求时,request Header内容如下:

image.png

If-Modified-Since的值对应 Last-Modified的值。

If-None-Match的值对应 ETag 的值。

服务器拿到这2个值结合自身的实际情况判断,如果还是没有变更则告诉浏览器(code 304)这个文件没有变化,你可以继续使用缓存中的资源,并且更新expires和cache-control,让这个文件再次缓存服务器设置的时间。如果有变更了,则把新的资源重新返回给客户端(code 200),客户端重新缓存新的资源。

强制缓存和协商缓存就说这么多了,这只是一个简单的区分,让大家有个清晰简单的认识,不至于下次面试官问起一脸蒙蔽,更多细节大家可以自行探索~

总结

强制缓存和协商缓存都针对静态资源,动态资源实现缓存方法参考上方伪代码。

强制缓存在前,协商缓存在后。

资源未过期触发强制缓存,资源过期后再触发协商缓存。

判断过期的方法expires(绝对时间)、cache-control(相对时间)

判断资源是否有更新(Last-Modified 和 ETag)

您的支持是我们创作的动力!
温馨提示:本文作者系Terry ,经Web前端之家编辑修改或补充,转载请注明出处和本文链接:
https://jiangweishan.com/article/xieshangqiangz.html

网友评论文明上网理性发言已有0人参与

发表评论: