✅ 캐시의 기본 원리 및 적용
캐시가 없을 때,
- 데이터가 변경되지 않아도 이미지에 대한 요청을 보내면 계속 새로운 데이터를 다운 받아야한다.
- 인터넷 네트워크는 매우 느리고 비싸다, 브라우저 로딩 속도가 느려진다.
캐시 적용,
- 캐시(cache)란? 컴퓨터 과학에서 데이터나 값을 미리 복사해 놓는 임시 장소
- 캐시는 캐시의 접근 시간에 비해 기존 데이터 접근 시간이 오래 걸리는 경우나 값을 다시 계산하는 시간을 절약하고 싶을 때 사용한다.
- 캐시에 데이터를 미리 복사해 놓으면 계산이나 접근 시간 없이 더 빠른 속도로 데이터에 접근할 수 있다.
- 브라우저에 캐시를 저장할 땐, 헤더에 cache-control 속성을 통해 캐시가 유효한 시간을 지정할 수 있다. ex)Cache-control: max-age=60 ⇒ 응답 결과 저장 시간 60초
- 캐시 사용 가능 시간동안 네트워크를 사용하지 않아도 된다.
- 비싼 네트워크 사용량을 줄일 수 있다.
- 브라우저 로딩 속도가 매우 빠르다.
- 민약 유효시간을 초과한다면, 서버에 요청하고 응답을 받는다. 이때 네트워크 다운로드가 발생하게 된다. 브라우저가 렌더링하면 브라우저 캐시는 기존 캐시를 지우고 새 캐시로 데이터를 업데이트한다. 유효 시간을 초기화된다.
✅ 캐시 검증 헤더와 조건부 요청
만약 캐시 유효시간이 초과하더라도 서버 데이터가 변경되지 않았다면, 캐시 데이터를 사용하는 방법은 없을까?
Last-Modified와 If-Modified-Since
컴증 헤더 Last-Modified를 이용해 캐시의 수정시간을 알 수 있다. 데이터가 마지막으로 수정된 시간정보를 헤더에 포함한다. 이로 인해 응답 결과를 캐시에 저장할 때 데이터 최종 수정일도 저장된다.
캐시 유효시간이 초과되더라도 If-Modified-Since 헤더를 이용해 조건부 요청을 할 수 있다.
1. 데이터가 수정되었는지 검증
2. 수정되지 않았다면 바디를 제외한 HTTP 헤더만 전송 (304 Not Modified)
3. 브라우저 캐시에서 응답 결과를 재사용, 헤더 메타데이터 또한 갱신
4. 브라우저는 캐시에서 조회한 데이터를 렌더링
단점
- 1초 미만 단위로 캐시 조정이 불가능
- 날짜 기반의 로직 사용
- 데이터를 수정해서 날짜가 다르지만, 같은 데이터를 수정해서 데이터가 똑같은 경우
- 서버에서 별도의 캐시 로직을 관리하고 싶은 경우
좀 더 간단한 방식, 서버에서 완전히 캐시를 컨트롤하고 싶은 경우,
ETag(Entity Tag)와 If-None-Match
- 캐시용 데이터레 임의의 고유한 버전 이름을 달아둔다.
- 데이터가 병경되면 이 이름을 바꾸어서 변경한다 (Hash를 다시 생성)
- 단순하게 ETag만 보내서 같으면 유지, 다르면 다시 받는 방식
- 캐시 제어 로직을 서버에서 완전히 관리
- 클라이언트는 단순히 이 값을 서버에 제동
1. 서버에서 헤더에 ETag를 작성해 응답한다.
2. 클라이언트의 캐시에 해당 ETag 값을 저장한다.
3. 캐시시간이 초과되서 다시 요청해야하는 경우, ETag값을 검증하는 If-None-Match를 요청 헤더에 작성해서 보낸다.
4. 서버에서 데이터가 변경되지 않았으면 ETag는 동일하기에 If-None-Match는 거짓이 된다.
5. 이 경우 304 Not Modified를 응답하고, HTTP Body는 없다.
6. 브라우저 캐시에서는 응답 결과를 재사용하고 헤더 데이터를 갱신한다.
Cache-control
캐시 지시어 (directives)
max-age | 캐시 유효 시간. 초 단위 |
no-cache | 데이터는 캐시해도 되지만, 항상 origin 서버에 검증하고 사용 |
no-store | 데이터에 민감한 정보가 있으므로 저장하면 안됨. (메모리에서 사용하고 최대한 빨리 삭제) |
Expires
캐시 만료일 지정 (하위 호환)
Expires : Mon, 01 Jan 1990 00:00:00 GMT
캐시 만료일을 정확한 날짜로 지정
HTTP 1.0부터 사용
지금은 더 유연한 Cache-Control: max-age 권장
Cache-Control: max-age와 함께 사용하면 Expires는 무시된다.
정리
검증 헤더(validator)
- ETag : "v1.0", ETag: "845eed07c5887cf"
- Last-Modified: Wed, 26 Dec 2020 12:01:29 GMT
조건부 요청 헤더
- If-Match, If-None-Match: ETag 값 사용
- If-Modified-Since, If-Unmodified-Since: Last-Modified 값 사용
✅ 프록시 캐시(Proxy Cache)
프록시란?
클리이언트와 서버 사이에 대리로 통신을 수행하는 것이다.
프록시 서버란?
그 중계 기능을 하는 서버, 클라이언트가 다른 네이트워크 서비스에 간접적으로 접속 할 수 있게 하는
컴퓨터 시스템이나 응용 프로그램을 의미한다.
클라이언트, 혹은 반대로는 서버가 다른 네트워크에 간접적으로 접속 할 수 있기 떄문에,
보안, 캐싱을 통한 성능, 트래픽 분산 들의 장점을 가진다.
예를 들어,
유튜브와 같은 해외 사이트에서 한국에서 미국까지 접근하는 시간을 기다릴 필요 없이 빠르게 영상을 시청할 수 있다.
이를 해결하기 위해 프록시 캐시가 도입되었다.
클리이언트와 원 서버 사이에 위치한 프록시 캐시 서버를 도입했다.
한국에 프록시 캐시서버를 두고, 한국 프록시 캐시서버를 통해 자료를 가져오도록 한다.
여러 사람이 찾은 자료일수록 이미 캐시에 등록되어있기에 빠른 속도로 자료를 가져올 수 있다.
이때,
private 캐시 : 클라이언트에서 사용하고 저장하는 캐시
public 캐시 : 프록시 캐시 서버의 캐시
Cache-control
Cache-control: public | 응답이 public 캐시에 저장되어도 됨. |
Cache-control: private | 응답이 해당 사용자만을 위한 것. private 캐시에 저장해야 함.(기본값) |
Cache-control: s-maxage | 프록시 캐시에만 적용되는 max-age |
Age: 60 (HTTP 헤더) | 오리진 서버에서 응답 후 프록시 캐시 내에 머문 시간(초) |
캐시 무효화
민감한 정보까지 캐싱되면 안될 때, 웹 브라우저가 임의로 캐싱을 무효화하는 방법은 없을까?
Cache-control: no-cache | 데이터는 캐시해도 되지만, 항상 원 서버에 검증하고 사용 (이름에 주의) |
Cache-control: no-store | 데이터에 민감한 정보가 있으므로 저장하면 안됨 (메모리에서 사용하고 최대한 빨리 삭제) |
Cache-control: must-revalidate | 캐시 만료 후 최초 조회 시 원 서버에 검증해야함. 원 서버 접근 실패 시 반드시 오류가 발생해야함 - 504(Gateway Timeout) must-revalidate는 캐시 유효 시간이라면 캐시를 사용함 |
Pragma: no-cache | HTTP 1.0 하위 호환 |
'tech' 카테고리의 다른 글
HTML 태그 (0) | 2021.08.11 |
---|---|
Git branch (0) | 2021.08.11 |
HTTP 헤더 (0) | 2021.08.10 |
HTTP (0) | 2021.08.10 |
TCP vs UDP (0) | 2021.08.10 |