용테크
[Server] 로드밸런싱 본문
부하분산 또는 로드 밸런싱(load balancing)은 컴퓨터 네트워크 기술의 일종으로 둘 혹은 셋 이상의 중앙처리장치 혹은 저장장치와 같은 컴퓨터 자원들에게 작업을 나누는 것을 의미한다. 이로써 가용성 및 응답 시간을 최적화시킬 수 있다. 예를 들어, 메인프레임 1대(단일 구성체) 보다 IA-32와 같은 일반적인 서버(복합 구성체)가 안정성 면에서 유리한 위치에 있다. 부하분산 서비스는 그에 적합한 하드웨어와 소프트웨어에 의해 제공된다. 이 기술은 보통 내부 네트워크를 이용한 병렬 처리(특히, 고가용성의 병렬 처리)에 사용된다.

현대의 모든 정보는 인터넷을 통해 연결되어있다. 인터넷의 발달은 데이터 통신을 보다 활발하게 만들었으며 이것은 트래픽의 폭발적인 증가로 이어졌다. 그 결과 아무리 뛰어난 서버라고 해도 사용자들의 모든 트래픽을 감당해낼 수 없게 되었다. 그렇다면 기업과 같이 데이터 통신이 활발한 서버에서는 어떻게 이런 트래픽을 어떻게 처리해야 할까?
가장 생각하기 쉬운 답변 중 하나는 바로 쏟아지는 트래픽을 여러 대의 서버로 분산시켜주는 방법일 것이다. 그리고 이러한 기술이 바로 로드밸런싱이다.

사용자가 인터넷을 통하여 데이터를 요청하면 그 요청은 로드밸런서가 받아들이고 분산된 서버에 전송하게 된다.
여기서 말하는 로드밸러서란, 서버에 가해지는 부하(=로드)를 분산(=밸런싱)해주는 장치 또는 기술을 통칭한다.
로드밸런서는 사용자와 서버 풀 사이에 위치하며, 한 대의 서버로 부하가 집중되지 않도록 트래픽을 관리해 각각의 서버가 최적의 퍼포먼스를 보일 수 있도록 도와주는 것이다.
로드밸런싱 알고리즘
• 라운드 로빈 방식(Round Robin Method)
서버에 들어온 요청을 순서대로 돌아가며 배정하는 방식. 클라이언트의 요청을 순서대로 분배하기 때문에 여러 대의 서버가 동일한 스펙을 갖고 있고, 서버와의 연결(세션)이 오래 지속되지 않는 경우에 활용하기 적합.
• 가중 라운드로빈 방식(Weighted Round Robin Method)
각각의 서버마다 가중치를 매기고 가중치가 높은 서버에 클라이언트 요청을 우선적으로 배분. 주로 서버의 트래픽 처리 능력이 상이한 경우 사용되는 부하 분산 방식. 예를 들어 A라는 서버가 5라는 가중치를 갖고 B라는 서버가 2라는 가중치를 갖는다면, 로드밸런서는 라운드로빈 방식으로 A 서버에 5개 B 서버에 2개의 요청을 전달한다.
• IP 해시 방식(IP Hash Method)
클라이언트의 IP 주소를 특정 서버로 매핑하여 요청을 처리하는 방식. 사용자의 IP를 해싱해(Hashing, 임의의 길이를 지닌 데이터를 고정된 길이의 데이터로 매핑하는 것, 또는 그러한 함수) 로드를 분배하기 때문에 사용자가 항상 동일한 서버로 연결되는 것을 보장.
• 최소 연결 방식(Least Connection Method)
요청이 들어온 시점에 가장 적은 연결 상태를 보이는 서버에 우선적으로 트래픽을 배분. 자주 세션이 길어지거나, 서버에 분배된 트래픽들이 일정하지 않은 경우에 적합한 방식.
• 최소 리스폰 타임(Least Response Time Method)
서버의 현재 연결 상태와 응답 시간(Response Time, 서버에 요청을 보내고 최초 응답을 받을 때까지 소요되는 시간)을 모두 고려하여 트래픽을 배분. 가장 적은 연결 상태와 가장 짧은 응답 시간을 보이는 서버에 우선적으로 로드를 배분하는 방식.
L4 S/W, L7 S/W
로드밸런싱에는 L4 로드밸런서와 L7 로드밸런서를 가장 많이 활용한다. 그 이유는 L4로드밸런서부터 포트(Port) 정보를 바탕으로 로드를 분산하는 것이 가능하기 때문인데, 한 대의 서버에 각기 다른 포트번호를 부여하여 다수의 서버 프로그램을 운영하는 경우라면 최소 L4 로드밸런서 이상을 사용해야 만한다.

참고 : https://m.post.naver.com/viewer/postView.nhn?volumeNo=27046347&memberNo=2521903