ALB Health Check Logs 지원

1. 들어가며

그동안 ALB(Application Load Balancer)의 상태 확인은 대상 그룹(Target Group)의 Target Health 화면과 일부 CloudWatch 지표에 의존해 왔습니다. 그러나 이 정보만으로는 "정확히 어떤 요청이 어떤 이유로 실패했는지" 파악하는 데 한계가 있었습니다. 타임아웃인지, 응답 코드 문제인지, 혹은 애플리케이션 내부 오류인지 명확히 구분하기 어려웠기 때문입니다. 결국 EC2나 애플리케이션 로그를 직접 확인하거나 AWS Support에 케이스를 생성해야 하는 번거로운 상황이 종종 발생했습니다.

다행히 Health Check Logs(상태 검사 로그) 기능이 추가되었습니다. 이제 각 타깃에 대해 어떤 프로토콜로 언제 상태 검사를 보냈고, 응답 시간은 얼마나 걸렸으며, 어떤 상태 코드와 실패 사유로 인해 비정상(Unhealthy)으로 판단되었는지를 한 줄의 로그로 바로 확인할 수 있게 되었습니다.

What's new?

2. ALB Health Check Logs 개요

2.1 활성화 절차

Health Check Logs는 기본적으로 비활성화된 선택 기능이므로 해당 ALB에서 직접 활성화해야 합니다. 절차는 크게 다음과 같습니다.

S3 버킷 준비

헬스 체크 로그를 저장할 Amazon S3 버킷을 지정하거나 새로 생성합니다.
버킷에 필요한 접근 제어(예: 조직 내에서만 접근 가능하도록 버킷 정책 설정, 퍼블릭 액세스 차단 등)를 구성합니다.

ALB에서 Health Check Logs 활성화

Application Load Balancer 설정에서 Health Check Logs 기능을 활성화하고 로그를 보낼 S3 버킷과 프리픽스를 지정합니다.

활성화 이후 ELB는 각 로드 밸런서 및 대상 그룹에 대해 지정된 간격으로 상태 검사 로그 파일을 설정한 버킷에 gzip 형식으로 업로드합니다. 로그 파일은 bucket[/prefix]/AWSLogs/계정ID/elasticloadbalancing/리전/연/월/일/health_check_log_...log.gz 경로와 이름으로 저장됩니다. 대상(Target) 수가 많거나 상태 검사 주기를 짧게 설정했다면 같은 5분 구간 내에도 여러 개의 로그 파일이 생성될 수 있습니다.

2.2 로그에서 확인할 수 있는 주요 필드

Health Check Logs의 각 로그 라인은 한 번의 상태 검사 결과를 의미하며, 공백으로 구분된 여러 필드로 구성됩니다. 주요 필드는 아래와 같습니다.

type (1): 헬스 체크 요청 타입니다. http, https, h2, grpc, lambda 등으로 어떤 프로토콜/타입으로 헬스 체크를 했는지 나타냅니다.
time (2): 타임스탬프입니다. 타깃에 헬스 체크를 시작한 시점으로 ISO 8601 형식으로 기록됩니다.
latency (3): 지연 시간입니다. 해당 헬스 체크 요청을 완료하는 데 걸린 총 시간(초 단위)입니다.
target_addr (4): 타깃 주소입니다. IP:Port 형식의 EC2 또는 IP 타겟 주소, 혹은 Lambda 타깃인 경우 함수 ARN이 기록됩니다.
target_group_id (5): 타깃 그룹 식별자입니다. 타깃이 속한 Target Group 이름/ID 입니다.
status (6): 헬스 체크 결과입니다. 성공 시 PASS 실패 시 FAIL이 기록됩니다.
status_code (7): 응답 코드입니다. HTTP/HTTPS의 경우 타깃이 반환한 HTTP 상태 코드가 기록됩니다.
reason_code (8): 실패 원인 코드입니다. 헬스 체크가 실패했을 때만 기록되는 필드입니다. 세부 사항은 공식 문서를 참고 부탁드립니다.

3. Health Check Logs 활성화

ALB, 타겟 그룹 생성 절차는 생략하겠습니다.

3.1. 로그 적재 용 S3 버킷 생성

버킷은 로드 밸런서와 동일한 리전에 있어야 합니다. 서로 다른 계정에 있어도 무방합니다.
서버 측 암호화 옵션은 Amazon S3에서 관리하는 키(SSE-S3)만 지원됩니다.

3.2. S3 버킷 정책 적용

S3 버킷의 퍼블릭 액세스를 차단한 상태에서 다음과 같이 버킷 정책을 지정합니다.

#기본 정책 예시
{
  "Version":"2012-10-17",		 	 	 
  "Statement": [
    {
      "Effect": "Allow",
      "Principal": {
        "Service": "logdelivery.elasticloadbalancing.amazonaws.com"
      },
      "Action": "s3:PutObject",
      "Resource": "arn:aws:s3:::<bucket-name>/<prefix>/AWSLogs/<account-id>/*"
    }
  ]
}

필자는 별도의 접두사(Prefix)를 지정하지 않았으므로 아래와 같이 적용했습니다.

#Prefix를 지정하지 않은 예시
{
    "Version": "2012-10-17",
    "Statement": [
        {
            "Effect": "Allow",
            "Principal": {
                "Service": "logdelivery.elasticloadbalancing.amazonaws.com"
            },
            "Action": "s3:PutObject",
            "Resource": "arn:aws:s3:::<bucket-name>/AWSLogs/*"
        }
    ]
}

3.3. ALB Health Check logs 활성화

AWS 콘솔의 ALB [속성] 탭 내 [모니터링] 섹션에서 "상태 검사 로그"를 활성화하고 앞서 생성한 버킷을 지정합니다.

3.4. 정상 설정 확인

위 단계가 정상적으로 완료되면 S3 버킷에 ELBHealthCheckLogTestFile이라는 테스트 파일이 생성됩니다.

4. Health Check Logs 확인

콘솔에서 다음과 같은 응답 코드를 확인한 상황을 가정해보겠습니다.

로그를 확인하면 다음과 같은 상세 정보를 볼 수 있습니다.

http 2025-12-12T01:44:51.876800Z 0.002303735 10.0.11.121:80 <tg-name> FAIL 403 ResponseCodeMismatch
http 2025-12-12T01:44:51.877287Z 0.002084793 10.0.12.248:80 <tg-name> FAIL 403 ResponseCodeMismatch

위 로그를 보면 상태 검사 프로토콜, 응답 시간, IP:Port, 응답 코드 등을 확인할 수 있습니다. 내용을 분석해 보면 응답 시간(latency)이 약 0.002초로 매우 짧다는 것을 알 수 있습니다. 이를 통해 네트워크 타임아웃 문제가 아니라 애플리케이션이나 웹 서버가 즉시 403 응답을 반환했음을 짐작할 수 있습니다.

상태 검사가 정상적으로 통과된 경우의 로그는 다음과 같습니다.

http 2025-12-12T04:34:52.837939Z 0.004288887 10.0.11.121:80 <tg-name>PASS 200 -
http 2025-12-12T04:34:52.838434Z 0.003962947 10.0.12.248:80 <tg-name> PASS 200 -

2대 중 1대만 실패하는 경우에는 아래와 같이 로그가 기록됩니다.

http 2025-12-12T04:22:28.841953Z 0.002405452 10.0.12.248:80 <tg-name> PASS 200 -
http 2025-12-12T04:22:58.862174Z 0.002346755 10.0.11.121:80 <tg-name> FAIL 404 ResponseCodeMismatch

이러한 상세 로그는 실제 운영 환경에서 더욱 빛을 발합니다. 예를 들어10대 중 2대만 실패하는 것과 같은 까다로운 부분 장애 상황에서도 문제의 인스턴스를 핀포인트로 식별할 수 있기 때문입니다.

정리하자면 Health Check Logs를 통해 실패 시점과 응답 코드, 에러 사유를 시계열로 추적함으로써 막연했던 원인 분석 과정을 데이터 기반의 명확한 디버깅 과정으로 개선할 수 있습니다.

ALB Health Check Logs 지원

1. 들어가며

2. ALB Health Check Logs 개요

2.1 활성화 절차

2.2 로그에서 확인할 수 있는 주요 필드

3. Health Check Logs 활성화

3.1. 로그 적재 용 S3 버킷 생성

3.2. S3 버킷 정책 적용

3.3. ALB Health Check logs 활성화

3.4. 정상 설정 확인

4. Health Check Logs 확인

Share This Post

Check out these related posts

Amazon S3 Tables와 MCP, 자연어로 확장하는 데이터 경험

Amazon EC2는 이제 EC2 인스턴스에 대한 강제 종료를 지원합니다!

Amazon ECS, 기본 제공 블루/그린 배포 지원