728x90
728x90
HikariPoolConnection Error DB CPU 사용률이 95% 까지 치솟자 애플리케이션에서 HikariPoolConnetion Error 발생 => Connectio Timeout 발생 ⇒ AWS Target Group 에 연결된 애플리케이션이 Kill(exit signal) Signal 을 통해 종료 ⇒ ALB 단에서 502 를 응답
Elasticache Redis Redis NetworkBytes In/Out 이 높을 경우 생기는 문제 네트워크 정체: Redis 서버가 대량의 수신 및 발신 데이터를 처리하는 경우 높은 네트워크 바이트 입출력은 네트워크 정체를 나타낼 수 있습니다. 이는 전체 네트워크 성능에 영향을 미치고 대기 시간이 증가하거나 응답 시간이 느려질 수 있습니다. 대역폭 사용량 증가: 높은 네트워크 바이트 입/출력은 Redis 서버가 네트워크를 통해 많은 양의 데이터를 전송하고 있음을 의미합니다. 이것은 특히 Redis가 많은 수의 클라이언트에 서비스를 제공하거나 상당한 데이터 로드를 처리하는 시나리오에서 상당한 네트워크 대역폭을 소비할 수 있습니다. 잠재적인 성능 영향: Redis 서버가 높은 네트워크 트래픽을 처리하..
jenkins agent pod 를 사용하면서 pod 에 적절한 권한을 부여하는 과정에 pods/exec 의 권한에 대해 알아볼 기회가 생겼습니다. pods/exec 의 get/watch/list 권한과 get/watch/list/create 권한의 차이점은 다음과 같습니다. 1. get/watch/list 권한을 부여했을 때: - 파드 내부의 컨테이너에서 실행되는 명령 경로에 대한 정보를 가져올 수 있습니다. - 파드에 대한 리소스 사용량 정보, 실행 중인 컨테이너의 상태 정보 등을 가져올 수 있습니다. - 작업자의 작업에 대한 초기 진단 및 디버깅을 수행할 수 있습니다. - 컨테이너의 리소스 정보를 모니터링하고 관리할 수 있습니다. 2. get/watch/list/create 권한을 부여했을 때: -..
Policy AWS IAM 정책은 5가지 형태의 구조를 가지고 있다. Effect Principal Resources Action Condition 누가(Principal) 대상(Resources)에 작업(Action)을 조건(Condition)에 따라 허용(Effect)할지 말지를 정해 놓은 정책이다. 이 정책이 적용할 대상은 Identity 가 될 수도 resource 가 될 수도 있다. Identity 기반 정책 누가(Principal) 대상(Resource)에 작업(Action)을 조건(Condition)에 따라 허용여부(Effect)를 결정하는 것 간단히 말하자면 행위자(사람)에게 부여하는 정책이다. { "Version": "2012-10-17", "Statement": [ { "Effect":..
SLA/SLO/SLI SLI 란 서비스의 성능 또는 안정성에 대한 정량적 측정이다. SLI 는 하나 이상의 모니터 기반 또는 메트릭 기반이다. SLO 란 특정 기간 동안의 SLI 에 대한 목표 백분율이다. SLA 란 클라이언트의 신뢰성 기대와 이를 충족하지 못한 서비스 제공자의 결과를 규정하는 클라이언트와 서비스 제공자 간의 명시적 또는 묵시적 합의 KPI(Key Performance Indicator) KPI 는 성공을 측정하는데 사용될 수 있는 메트릭이다. KPI 는 목표나 목적과는 다른, 목표를 달성하는 과정 중에 있는지 측정하는 메트릭이다. 따라서 수반하는 목표가 필요하다. 또한 KPI 를 모니터링하는 것은 목표를 달성하기 위해 필수적이다. SMART 법칙 Specific: KPI 는 구체적이어야..