본문 바로가기
반응형

IT Knowledge152

ElasticSearch 샤드의 최적화 클러스터는 인덱스를 최대 몇 개까지 생성할 수 있을까?하나의 샤드 크기는 과연 얼마가 적당한가?ElasticSearch로 서비스를 운영하고 있다면, 모두가 고민해봤을만한 주제이다. 시간이 지날 수록 데이터의 크기는 점점 커지고, 서비스는 살아있는 생물 같아서 관심을 주지 않으면 금방 엉망이 되어 버진다. 현재 서비스가 월활하게 된다고 해서 앞으로도 서비스가 월활하게 될것이라는 보장은 없다. 데이터가 계속 증가할 수 있기 때문에, 항상 최적화를 위해 고민해야 한다는 것이다.  운영 중에 샤드의 개수를 수정해도 되는가?원칙적으로 클러스터를 운영중에 인덱스의 샤드 개수를 수정하는 것은 불가능하다. 하지만, 서비스를 운영하다보면, 데이터의 크기가 점점 더 커지고 너무 많은 데이터가 쌓이면, 샤드의 부하가 발생할.. 2024. 5. 28.
ElasticSearch를 구성하는 개념 ElasticSearch를 구성하는 주요 구성요소로 어떤 것이 있는지 다양한 개념들을 먼저 알아보자 [데이터(Data)]ElasticSearch의 Data는 "인덱스","타입","문서","필드" 구조로 구성된다.  인덱스(Index)데이터 저장 공간이다. 하나의 인덱스는 하나의 타입만 가지며, 하나의 물리적인 노드에 여러 개의 논리적인 인덱스를 생성할 수 있다. 검색시 인덱스 이름으로 문서 데이터를 검색하며, 여러 개의 인덱스를 동기에 검색하는것도 가능하다. (인덱스 이름은 모두 소문자여야 하며, 추가,수정,삭제,검색은 RESTful API로 수행가능하다. 만약 인덱스가 없는데 데이터가 추가되면? 인덱스가 자동생성된다) ES를 분산 환경으로 구성하면, 하나의 인덱스가 여러 노드에 분산 저장되어 관리된다... 2024. 5. 27.
Docker VS Kubernates 구분하기 Docker와 Kubernetes를 혼동하는 분들을 위해 작성하였습니다.  도커(Docker)란? '컨테이너 기반의 오픈 소스 가상화 플랫폼'이며 '한 개의 컨테이너'를 관리하는데 최적입니다.쿠버네티스(Kubernetes)란? '여러 개의 컨테이너'를 서비스 단위로 관리하는데 최적화되어 있는 오케스트레이션 툴입니다.   '컨테이너 오케스트레이션 툴'은 여러 컨테이너를 스케줄링 / 클러스터링 / 서비스 디스커버리 / 로깅 및 모니터링을 하는 도구입니다.  ClusteringAuto-PlacementAuto-Restart무중단배포 쿠버네티스의 장점- 컨테이너 스케줄링이 편리해진다.  사용자가 일일이 서버 선택할 필요 없이, 쿠버네티스가 가장 적절한 워커노드를 골라서 리소스를 할당하게 됩니다. - 확장성이 좋.. 2024. 5. 27.
AWS Route53 개요 및 사용방법(특징, 기능, 비용) Amazone Route 53이란?Amazone에서 제공하는 DNS 웹서비스 입니다. 사용자의 요청을 AWS or Onpremise에 연결합니다.  Route53의 주요 특징 및 기능(사용 사례)Route53의 주요 특징은 DNS + HealthCheck가 된다는 점입니다.  이것으로 아래의 사례를 만들 수 있습니다. 고가용성 어플리케이션 구축HealthCheck가 가능하기 때문에, 엔드포인트의 상태를 모니터링하고, Fail 상태에 대해 응답을 사전에 정희해서 라우팅 정책을 설정 가능합니다. 글로벌 네트워크 트래픽 관리(L4, GSLB)지역이 관계없이 부하를 분산해주는 기능을 제공한다. 특정 IDC에 의존하지 않고, 지역과 나라에 무관하게 트래픽 전달이 가능하다. AWS 동일 리전, AWS 다른 리전, .. 2024. 5. 24.
데이터 통합 프로세스(ETL vs ELT) 데이터 통합 프로세스를 다루는데 가장 많이 사용되는 방법론으로 2가지 방법론이 있는데, ETL과 ELT 방식입니다.  여기서 E,T,L은 Extract, Transform, Load의 약어로, ETL : Extract > Transform > Load의 순으로 데이터를 처리 할것인지, ELT : Extract > Load > Transform으로 데이터를 처리할 것인지를 다루는 방법론입니다.  지난 50년(1970년대부터)이 넘게 기간 동안 데이터 통합 프로세스를 수행하는데 가장 많이 사용되던 방법론은 ETL 이었습니다. 그러나, 데이터 관리의 양, 속도 및 다양성 측면에서 새로운 요구로 인해, 기존 ETL 프로세스에 대한 새로운 접근 방식인 ELT가 등장했습니다.  ETL 이란?데이터가 소스에서 Ext.. 2024. 5. 20.
컨테이너 런타임 (containerd) 설치 및 구성 Kubernetes 컨테이너 런타임 설치 공식문서 : https://kubernetes.io/ko/docs/setup/production-environment/container-runtimes/ 컨테이너 런타임참고: Dockershim은 쿠버네티스 릴리스 1.24부터 쿠버네티스 프로젝트에서 제거되었다. 더 자세한 내용은 Dockershim 제거 FAQ를 참고한다. 파드가 노드에서 실행될 수 있도록 클러스터의 각 노드에 컨kubernetes.io [컨테이너 런타임 설치 사전준비]cat overlaybr_netfilterEOF sudo modprobe overlaysudo modprobe br_netfilter# 필요한 sysctl 파라미터를 설정하면 재부팅 후에도 유지된다.cat net.bridge.bri.. 2024. 5. 17.
반응형