카프카

BigData

[Apache Kafka] 카프카 프로듀서(Producer)를 알아보자 [2]

이번 포스팅을 통해서 프로듀서의 옵션 중 acks 옵션을 어떻게 설정하는지에 따라서 카프카로 메시지를 전송할 때 메시지 손실 여부와 메시지 전송 속도 및 처리량 등이 달라지는지 자세히 살펴보겠습니다. 1. 메시지 손실 가능성 🔺 전송 속도 🔺 메시지를 전송할 때 프로듀서는 카프카 서버에서 응답을 기다리지 않고, 메시지를 보낼 준비가 되는 즉시 다음 요청을 보냅니다. 다시 말해, 카프카로부터 응답을 기다리지 않고 프로듀서만 준비되면 즉시 보내기 때문에 매우 빠르게 메시지를 보낼 수 있습니다. 하지만 이런 방법은 프로듀서가 카프카로부터 자신이 보낸 메시지에 대해 응답을 기다리지 않기 때문에 메시지가 손실될 수 있습니다. 메시지 손실 가능성이 있지만 빠른 전송 속도를 보여주는 옵션은 acks=0 입니다. 해당..

BigData

[Apache Kafka] 카프카 프로듀서(Producer)를 알아보자 [1]

이번 포스팅을 통해서 카프카의 토픽으로 메시지를 보내는 역할을 하는 프로듀서(Producer)의 동작 방식을 알아보고 주요 옵션에는 무엇이 있는지를 살펴보겠습니다. 프로듀서의 주요 기능은 각각의 메시지를 토픽 파티션에 매핑하고 파티션의 리더에 요청을 보내는 것입니다. 키 값을 정해 해당 키를 가진 모든 메시지를 동일한 파티션으로 전송할 수 있습니다. 만약 키 값을 입력하지 않으면, 파티션은 라운드 로빈(round-robin) 방식으로 파티션에 균등하게 분배합니다. 🍔 프로듀서의 주요 명령어 [토픽을 생성하는 명령어] 명령어의 위치는 카프카 설치 경로인 (usr/local/kafka) 의 하위 디렉토리인 bin 디렉토리이고, 명령어는 kafka-topics.sh입니다. option --zookeeper :..

BigData

[Apache Kafka] 카프카(KAFKA)의 고가용성과 리플리케이션(Replication)을 알아보자

해당 글의 모든 레퍼런스는 "카프카, 데이터 플랫폼의 최강자" (고승범, 공용준 지음)을 알립니다. https://coupa.ng/b5xV58 카프카 데이터 플랫폼의 최강자:실시간 비동기 스트리밍 솔루션 Kafka의 기본부터 확장 응용까지 COUPANG www.coupang.com "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." 카프카는 분산 애플리케이션으로 서버의 물리적 장애가 발생하는 경우에도 높은 가용성을 보장합니다. 이를 위해 카프카는 리플리케이션(Replication) 기능을 제공합니다. 여기서 리플리케이션은 토픽을 하는 것이 아닌 파티션을 리플리케이션 하는 것입니다. 🥊 리플리케이션 팩터와 리더, 팔로워의 역할 카프카에서는 리플리케이션 팩터(Repli..

BigData

[Apache Kafka] 카프카(KAFKA) 데이터 모델을 알아보자

해당 글의 모든 레퍼런스는 "카프카, 데이터 플랫폼의 최강자" (고승범, 공용준 지음)을 알립니다. https://coupa.ng/b5xV58 카프카 데이터 플랫폼의 최강자:실시간 비동기 스트리밍 솔루션 Kafka의 기본부터 확장 응용까지 COUPANG www.coupang.com "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." 카프카가 고성능, 고가용성 메시징 애플리케이션으로 발전한 데는 토픽과 파티션이라는 데이터 모델의 역할이 있기 때문입니다. 토픽은 메시지를 받을 수 있도록 논리적으로 묶은 개념이고, 파티션은 토픽을 구성하는 데이터 저장소로서 수평 확장이 가능한 단위입니다. 🏓 토픽 (Topic) 토픽은 메시지를 받을 수 있도록 논리적으로 묶은 개념이며 예..

busybeans
'카프카' 태그의 글 목록 (3 Page)