본문 바로가기

전체 글38

DBeaver 환경 새 컴퓨터로 복사하기 DBeaver 는 여러가지 DB에 연결해서 쿼리를 날려볼 수 있는 강력한 툴입니다. 게다가 개인은 무료 버전으로도 사용할 수 있잖아요? 그러다가 얼마 전에 컴퓨터가 바뀌어서 일일이 다 이걸 옮겨야 하나 하고 생각하다가 찾아낸 걸 정리합니다. 윈도우 환경 윈도우 환경에서 작업 순서는 다음과 같습니다. 원래 쓰던 컴퓨터 먼저 백업하고자 하는 기존의 환경에서 탐색기를 엽니다. 주소 및 디렉토리 위치 표기 창에 %appdata% 를 입력합니다. 이때 입력하고 이동한 결과가 C:\Users\사용자명\Appdata\Roaming 인지 확인합니다. DBeaverData 폴더를 통째로 백업합니다. 새 컴퓨터 새 컴퓨터에서 동일하게 %appdata% 로 이동해서 DBeaverData 폴더를 붙여넣습니다. DBeaver .. 2024. 2. 9.
아파치 카프카 컨슈머와 리밸런싱 오늘 내용은 아파치 카프카가 무엇이고, 어떤 역할을 하는지 알고 있다는 가정하에 작성하였습니다. 카프카는 메세지 큐이고 전달할 메세지를 토픽에 저장했다가 컨슈머에게 메세지를 전달하는데, 이 때 카프카와 컨슈머 사이에 어떤 변화가 있을 때 일어나는 리밸런싱에 대해 살펴보고자 합니다. 카프카 컨슈머와 컨슈머 그룹 카프카는 프로듀서가 토픽에 메세지를 보내면 이를 여러 파티션에 나눠서 저장합니다. 이 때 이 메세지들은 컨슈머가 요청해서 가져가고, (폴링) 각 컨슈머는 파티션의 데이터를 가져갑니다. 컨슈머는 여러 개가 모여서 컨슈머 그룹을 형성합니다. 흔히 말하는 "컨슈머가 토픽의 데이터를 가져간다" 라는 개념은 사실상 컨슈머 그룹이 토픽의 데이터를 가져가는 것이고, 컨슈머는 파티션의 데이터를 가져가게 됩니다. .. 2024. 1. 13.
UUID 개념 정리 UUID란 Universally Unique IDentifier 의 약자 : "범용 고유 식별자" 라고 번역합니다. RFC 4122 표준으로 정의되어 있습니다 : RFC4122 UUID 버전마다 정의가 다르며, 1~5까지 현재 5개의 버전이 나와 있습니다. 총 32자리의 16진수로 되어 있습니다. 각 자리가 16진수 (= 4 bit = 1 nibble) 이므로, 비트로 환산하면 128 bit = 16 Byte 가 됩니다. 구성은 5개의 서브 모듈로 되어 있고, 각 모듈은 8-4-4-4-12 개의 16진수로 구성됩니다. (예시. 550e8400-e29b-41d4-a716-446655440000) 현재의 구성대로라면 서기 약 3400년 정도까지는 중복 없이 사용 가능하다고 합니다. (대략 1380년 정도 남.. 2023. 12. 17.
메모리와 디스크의 프레임, 페이지, 섹터, 블록 개념 총정리 비슷비슷한 용어들이 다른 의미로 쓰이는 것이 너무 헷갈려서 정리한 페이지입니다. 이 글에서는 메모리, 그리고 디스크의 최소한의 읽기/쓰기 단위인 프레임 / 페이지 / 섹터 / 블록의 개념에 대해 정리합니다. 모두 읽기 / 쓰기의 최소 단위를 나타냄 위 용어들은 하드디스크이건 메모리건 간에 모두 읽기와 쓰기의 최소 단위를 나타냅니다. 여기에다 하드디스크는 "클러스터" 라는 개념을 하나 더 가지고 있습니다. 이것까지 모두 어쨌든 메모리 또는 하드디스크의 읽기 또는 쓰기의 최소 단위를 나타냅니다. 하드디스크의 섹터, 블록, 클러스터 하드디스크의 섹터, 블록, 클러스터는 각각 다음의 의미를 가집니다. 섹터 하드디스크는 원판으로 이루어져 있습니다. 이 하나의 원판을 물리적으로 여러 개의 트랙으로 쪼개서 관리하고,.. 2023. 12. 17.
Markov Clustering 이해하기 Markov clustering은 데이터 분류 기법의 일종인데, Markov Chain 을 기반으로 하고 있어서 이것에 대한 이해가 먼저 필요해요. 둘 다 설명해 보겠습니다. 일단 하고 많은 소개글들과 다르게 쓰려고 하는 것은, 가능한 한 쉽게 그리고 코드를 곁들여서 설명하려고 하는 점입니다. 데이터 간의 관계 Markov Clustering의 목적은 데이터를 분류하는 겁니다. 어떤 데이터냐? 다른 데이터와 관계를 가지고 있는 데이터들을 분류하는 겁니다. 데이터의 관계라고 하면 여러 가지가 있겠지만 일단 아래 그림을 먼저 보겠습니다. 위 그림에서 "데이터" 라고 부를 만한 게 8개가 있습니다. 딱 봐도 네개씩 묶으면 (=클러스터링하면) 되겠죠? 어떻게? 서로 가까운 것들끼리요. 즉, 여기서 우리가 직관적.. 2023. 1. 25.
색의 3원색이 빨강 노랑 파랑이라고? 어렸을 때 미술 시간에 색의 3원색이라고 하면 빨간색, 노란색, 파란색이라고 배웁니다. 3원색이라고 하는 이유는 그 세개의 색깔을 섞어서 모든 색을 만들어낼 수 있기 때문이라고도 배우고, 세가지 색을 모두 섞으면 검정색이 된다고 배웁니다. 그런데 실제로 수채화 시간에 오만 물감을 다 섞으면 검정색이라기보다는 뭔가 짙은 갈색에 가까운 칙칙한 색이 나오지 않던가요? 이런 얘길 하는 건 색의 3원색이 빨강 노랑 파랑이 아니기 때문이겠죠. 오늘은 그 얘기를 해보려고 합니다. 이걸 알려면 사실 빛의 3원색부터 시작해야 합니다. 빛의 3원색 색의 3원색을 알기 위해 빛의 3원색부터 시작해야 한다는 게 이상할 수 있는데, 이게 사실은 색의 3원색이라는 건 빛의 3원색의 보색이기 때문입니다. 빛의 3원색은 빨강, 초록.. 2022. 12. 26.
PPI? DPI? 해상도? 헷갈리는 용어 총정리 이미지가 얼마나 선명한지를 여러가지 방식으로 표현할 수 있는데, 그래서 더 헷갈리는 거 같습니다. 오늘은 이미지의 선명함을 나타내는 용어들의 뜻과 차이점을 알아보겠습니다. 이미지의 크기 PPI나 DPI는 이미지의 해상도를 나타내는 단위인데요, 전부 이미지의 크기를 어떻게 정하냐에 따라 나눠집니다. 이미지는 보통은 컴퓨터나 휴대폰 화면으로 보게 되지만, 종이에 인쇄해서 볼 수도 있습니다. 그래서 이미지의 크기도 두가지로 정할 수 있습니다. 픽셀 : 컴퓨터든 휴대폰이든 디스플레이로 이미지를 볼 때의 단위. 예를 들면 1920 x 1080 픽셀. 인치(inch) 또는 cm : 이미지를 종이에 인쇄해서 볼 때의 단위. 예를 들면 7 x 5 inch. 이 두 종류의 이미지 크기를 알아두고 아래 설명으로 가보겠습니.. 2022. 12. 25.
연관성 분석 (장바구니 분석) 이해하기 연관성 분석 (장바구니 분석) 이라는 건 서로 다른 두 인자 사이의 관계를 분석하는 것입니다. 마트에서 장을 볼 때 여러가지 물건을 살 텐데, 예를 들면 생수와 우유가 큰 관계가 있는지, 또는 콜라와 치킨은 큰 관계가 있는지, 둘 중에 어떤 것들의 조합이 더 관계가 높은지와 같은 것을 알아보는 데에 쓰입니다. 이걸 장바구니 분석이라고도 하는 이유가 여기에 있습니다. 사람들이 장을 보는데 어떤 물건들을 주로 같이 사는지를 알아보고, 그 물건들을 가까운데 배치하는 등의 작업을 통해 매출을 올리려는 거거든요. 대략의 순서는 1. 데이터를 정의하고 2. 데이터를 바탕으로 관계 지표를 정의한 후 3. 지표 비교를 통해 우선순위를 매기는 겁니다. 사실상 의사결정을 위해 3단계가 가장 중요하긴 하지만, 일단 1단계와.. 2022. 12. 10.