본문 바로가기

분류 전체보기38

Markov Clustering 이해하기 Markov clustering은 데이터 분류 기법의 일종인데, Markov Chain 을 기반으로 하고 있어서 이것에 대한 이해가 먼저 필요해요. 둘 다 설명해 보겠습니다. 일단 하고 많은 소개글들과 다르게 쓰려고 하는 것은, 가능한 한 쉽게 그리고 코드를 곁들여서 설명하려고 하는 점입니다. 데이터 간의 관계 Markov Clustering의 목적은 데이터를 분류하는 겁니다. 어떤 데이터냐? 다른 데이터와 관계를 가지고 있는 데이터들을 분류하는 겁니다. 데이터의 관계라고 하면 여러 가지가 있겠지만 일단 아래 그림을 먼저 보겠습니다. 위 그림에서 "데이터" 라고 부를 만한 게 8개가 있습니다. 딱 봐도 네개씩 묶으면 (=클러스터링하면) 되겠죠? 어떻게? 서로 가까운 것들끼리요. 즉, 여기서 우리가 직관적.. 2023. 1. 25.
색의 3원색이 빨강 노랑 파랑이라고? 어렸을 때 미술 시간에 색의 3원색이라고 하면 빨간색, 노란색, 파란색이라고 배웁니다. 3원색이라고 하는 이유는 그 세개의 색깔을 섞어서 모든 색을 만들어낼 수 있기 때문이라고도 배우고, 세가지 색을 모두 섞으면 검정색이 된다고 배웁니다. 그런데 실제로 수채화 시간에 오만 물감을 다 섞으면 검정색이라기보다는 뭔가 짙은 갈색에 가까운 칙칙한 색이 나오지 않던가요? 이런 얘길 하는 건 색의 3원색이 빨강 노랑 파랑이 아니기 때문이겠죠. 오늘은 그 얘기를 해보려고 합니다. 이걸 알려면 사실 빛의 3원색부터 시작해야 합니다. 빛의 3원색 색의 3원색을 알기 위해 빛의 3원색부터 시작해야 한다는 게 이상할 수 있는데, 이게 사실은 색의 3원색이라는 건 빛의 3원색의 보색이기 때문입니다. 빛의 3원색은 빨강, 초록.. 2022. 12. 26.
PPI? DPI? 해상도? 헷갈리는 용어 총정리 이미지가 얼마나 선명한지를 여러가지 방식으로 표현할 수 있는데, 그래서 더 헷갈리는 거 같습니다. 오늘은 이미지의 선명함을 나타내는 용어들의 뜻과 차이점을 알아보겠습니다. 이미지의 크기 PPI나 DPI는 이미지의 해상도를 나타내는 단위인데요, 전부 이미지의 크기를 어떻게 정하냐에 따라 나눠집니다. 이미지는 보통은 컴퓨터나 휴대폰 화면으로 보게 되지만, 종이에 인쇄해서 볼 수도 있습니다. 그래서 이미지의 크기도 두가지로 정할 수 있습니다. 픽셀 : 컴퓨터든 휴대폰이든 디스플레이로 이미지를 볼 때의 단위. 예를 들면 1920 x 1080 픽셀. 인치(inch) 또는 cm : 이미지를 종이에 인쇄해서 볼 때의 단위. 예를 들면 7 x 5 inch. 이 두 종류의 이미지 크기를 알아두고 아래 설명으로 가보겠습니.. 2022. 12. 25.
연관성 분석 (장바구니 분석) 이해하기 연관성 분석 (장바구니 분석) 이라는 건 서로 다른 두 인자 사이의 관계를 분석하는 것입니다. 마트에서 장을 볼 때 여러가지 물건을 살 텐데, 예를 들면 생수와 우유가 큰 관계가 있는지, 또는 콜라와 치킨은 큰 관계가 있는지, 둘 중에 어떤 것들의 조합이 더 관계가 높은지와 같은 것을 알아보는 데에 쓰입니다. 이걸 장바구니 분석이라고도 하는 이유가 여기에 있습니다. 사람들이 장을 보는데 어떤 물건들을 주로 같이 사는지를 알아보고, 그 물건들을 가까운데 배치하는 등의 작업을 통해 매출을 올리려는 거거든요. 대략의 순서는 1. 데이터를 정의하고 2. 데이터를 바탕으로 관계 지표를 정의한 후 3. 지표 비교를 통해 우선순위를 매기는 겁니다. 사실상 의사결정을 위해 3단계가 가장 중요하긴 하지만, 일단 1단계와.. 2022. 12. 10.