r 썸네일형 리스트형 잠재 디리클레 할당(Latent Dirichlet Allocation, LDA) LDA, Latent Dirichlet Allocation Woonn 2020-05-21 1. LDA란? 1.1 LDA의 정의 및 가정 Latent Dirichlet Allocation(잠재 디리클레 할당)이란 텍스트마이닝의 방법중 하나업니다. 텍스트를 DTM(Document-Term Matrix)으로 만들어 단어의 등장 빈도에 따라 텍스트를 분류합니다. 단어가 모이면 문장을 이루고 문장이 모이면 문서를 이루게 됩니다. 그릭고 문서, 문장 안에서도 서로 묶이는 단어들이 있습니다. 이를 바탕으로 문서 전체를 분석하여 단어끼리의 경향성을 계산하고, 그 문서를 대표하는 특정 토픽을 찾아내는 것, 그것이 LDA의 목적입니다. LDA에는 몇 가지 가정이 있는데 그 중 중요한 것은 단어의 교환성(exchangeab.. 더보기 R 설치 #1. R이란? R은 오픈소스 프로그램으로 통계/데이터 마이닝 및 그래프를 위한 언어이다. R은 주로 연구 및 산업별 응용 프로그램으로 많이 사용되고 있으며, 최근에는 기업들이 많이들 사용하기 시작했다. 특히, 빅데이터 분석을 목적으로 주목을 받고 있으며, 5000개가 넘는 패키지(일종의 애플리케이션)들이 다양한 기능을 지원하고 있으며 수시로 업데이트되고 있다. [네이버 지식백과] R (국립중앙과학관 - 빅데이터) 오픈소스 프로젝트로 진행되고 있는 R은 통계 계산과 결과 생성 그래픽을 위한 프로그래밍 언어로 특히 그래픽 부분에서 다른 언어(특히, 최근 주목받고 있는 파이썬)에 비해 강세를 보입니다. R은 전 세계 개발자들이 각종 패키지를 개발 및 공개하고 있어 사용자층과 용도가 급속도로 확장되고 있습니다.. 더보기 이전 1 다음