워드프레스에 오신 것을 환영합니다. 이것은 첫 게시물입니다. 수정하거나 삭제하고 글쓰기를 시작하세요!
데이터 설명 변수 설명 age 나이 job 직업 정보(“admin”, “unknown”, “unemployed”, “management”, “housemaid”, “entrepreneur”, “student”, “blue-collar”, “self-employed”, “retired”, “technician”, “services”) marital 결혼 정보(“married”, “divorced”, “single” note: “divorced” means divorced or widowed) education 교육 정도(“unknown”, “secondary”, “primary”, “tertiary”) default 체납 여부 (binary: yes or no) balance 일년 평균 잔고 housing 주택담보 대출이 있는지 여부 (binary: yes or no) […]
RapidMiner에 대한 이해 RapidMiner 소개 RapidMiner는 데이터분석자가 예측적 데이터 분석을 쉽게 수행할 수 있도록 지원하는 분석 소프트웨어이다. 도르트문트 대학의 연구진에 의해 2001년 YALE(Yet Another Learning Environment)라는 이름으로 최초로 개발되어 2007년 RapidMiner로 이름이 변경되었다. Self Service Data Analysis 를 위한 최적화 된 솔루션으로 분석을 위한 다양한 기능과 알고리즘들을 GUI 방식으로 구현 할 수 있어 누구나 내가 가진 데이터에서 숨어 […]
데이터 설명 변수명 타입 결측치 통계 설명 churn binomial 0 No (3617), Yes (1313) 고객 이탈 여부 gender Binominal 0 Male (2519), Female (2411) 고객 성별 SeniorCitizen Binominal 0 0 (4157), 1 (773) 고객이 노약자인가 아닌가 Partner Binominal 0 No (2541), Yes (2389) 고객에게 파트너가 있는지 여부(결혼 여부) Dependents Binominal 0 No (3460), Yes (1470) […]
데이터 설명 변수 설명 class 클래스 (종속변수) buying 구매가격 maint 유지보수비용 doors 문의 개수 persons 좌석 수 lug_boot 짐칸 크기 safety 안전 sheet중 train을 train데이터로 사용, test를 test데이터로 사용 할 것 데이터 출처 : https://archive.ics.uci.edu/ml/datasets/car+evaluation 데이터 다운로드
Item Based Recommendation 추천 시스템에는 여러가지 접근방법이 있습니다. 본 chapter에서는 여러 추천 접근법들 중에서 아이템에 기반한 상품 추천중에서 기본이 될 수있는 알고리즘인 코사인 유사도를(Cosine Similarity)를 활용한 Item Base Recommendation 을 소개할려고 합니다. 패키지 import 하기 본 분석에 필요한 패키지들을 불러오겠습니다. 데이터 로드와 전처리를 위해 pandas, 행렬 처리를 위한 numpy , 코사인 유사도 계산을 위해 scikit-learn에 […]
Random Forest 은행에서 새로운 고객의 예금 여부 예측하기 은행 데이터를 통해 고객의 특성을 바탕으로 새로운 고객이 예금을 할 것인지의 여부를 random forest 모델을 통해 예측해보겠습니다. CSV파일 불러오기 csv파일을 불러오기 전에 먼저 pandas라는 패키지가 설치되어 있어야 합니다. 패키지 불러오기 (import) import <패키지 이름>을 통해 패키지를 불러올 수 있습니다. import pandas 라고 입력하게 되면 pandas라는 패키지를 불러옵니다. […]
패키지 불러오기 (import) xlsx파일도 csv와 마찬가지로, pandas를 사용하여 불러옵니다. pandas모듈을 사용하기 위하여 import합니다. import pandas as pd pd.read_csv를 사용해서 csv파일 읽기 pandas안에 있는 read_csv를 통해서 xslx파일을 읽을 수 있습니다. 만약 엑셀안에 sheet가 여러개 있다면, sheetname이라는 옵션을 통하여 특정 sheet를 불러올 수 있습니다. 이번에는 SVM을 통하여 wine의 퀄리티를 예측해보겠습니다.(참조 :https://archive.ics.uci.edu/ml/datasets/Wine+Quality ) 변수에 대한 정보는 위 홈페이지를 참조하시면 […]
최신 댓글