머신러닝 5

심화프로젝트 2일차

기초 프로젝트에 이어서 심화 프로젝트를 시작하면서 또 이러는 중... 스포티파이 데이터셋을 주제로 삼고 클러스터링을 통한 사용자 맞춤 '추천 시스템'을 만들고 있다.기초 프로젝트 때도 브라질 이커머스 기업을 분석하면서 어려운 데이터였어서 고전했지만깔끔하고 충분히 분석할만한 데이터였다. 나의 역량이 부족해서 문제였지...근데 아무리 생각해도 이 데이터셋은 음악 추천 시스템을 만들기에는 부족해 보인다.https://charts.spotify.com/charts/overview/global 혹시 도움이 될까 해서 아까 찾아둔 거 있는데, 나중에 사용자 선호 장르를 정해야할 때 저기 일간, 주간 탑 200 csv 파일 제공되니까 참고하면 좋을 것 같구요https://ubrain0624.medium.com/%EB..

머신러닝 2024.08.23

과제가 제출 기한 30분 전에 소실되다... / 과제 복기

ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ정오부터 이 상태다... 정신이...어이가 없음... 일단 약 3일에 걸쳐서 과제를 수행했다.머신러닝! 이름부터 어렵잖은가.강의를 잘 못 듣는 나는 이 과제를 도약지로 삼아 성장하고자 했다.실제로 기초 프로젝트 때 가장 성장했었고 문제가 주어질 때 배우는 게 많은 타입이기에. 근데, 제출하기 1시간 전에 파일을 저장하는 과정에서 확장자명을 입력하지 않아저장은 되지 않고 내용은 다시 안불러와지는 문제가 발생했다.vscode 오른쪽 아래에 다시 시도하기 팝업이 뜨긴 했는데다시 저장하지뭐 하고 취소를 눌러버렸다.사실 다시 시도해도 확장자명을 적지 않은 게 확실했어서 해당 팝업 버튼을 눌렀어도 결과는 같았을 것이다. 당황해서 튜터분들께도 질문했으나 역시나 방법은 없었다...

머신러닝 2024.08.21

KMeans Clustering

01. k-means clustering 개념k-means clustering이 무엇인지 알아봅시다 k-means clustering☑️ k-means clustering 이란? ☑️ 알고리즘의 단계초기화: k개의 군집 중심을 랜덤하게 설정합니다.할당 단계: 각 데이터 포인트를 가장 가까운 군집 중심에 할당합니다.업데이트 단계: 각 군집의 중심을 해당 군집에 속한 데이터 포인트들의 평균으로 업데이트합니다.반복: 할당 단계와 업데이트 단계를 군집 중심이 더 이상 변화하지 않을 때까지 반복합니다☑️ 거리 측정 방법k-means 알고리즘은 주로 유클리드 거리(Euclidean Distance)를 사용하여 데이터 포인트와 군집 중심 간의 거리를 계산합니다.실루엣 계수30명의 학생을 4개의 그룹으로 나누고 싶은데..

머신러닝 2024.08.20

[ML] 회귀 알고리즘 라이브 세션 자료

머신러닝에 관련한 라이브 세션 내용을 실시간으로 정리하면서 들었다. # 필요한 패키지 임포트 import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom sklearn.linear_model import LinearRegressionfrom sklearn.model_selection import train_test_splitfrom sklearn.metrics import mean_squared_error, r2_score# 예제 데이터 생성np.random.seed(0)X = np.random.rand(100, 1)y = 2 + 3 * X + np.random.rand(100, 1)# 데이터 분할X_train, X_test, y_tr..

머신러닝 2024.08.19

머신러닝 1-1 ~ 1-3

AI: 인간의 지능을 요구하는 업무를 수행하기 위한 시스템Machine Learning: 관측된 패턴을 기반으로 의사 결정을 하기 위한 알고리즘Deep Learning: 인공신경망을 이용한 머신러닝Data science: AI를 포괄하여 통계학과 컴퓨터공학을 바탕으로 발전한 융합학문Data Analysis: 데이터 집계, 통계 분석, 머신러닝을 포함한 행위 📌 머신러닝(Machine Learning, ML)은 기술 통계 등을 통하여 집계된 정보로 의사결정을 했던 과거와 달리 데이터 수집과 처리 기술의 발전으로 대용량 데이터의 패턴을 인식하고 이를 바탕으로 예측, 분류하는 방법론을 말합니다.  머신러닝: 전체 데이터에서 패턴을 파악하기 위한 방법 머신러닝 종류 Supervised Leaning(지도 학습..

머신러닝 2024.08.08