본문 바로가기
728x90
반응형
SMALL

Python/ML&DL19

[파이썬, Python] 파이토치(Pytorch)란❓ & 파이토치의 특징 알아보기!🧐 1. 파이토치(PyTorch) 딥 러닝과 기계 학습을 위한 오픈 소스 프레임워크 Python 기반의 과학 계산 패키지인 토치(Torch)를 기반으로 개발 텐서 연산과 자동 미분을 위한 기능을 제공하여 신경망 모델의 구성, 학습, 추론을 쉽게 구현 2. 파이토치의 특징 2-1. 장점 설치가 간편 이해와 디버깅이 쉬운 직관적이고 간결한 코드로 구성 Define by Run 방식을 기반으로 한 실시간 결과값을 시각화 파이썬 라이브러리(Numpy, Scipy, Cython)와 높은 호환성 Winograd Convolution Algorithm 기본 적용을 통한 빠른 모델 훈련이 가능 모델 그래프를 만들 때 고정상태가 아니기 때문에 언제든지 데이터에 따라 조절이 가능 Numpy스러운 Tensor연산이 GPU로도 .. 2023. 6. 23.
[파이썬, Python] 평가지표 - MSE, MAE, RMSE 1. MSE(Mean Squared Error, 평균 제곱근 오차) 예측값과 실제값의 차이에 대한 제곱에 대하여 평균을 낸 값 p = np.array([3,4,5]) # 예측값 act = np.array([1,2,3]) # 실제값 (오차가 있는것!) def my_mse(pred, actual): return ((pred-actual) ** 2).mean() my_mse(p, act) # 수가 크던 작던 상관x, 다른 값과 비교대상으로 사용하기 위함(상대적으로 적은 값이 더 실제값과 가깝다라고 평가) >>> 4.0 2. MAE(Mean Absolute Error, 평균 절대값 오차) 예측값과 실제값의 차이에 대한 절대값에 대하여 평균을 낸 값 절대값은 미분하기 어렵기때문에 MAE 평가지표를 머신러닝, 딥러.. 2023. 6. 23.
[파이썬, Python] 머신러닝 - 7️⃣ KMeans 1. 클러스터(Clusters) 비슷한 특성을 가지고 있는 항목들을 함께 그룹화 클러스터링은 주어진 데이터를 특정 기준에 따라 여러 그룹으로 분류하는 작업 비슷한 특성을 가진 데이터끼리 클러스터를 형성하고, 서로 다른 클러스터들 간에는 구분되는 특성을 가짐 import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt from sklearn.datasets import make_blobs # 가상의 클러스터를 생성하여 분류나 군집 문제를 위한 가상 데이터셋을 생성 ✅ 가상의 데이터셋을 생성하여 클러스터 예제를 실습하여보자. # X: 독립변수 # y: 종속변수 # n_samples=100: 100개의 행.. 2023. 6. 19.
[파이썬, Python] 머신러닝 - 6️⃣ LightGBM 📄 예제에 사용한 파일 1. credit 데이터셋 알아보기 import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt credit_df = pd.read_csv('/content/drive/MyDrive/KDT/Python/4.머신러닝 딥러닝/credit.csv') credit_df ✅ 컬럼 수를 최대 30개로 보기 pd.set_option('display.max_columns', 30) credit_df ✅ credit_df 정보 보기 credit_df.info() ✅ 개인정보와 같이 모델학습에 필요없는 피쳐를 삭제 credit_df.drop(['ID','Customer_ID'.. 2023. 6. 18.
[파이썬, Python] 머신러닝 - 5️⃣ 랜덤 포레스트(Random Forest) 📄예제에 사용한 파일 1. hotel 데이터셋 살펴보기 import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt hotel_df = pd.read_csv('/content/drive/MyDrive/KDT/Python/4.머신러닝 딥러닝/hotel.csv') hotel_df.head() ✅ hotel_df의 정보 보기 hotel_df.info() ✅ 모델 학습에 필요 없는 피쳐 삭제하기 hotel_df.drop(['credit_card', 'name', 'email', 'phone-number', 'reservation_status_date'], axis=1, inplace=Tr.. 2023. 6. 18.
[파이썬, Python] 머신러닝 - 4️⃣ 서포트 벡터 머신(Support Vector Machine) 📄사용할 예제 - sklearn의 손글시 데이터셋 [데이터셋 정보] https://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_digits.html sklearn.datasets.load_digits Examples using sklearn.datasets.load_digits: Recognizing hand-written digits Recognizing hand-written digits A demo of K-Means clustering on the handwritten digits data A demo of K-Means clustering... scikit-learn.org 1. 손글씨 데이터셋 살펴보기 from sklearn.. 2023. 6. 18.
[파이썬, Python] 머신러닝 - 3️⃣ 로지스틱 회귀(Logistic Regression) 📄 예제에 사용한 파일 1. hr 데이터셋 살펴보기 import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt from google.colab import drive hr_df = pd.read_csv('/content/drive/MyDrive/KDT/Python/4.머신러닝 딥러닝/hr.csv') hr_df.head() ✅ 데이터셋 정보 알아보기 hr_df.info() ✅ 데이터셋의 수치형 데이터 정보 알아보기 hr_df.describe() ✅ 작년의 고과점수와 승진 확률에 대해 시각화하여 알아보기 sns.barplot(x='previous_year_rating', y='is_.. 2023. 6. 15.
[파이썬, Python] 머신러닝 - 2️⃣ 의사결정나무(Decision Tree) 📄 예제에 사용한 파일 1. bike 데이터셋 살펴보기 import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt bike_df = pd.read_csv('/content/drive/MyDrive/KDT/Python/4.머신러닝 딥러닝/bike.csv') bike_df bike_df.info() ✅ bike_df의 컬럼 정보 알아보기 ✅ 수치형 데이터의 정보 알아보기 bike_df.describe() ✅ bike_df의 대여개수(Count)의 데이터 수를 시각화하여 알아보기 sns.displot(x=bike_df['count']) 📍 대여수가 0 쪽으로 데이터가 몰려있음 ✅ bo.. 2023. 6. 14.
728x90
반응형
LIST