본문 바로가기
728x90
반응형
SMALL

Python106

[파이썬, Python] OpenCV - 영상(Image)과 영상의 입출력, 복사하기 1. 영상(Image) 1-1. 픽셀(pixel) 이미지를 구성하는 가장 작은 단위 바둑판 모양의 격자에 나열되어 있는 형태, 2차원 행렬 1-2. 그레이스케일 영상 흑백사진처럼 색상 정보가 없는 영상 밝기 정보만으로 구성된 영상 밝기 정보는 256단계로 표현(0 ~ 255) numpy.uint8 = 8bit = 1byte uint8(unsigned 8-bit integer): 음수 값을 허용하지 않음(0~255) 용량 = 가로크기 * 세로크기 = 28 * 28 = 784bytes(28픽셀일 때) import cv2 img_gray = cv2.imread('dog.bmp', cv2.IMREAD_GRAYSCALE) print('img_gray type: ', type(img_gray)) # print('i.. 2023. 7. 24.
[파이썬, Python] 컴퓨터 비전과 OpenCV 라이브러리 1. 컴퓨터 비전(Computer Vision) 컴퓨터를 사용하여 디지털 이미지나 비디오에서 정보를 추출하고, 해석하는 기술과 분야 이미지 처리, 객체 탐지, 패턴 인식, 광학 문자 인식(OCR)... 2. OpenCV(Open Sourece Computer Vision Library) 컴퓨터 비전과 이미지 처리를 위한 오픈소스 라이브러리 1999년 Intel에서 영상처리 기술을 개발하기 위한 목적 2000년 BSD 라이센스 배포 2011년 이후 OpenCV2로 개발 시작 1-1. OpenCV 설치 1️⃣ 터미널에서 설치 pip install opencv-python 📍 cv2라는 이름이 아닌 opencv-python 2️⃣ Settings에서 설치 import cv2 # opencv 버전 알아보기 pr.. 2023. 7. 24.
[파이썬, Python] 워드 임베딩 구축하기! import pandas as pd import numpy as np from sklearn.datasets import fetch_20newsgroups 1. 데이터 전처리 # 영어 말뭉치 데이터셋 # remove=('header','footer','quotes')을 삭제한 데이터만 가져옴 dataset = fetch_20newsgroups(shuffle=True, random_state=10, remove=('headers','footers','quotes')) # dataset # dataset.data dataset = dataset.data dataset[0] # 데이터셋 총 개수 len(dataset) >>> 11314 # document 필드를 가진 데이터프레임으로 변환 news_df = p.. 2023. 7. 23.
[파이썬, Python] 워드 임베딩(Word Embedding) - Word2Vec(C-BOW, Skipgram), FastText, GloVe 1. 워드 임베딩(Word Embedding) 단어를 컴퓨터가 이해하고, 효율적으로 처리할 수 있도록 단어를 벡터화 하는 기술 단어를 밀집 벡터(실수 값으로 이루어진 벡터)의 형태로 표현하는 방법 워드 임베딩 과정을 통해 나온 결과를 임베딩 벡터라고 함 워드 임베딩을 거쳐 잘 표현된 단어 벡터들은 계산이 가능하며, 모델에 입력으로 사용할 수 있음 1-1. 인코딩(Encoding) 기계는 자연어를 이해할 수 없기 때문에 데이터를 기계가 이해할 수 있도록 숫자 등으로 변환해주는 작업 자연어처리에서는 자연어를 수치화된 벡터로 변환하는 작업 1-2. 희소 표현(Sparse Representation) 원-핫 인코딩을 통해서 나온 원-핫 벡터들은 표현하고자 하는 단어의 인덱스의 값만 1이고, 나머지 인덱스에는 전.. 2023. 7. 23.
[Python, 파이썬] Flask 와 FastAPI - 웹 프레임워크 1. Flask 2010년에 Armin Ronacher에 의해 개발된 경량 웹 프레임워크 Flask는 최소한의 추상화를 제공하면서도 유연하고 확장 가능한 방식으로 웹 어플리케이션을 구축할 수 있음 [플라스크 홈페이지] 더보기 https://flask.palletsprojects.com/en/2.3.x/ Welcome to Flask — Flask Documentation (2.3.x) flask.palletsprojects.com 1-1. 예제 다루기 ✅ 새로운 프로젝트에 'app.py' 파일 생성 ✅ Flask 패키지 설치 app = Flask(__name__) # __name__: 스페셜메소드(이 프로그램의 이름을 알려줌), 외부에서 임포트를 할 경우에는 외부 파이썬 파일의 이름이 들어옴 @app.r.. 2023. 7. 21.
[파이썬, Python] 자연어처리 - 유사도 측정 실습 ✅ 예시 문장 sen_1 = '오늘 점심에 배가 너무 고파서 밥을 너무 많이 먹었다.' sen_2 = '오늘 점심에 배가 고파서 밥을 많이 먹었다.' sen_3 = '오늘 배가 너무 고파서 점심에 밥을 너무 많이 먹었다.' sen_4 = '오늘 점심에 배가 고파서 비행기를 많이 먹었다.' sen_5 = '어제 저녁에 밥을 너무 많이 먹었더니 배가 부르다.' sen_6 = '이따 오후 9시에 출발하는 비행기가 3시간 연착 되었다고 하네요.' sen_1, sen_2: 의미가 유사한 문장 간 유사도 계산(조사를 생략) sen_1, sen_3: 의미가 유사한 문장 간 유사도 계산(순서 변경) sen_2, sen_4: 문장 내 단어를 임의의 단어로 치환한 문장과 원본 문장간의 유사도 계산 sen_1, sen_5:.. 2023. 7. 7.
[파이썬, Python] 임베딩(Embedding) - 임베딩 이론 1. 자연어의 특성 자연어를 기계가 처리하도록 하기 위해서는 먼저 자연어를 기계가 이해할 수 있는 언어로 바꾸는 방법을 알아야 함 토큰화 작업의 결과인 단어 사전을 기계가 이해할 수 있는 언어로 표현하는 과정이고 단어 사전 내 단어 하나를 어떻게 표현할까의 문제로 볼 수 있음 1-1. 단어의 유사성과 모호성 대부분의 언어에서 단어의 의미는 유사성과 모호성을 가지고 있는데 단어는 겉으로 보이는 형태인 표제어안에 여러가지 의미를 담고 있음 대부분 사람은 주변 정보에 따라 숨겨진 의미를 파악하고 이해할 수 있으나 기계는 학습의 부재 또는 잘못된 데이터로 의미를 파악하지 못하는 경우가 있음 한 가지 형태의 단어에 여러 의미가 포함되어 생기는 중의성 문제는 자연어 처리에서 매우 중요함 동형어와 다의어 동형어(동음.. 2023. 7. 7.
[파이썬, Python] 자연어처리 - 데이터 전처리 실습하기! 1. 데이터 전처리 실습 # 뉴스 기사 크롤링 라이브러리 !pip install newspaper3k # 불러오기 import newspaper # 라이브러리 지원 언어들 보기 newspaper.languages() # 웹 기사의 내용, 제목, 작성자, 날짜 등과 같은 다양한 정보를 추출 from newspaper import Article ✅ 기사의 URL을 가져와 읽어들이기 URL = 'https://v.daum.net/v/20230623105401779' article = Article(URL, language='ko') ✅ 기사 다운로드하고 파싱하기 - 제목과 내용 article.download() article.parse() # 제목과 내용을 파싱하여 가져옴 print('title:', arti.. 2023. 7. 6.
728x90
반응형
LIST