728x90
반응형
SMALL
과제.
- https://www.genie.co.kr/chart/top200
- 지니차트 200위까지 크롤링
- 깃허브에 레퍼지토리를 만들어서 내보내기
import time
data = []
for i in range(1, 5):
url = f'https://www.genie.co.kr/chart/top200?ditc=D&ymd=20230601&hh=13&rtm=Y&pg={i}'
header = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)'}
request = requests.get(url, headers=header)
soup = BeautifulSoup(request.text, 'html.parser')
table = soup.find('table', {'class':'list-wrap'})
titles = table.find_all('a', {'class': 'title ellipsis'})
artists = table.find_all('a', {'class': 'artist ellipsis'})
for j in range(len(titles)):
title = titles[j].text.strip()
artist = artists[j].text.strip()
# print('{0:3d}위 {1} - {2}'.format((i - 1) * 50 + j + 1, artist, title))
dic = {'rank': (i - 1) * 50 + j + 1, 'title': title, 'artist': artist}
# print(dic)
data.append(dic)
# 다음 페이지로 이동하기 전에 1초간 대기
time.sleep(1)
import pandas as pd
df = pd.DataFrame(data, index=None)
df
df.to_excel('genie_chart Top200.xlsx')
😎 결과 깃허브
728x90
반응형
LIST
'KDT > 과제' 카테고리의 다른 글
[파이썬, Python] OpenCV - 동영상 필터 입히기 (0) | 2023.09.02 |
---|---|
[파이썬, Python] OpenCV - 원하는 ROI 설정 후 투시변환하기 (0) | 2023.08.30 |
[파이썬, Python] OpenCV - 동영상 2개를 이어 재생하기! (0) | 2023.08.24 |
[파이썬, Python] 알고리즘 - 1️⃣ 재귀호출(recursive call) (0) | 2023.06.29 |
[파이썬, Python] 서브워드분리(subword segmentation) - WordPiece Tokenizer (0) | 2023.06.29 |