-
네이버웹툰 html 웹 가져오기 예제Python 데이터 분석 2022. 11. 1. 16:29
import urllib.request as req from bs4 import BeautifulSoup import requests url = "https://comic.naver.com/index" webtoon = req.urlopen(url) soup = BeautifulSoup(webtoon, 'html.parser') # print(soup) datas =soup.select('ol > li > a') # print(soup.select('ol > li > a')) for a in datas: if(a.string != None): print("{}".format(a.string).strip()) <console> 김부장-53화 그게 뭔지 아세요? 내가 키운 S급들-54화 : 대화(1) 여신강림-외전-8화[수아,희경ep] 마루는 강쥐-21화. 마루의 라이벌 등장! 멸망 이후의 세계-제 39 화 하루만 네가 되고 싶어-131. 눈물이 마를 시간은 주세요 중증외상센터 : 골든 아워-외전 2화 : 미친 인턴 (2) 대학원 탈출일지-70화-정신 강화 용사가 돌아왔다-73화 정의호(7) 1을 줄게-57화-마지막화 올가미-149화 그 남주와 이별하는 방법-46화. 왕의 후계자(2) 테러사이트-5화 : 위기 삼국지톡-입촉_38.성도공략전 (1) "유비는 역병입니다!" 랜덤채팅의 그녀!-256. 말하지 않아도 1을 줄게-57화-마지막화 이븐 모어-52화 택배 왔습니다-47화. 죄와벌(2) 붉은 이정표-33화 장군 쿠쿠쿠쿠-27화 기억이 안나요
다른 방법
import urllib.request as req from bs4 import BeautifulSoup import requests url2="https://comic.naver.com/index" webtoon = requests.get(url2).text soup4 = BeautifulSoup(webtoon, 'html.parser') #realTimeRankFavorite > li.rank01 datas2 = soup4.find("ol", attrs={"id":"realTimeRankFavorite"}).find_all("li") for i, data in enumerate(datas2): d=data.find("a").get_text() print("{}위 : {}".format(i+1, d)) <console> 1위 : 김부장-53화 그게 뭔지 아세요? 2위 : 내가 키운 S급들-54화 : 대화(1) 3위 : 여신강림-외전-8화[수아,희경ep] 4위 : 마루는 강쥐-21화. 마루의 라이벌 등장! 5위 : 멸망 이후의 세계-제 39 화 6위 : 하루만 네가 되고 싶어-131. 눈물이 마를 시간은 주세요 7위 : 중증외상센터 : 골든 아워-외전 2화 : 미친 인턴 (2) 8위 : 대학원 탈출일지-70화-정신 강화 9위 : 용사가 돌아왔다-73화 정의호(7) 10위 : 1을 줄게-57화-마지막화
'Python 데이터 분석' 카테고리의 다른 글
Python 데이터분석 기초 14 - 기상청 제공 날씨정보 XML 자료 읽기 (0) 2022.11.01 Python 데이터분석 기초 13 - BeautifulSoup으로 XML 문서 처리 (0) 2022.11.01 Python 데이터분석 기초 12 - 네이버 제공 코스피 정보를 읽어 csv 파일로 저장 (0) 2022.11.01 Python 데이터분석 기초 11 - 일정 시간 마다 웹 문서 읽기 (0) 2022.11.01 Python 데이터분석 기초 10 - 웹문서 읽기 (0) 2022.11.01