Python 데이터 분석

네이버웹툰 html 웹 가져오기 예제

코딩탕탕 2022. 11. 1. 16:29

 

import urllib.request as req
from bs4 import BeautifulSoup
import requests

url = "https://comic.naver.com/index"
webtoon = req.urlopen(url)

soup = BeautifulSoup(webtoon, 'html.parser')

# print(soup)

datas =soup.select('ol > li > a')
# print(soup.select('ol > li > a'))

for a in datas:
    if(a.string != None):
        print("{}".format(a.string).strip())
        
<console>
김부장-53화 그게 뭔지 아세요?
내가 키운 S급들-54화 : 대화(1)
여신강림-외전-8화[수아,희경ep]
마루는 강쥐-21화. 마루의 라이벌 등장!
멸망 이후의 세계-제 39 화
하루만 네가 되고 싶어-131. 눈물이 마를 시간은 주세요
중증외상센터 : 골든 아워-외전 2화 : 미친 인턴 (2)
대학원 탈출일지-70화-정신 강화
용사가 돌아왔다-73화 정의호(7)
1을 줄게-57화-마지막화
올가미-149화
그 남주와 이별하는 방법-46화. 왕의 후계자(2)
테러사이트-5화 : 위기
삼국지톡-입촉_38.성도공략전 (1) "유비는 역병입니다!"
랜덤채팅의 그녀!-256. 말하지 않아도
1을 줄게-57화-마지막화
이븐 모어-52화
택배 왔습니다-47화. 죄와벌(2)
붉은 이정표-33화 장군
쿠쿠쿠쿠-27화 기억이 안나요

 

다른 방법

import urllib.request as req
from bs4 import BeautifulSoup
import requests

url2="https://comic.naver.com/index"

webtoon = requests.get(url2).text

soup4 = BeautifulSoup(webtoon, 'html.parser')

#realTimeRankFavorite > li.rank01

datas2 = soup4.find("ol", attrs={"id":"realTimeRankFavorite"}).find_all("li")
    
for i, data in enumerate(datas2):
    d=data.find("a").get_text()
    print("{}위 : {}".format(i+1, d))
    
    
<console>
1위 : 김부장-53화 그게 뭔지 아세요?
2위 : 내가 키운 S급들-54화 : 대화(1)
3위 : 여신강림-외전-8화[수아,희경ep]
4위 : 마루는 강쥐-21화. 마루의 라이벌 등장!
5위 : 멸망 이후의 세계-제 39 화
6위 : 하루만 네가 되고 싶어-131. 눈물이 마를 시간은 주세요
7위 : 중증외상센터 : 골든 아워-외전 2화 : 미친 인턴 (2)
8위 : 대학원 탈출일지-70화-정신 강화
9위 : 용사가 돌아왔다-73화 정의호(7)
10위 : 1을 줄게-57화-마지막화