ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • Python 데이터분석 기초 10 - 웹문서 읽기
    Python 데이터 분석 2022. 11. 1. 12:30

     

    # 웹문서 읽기1
    from urllib.request import urlopen
    import requests
    from bs4 import BeautifulSoup
    
    print('벅스 차트 출력하기 ---')
    url = urlopen("https://music.bugs.co.kr/chart")
    soup = BeautifulSoup(url.read(), 'html.parser')
    # print(soup)
    musics = soup.find_all('td', class_='check')
    # print(musics)
    
    for i, music in enumerate(musics):
        print("{}위 : {}".format(i + 1, music.input['title'])) # input 안의 title 속성 값
        
    print('---------')
    # 웹문서 읽기2
    import urllib.request as req
    url = "https://ko.wikipedia.org/wiki/%EC%9D%B4%EC%88%9C%EC%8B%A0"
    wiki = req.urlopen(url)
    print(wiki)
    soup2 = BeautifulSoup(wiki, 'html.parser')
    # print(soup2)
    
    print(soup2.select('div.mw-parser-output > p > b'))
    result = soup2.select('div.mw-parser-output > p > b')
    
    for a in result:
        # print(a.string)
        if(a.string != None):
            print(a.string)
            
    print('------')
    # 웹문서 읽기3 - daum의 뉴스 정보 읽기
    url = "https://news.daum.net/society#1"
    daum = req.urlopen(url)
    
    soup3 = BeautifulSoup(daum, 'lxml')
    print(soup3.select_one('div > strong > a'))
    data = soup3.select_one('div > strong > a')
    
    for i in data:
        print(i)
        
    print()
    datas = soup3.select('div > strong > a')
    
    for i in datas[:5]:
        print(i)
        
    print()
    datas2 = soup3.findAll('a')
    # print(datas2[:5])
    for i in datas2[10:15]:
        # print(i)
        h = i.attrs['href']
        t = i.string
        print('href:%s, text:%s'%(h, t))
        
        <console>
        벅스 차트 출력하기 ---
    1위 : Nxde
    2위 : ANTIFRAGILE
    3위 : 오지 않는 사람아
    4위 : 사건의 지평선
    5위 : Hype Boy
    6위 : After LIKE
    7위 : 고백연습
    8위 : 자격지심 (Feat. ZICO)
    9위 : Attention
    10위 : 새삥 (Prod. ZICO) (Feat. 호미들)
    11위 : Shut Down
    12위 : Rush Hour (Feat. j-hope of BTS)
    13위 : LOVE DIVE
    14위 : When I Get Old
    15위 : Pink Venom
    16위 : Anti-Hero
    17위 : Dangerously
    18위 : Monologue
    19위 : Lavender Haze
    20위 : FEARLESS
    21위 : Unholy
    22위 : Cookie
    23위 : 다정히 내 이름을 부르면
    24위 : 우린 그렇게 사랑해서
    25위 : I Don’t Think That I Like Her
    26위 : ELEVEN
    27위 : 딱 10CM만
    28위 : 그때로 돌아가
    29위 : LAW (Prod. Czaer)
    30위 : 떠나보낼 준비해 둘걸 그랬어
    31위 : TOMBOY
    32위 : 그라데이션
    33위 : 파노라마
    34위 : The Astronaut
    35위 : 모든 날, 모든 순간 (Every day, Every Moment)
    36위 : 도깨비불 (Illusion)
    37위 : 진심이었던 사람만 바보가 돼
    38위 : 해요 (2022)
    39위 : 그때 그 순간 그대로 (그그그)
    40위 : DICE
    41위 : strawberry moon
    42위 : ILLELLA (일낼라)
    43위 : 우리가 남이 된다면
    44위 : 시든 꽃에 물을 주듯
    45위 : STAR WALKIN' (League of Legends Worlds Anthem)
    46위 : 내가 아니라도
    47위 : 팡파레
    48위 : That's Hilarious
    49위 : 사랑인가 봐
    50위 : 너의 모든 순간
    51위 : Talk that Talk
    52위 : 괜찮을거야
    53위 : FOREVER 1
    54위 : 보고싶었어
    55위 : IT'S YOU (feat. keshi)
    56위 : 정이라고 하자 (Feat. 10CM)
    57위 : Missing You
    58위 : LOVE me
    59위 : 사랑하긴 했었나요 스쳐가는 인연이었나요 짧지않은 우리 함께했던 시간들이 자꾸 내 마음을 가둬두네
    60위 : Snow On The Beach (feat. Lana Del Rey)
    61위 : 나무
    62위 : 사랑은 늘 도망가
    63위 : Paris
    64위 : SNEAKERS
    65위 : Rockabye (feat. Sean Paul & Anne-Marie)
    66위 : 잊혀진 계절
    67위 : Same Scent
    68위 : 나의 X에게
    69위 : Bejeweled
    70위 : You're On Your Own, Kid
    71위 : 그대에게 닿을 때까지
    72위 : Until I Found You
    73위 : Karma
    74위 : Sour Grapes
    75위 : Midnight Rain
    76위 : 시간을 믿어봐
    77위 : 천만분의 1의 확률의 너 (Gravitation)
    78위 : Maroon
    79위 : Sweet Nothing
    80위 : High Infidelity
    81위 : Bigger Than The Whole Sky
    82위 : The Great War
    83위 : Labyrinth
    84위 : Vigilante Shit
    85위 : 알 수 없는 인생
    86위 : 그대의 밤, 나의 아침
    87위 : 그냥 그때
    88위 : Glitch
    89위 : Mastermind
    90위 : Question...?
    91위 : Until I Found You (Piano Version)
    92위 : 그집앞
    93위 : 슬픔이 지나간 자리
    94위 : I Ain't Worried
    95위 : 월광 (FULL MOON)
    96위 : Mermaid
    97위 : Dear Reader
    98위 : Would've, Could've, Should've
    99위 : Show Your Love
    100위 : STUPID LOVE
    ---------
    <http.client.HTTPResponse object at 0x000001F7A5A3FAF0>
    [<b>이순신</b>, <b>여해</b>, <b>충무</b>, <b>죽음을 각오하고 싸우면 무조건 이긴다, 하지만 도망치려 하면 죽는다</b>]
    이순신
    여해
    충무
    죽음을 각오하고 싸우면 무조건 이긴다, 하지만 도망치려 하면 죽는다
    ------
    <a class="link_txt" href="https://v.daum.net/v/20221101122426001">핼러윈데이 저녁 홍대 클럽거리는 ‘시끌벅적’… 국가애도기간에 이래도 되나 ‘눈살’</a>
    핼러윈데이 저녁 홍대 클럽거리는 ‘시끌벅적’… 국가애도기간에 이래도 되나 ‘눈살’
    
    <a class="link_txt" href="https://v.daum.net/v/20221101122426001">핼러윈데이 저녁 홍대 클럽거리는 ‘시끌벅적’… 국가애도기간에 이래도 되나 ‘눈살’</a>
    <a class="link_txt" href="https://v.daum.net/v/20221101122228973">'이태원 참사' 1시간 전 "인파 관리 필요하다" 수차례 경찰 신고접수</a>
    <a class="link_txt" href="https://v.daum.net/v/20221101121800896">'여자는 시골에 못 살아' 이 말에 반기든 언니들 [해시태그 #지역]</a>
    <a class="link_txt" href="https://v.daum.net/v/20221101121433844">[영상] 용산구, 축제 땐 직원 1천명 투입…"핼러윈은 축제 아냐"</a>
    <a class="link_txt" href="https://v.daum.net/v/20221101120933709">[이태원 참사] 네컷 사진엔 환한 얼굴…주인 기다리는 유실물</a>
    
    href:/foreign, text:국제
    href:/culture, text:문화
    href:/digital, text:IT
    href:/series/, text:연재
    href:/photo, text:포토

     

    댓글

Designed by Tistory.