앞 장에선 Requests 모듈에 대해 알아봤다
이번장에선 BeautifulSoup에 대해 알아보자.
BeautifulSoup 모듈이란?
- requests모듈로 HTTP 서버와 통신에 성공해 응답을 했다면 BeautifulSoup으로 HTML소스 내용에 접근해야 한다.
마찬가지로 import를 사용해 BeautifulSoup을 사용하며 bs4로 변환하여 사용한다
---------------------
from bs4 import BeautifulSoup
soup = BeatifulSoup(r.text, 'html.parser')
---------------------
requests에서 받은 소스를 BS에 넘긴후, BS의 기능을 이용해 가공한다.
r은 requsts에서 받은 값의 변수명이며, html.parser은 뒤에 입력해야 값을 가져올 수 있다.
divtag = soup.find("div", class_="num win")
웹에서 원하는 정보를 가지고 있는 HTML코드를 보면 해당 값을 태그 요소가 값을 감싸고 있는 것을 확인할 수 있다.
<div>로또번호는 123</div> 형태로 감싸고 있다.
태그도 a,p,ul,li등등 여러 태그가 존재하는데 얻고자 하는 값을 감싸고 있는 태그와, 그태그들 중 값을 가지고 있는 특정 요소를 지정하기 위해
클래스 같은 값을 옆에 써서 원하는 값만 가져오도록 한다.
for span in divtag.find_all('span'):
lottoNums.append(span.text)
-> divtag로 받아온 정보 중 span으로 되어있는 값을 하나씩 받아 리스트 형식의 lottonNums에 추가하는 코드이다
find_all은 해당 조건에 맞는 모든 태그를 가져오는 것이다.
이렇게 requests로 HTML코드를 받아온뒤, Beautifulsoup로 원하는 태그의 정보값을 가져올 수 있다.
'Develop > python' 카테고리의 다른 글
파이썬 - 별찍기 (0) | 2022.07.07 |
---|---|
Python과 DB 연동 (0) | 2020.01.13 |
Requests 모듈 사용법 (0) | 2020.01.13 |
[Python]모듈이란? (0) | 2020.01.07 |
[파이썬 웹 프로그래밍] 2. 파이썬 웹표준 라이브러리 (0) | 2019.12.28 |