억대 연봉을 위한 인간수업
Published 2020. 1. 13. 11:49
BeautifulSoup 사용법 Develop/python
반응형

 

 

앞 장에선 Requests 모듈에 대해 알아봤다

이번장에선 BeautifulSoup에 대해 알아보자.

 

 

 

 

 

 

 

BeautifulSoup 모듈이란?

- requests모듈로 HTTP 서버와 통신에 성공해 응답을 했다면 BeautifulSoup으로 HTML소스 내용에 접근해야 한다.

마찬가지로 import를 사용해 BeautifulSoup을 사용하며 bs4로 변환하여 사용한다

 

 

 

---------------------

from bs4 import BeautifulSoup

 

soup = BeatifulSoup(r.text, 'html.parser')

---------------------

 

 

requests에서 받은 소스를 BS에 넘긴후, BS의 기능을 이용해 가공한다.

r은 requsts에서 받은 값의 변수명이며, html.parser은 뒤에 입력해야 값을 가져올 수 있다.

 

 

divtag = soup.find("div", class_="num win")

웹에서 원하는 정보를 가지고 있는 HTML코드를 보면 해당 값을 태그 요소가 값을 감싸고 있는 것을 확인할 수 있다.

<div>로또번호는 123</div> 형태로 감싸고 있다.

태그도 a,p,ul,li등등 여러 태그가 존재하는데 얻고자 하는 값을 감싸고 있는 태그와, 그태그들 중 값을 가지고 있는 특정 요소를 지정하기 위해

클래스 같은 값을 옆에 써서 원하는 값만 가져오도록 한다.

 

 

 

 

for span in divtag.find_all('span'):

lottoNums.append(span.text)

-> divtag로 받아온 정보 중 span으로 되어있는 값을 하나씩 받아 리스트 형식의 lottonNums에 추가하는 코드이다

find_all은 해당 조건에 맞는 모든 태그를 가져오는 것이다.

 

 

 

이렇게 requests로 HTML코드를 받아온뒤, Beautifulsoup로 원하는 태그의 정보값을 가져올 수 있다.

 

 

 

 

반응형

'Develop > python' 카테고리의 다른 글

크로아티아 알파벳(백준 2941번)  (0) 2022.07.01
Python과 DB 연동  (0) 2020.01.13
Requests 모듈 사용법  (0) 2020.01.13
[Python]모듈이란?  (0) 2020.01.07
[파이썬 웹 프로그래밍] 2. 파이썬 웹표준 라이브러리  (0) 2019.12.28
profile

억대 연봉을 위한 인간수업

@회뜨는참치

이 글이 당신에게 조금이라도 도움이 된다면 좋겠습니다.