Phthon

[Python] 웹 크롤링 (Beautifulsoup 이용)

KMSEOP 2019. 9. 11. 15:27
728x90

1. 라이브러리 설치

 

필요한 라이브러리 requests, beautifulsoup4

pip install requests
pip install beautifulsoup4

 

2. 테스트 페이지 크롤링

 

https://land.naver.com/article/articleList.nhn?rletTypeCd=A01&tradeTypeCd=A1&hscpTypeCd=A01%3AA03%3AA04&cortarNo=1135010300&mapLevel=10

 

네이버 부동산

[서울시 노원구 공릉동] 아파트 매물

land.naver.com

 

.num2 > .inner .calc_area를 선택하면 전용면적과 공급면적을 얻을 수 있습니다.

import requests
from bs4 import BeautifulSoup

req = requests.get('https://land.naver.com/article/articleList.nhn?rletTypeCd=A01&tradeTypeCd=A1&hscpTypeCd=A01%3AA03%3AA04&cortarNo=1135010300&mapLevel=10') #크롤링할 링크
html = req.text
soup = BeautifulSoup(html, 'html.parser')

data = []
num = len(soup.select('.num > .inner .calc_area'))
for i in range(0, num - 1):
    items = soup.select('.num > .inner .calc_area')[i].text
    result = ''
    for test in items:
        result += test

    result = result.split()  # 공백 제거
    data.append(result)
    print(data)

 

결과

728x90