[리원아빠] 파이썬 urlib 패키지 url 분석 수정
파이썬 urllib 패키지로 url 분석 수정하기 파이썬의 대표적인 기능 중 하나가 웹페이지 크롤링이다. bs 패키지를 사용하면 아주 간단하게 웹페이지를 크롤링할 수 있지만 보다 자세히 심도있게 크롤링을 하기 위해서는 url에 대한 분석과 수정도 필요하다. 이번 포스팅에서는 파이썬에서 제공하는 urllib 패키지를 통해 url을 어떻게 분석하고 수정하는지 알아보자. 먼저 urllib 패키지에서 가장 빈번하게 사용되는 패키지들이다. 이외에도 수십가지의 패키지들이 존재하지만 맛보기식으로 간략하게 알아보도록 하자. unquote => url 주소를 한글로 변환해준다 urlparse => url의 구성 정보를 딕셔너리형태로 분리해준다. parse_qs, parse_qsl => url중 query 형태로 입력되는..
2023.01.05