인스타그램 크롤링, 이미지 다운로드 (1)

인스타그램 게시물 이미지 다운로드

 

 

크롤링을 통해 인스타그램 내 게시물의 이미지를 다운로드하는 과정에 대해 다뤄보고자 한다.

 

크롤링을 수행하기 위해 파이썬, 셀레니움, 크롬 브라우저가 설치된 환경에서 진행한다.

 

또한, 크롬 브라우저 환경에서는 크롬 드라이버가 요구되니 이전 게시물을 참고하여 사전에 설치한다.

 

 

[유틸리티 설치/기타] - 크롬드라이버 최신버전 설치하는 방법

 

크롬드라이버 최신버전 설치하는 방법

크롬드라이버 최신버전 설치방법 크롬드라이버(Chromedriver)는 크롬 브라우저를 통해 웹 크롤링을 수행할 때, 반드시 필요한 프로그램이다. 크롬드라이버 114 버전까지는 공식홈페이지의 정리된

proefforter.tistory.com

 

 

* 크롬드라이버를 설치했다면, 파이썬 프로젝트 폴더 내에 드라이버를 위치해야 한다.

 

 

파이썬 코드

from selenium import webdriver
from selenium.webdriver.common.by import By
import requests

# 크롤링할 인스타그램 url 사용자 입력
url = input("url : ")

# 크롬 웹드라이버 구동 및 기본설정
driver = webdriver.Chrome()
driver.implicitly_wait(10)
driver.get(url)

# 게시물내 이미지 클래스명으로 찾기
image = driver.find_element(By.CLASS_NAME,"x5yr21d.xu96u03.x10l6tqk.x13vifvy.x87ps6o.xh8yej3")

# 이미지 주소 저장
image = image.get_attribute('src')

# 이미지 다운로드
response = requests.get(image)
filename = 'image.jpg'
with open(filename, 'wb+') as f:
    f.write(response.content)

print("사진 수집이 완료되었습니다.")

 

인스타그램의 게시물 주소만 입력하면, 게시물의 이미지를 자동으로 다운로드하는 파이썬 크롤링 코드이다.

 

해당 코드를 컴파일 한 뒤, 콘솔창에 다운로드하고자 하는 게시물의 url만 입력하면 된다.

 

 

 

사용예제

1.PNG
픽사베이 인스타그램 계정

 

 

저작권 없는 이미지를 제공하는 플랫폼인 픽사베이 계정의 게시물을 크롤링할 것이다.

 

우측 하단의 노란색 나비사진의 게시물을 클릭한다.

 

( 실제로 사용할때는 자신이 원하는 인스타그램의 게시물을 대상으로 아래의 과정처럼 사용하면 된다. )

 

2.PNG
게시물 URL 얻기

 

게시물을 클릭하면 상단 주소창에 게시물의 주소가 출력된다.

 

해당 주소를 클립보드에 복사해놓는다.

 

3.PNG
URL 입력

 

위에서 기재해 놓은 코드를 컴파일 한 뒤, 콘솔창에 복사한 게시물 주소를 붙여 넣은 뒤 엔터를 누른다.

 

4.PNG
이미지 다운 완료

 

몇 초의 시간 뒤, 파이썬 프로젝트 폴더 내에 이미지 파일이 생성된다.

 

imageaaa.jpg
이미지

 

이미지를 열어보면, 이전 게시물의 노란색 나비 이미지를 정상적으로 다운로드한 것을 확인할 수 있다.

 

 


 

궁금한 사항이나 질문, 피드백 등 의견을 댓글로 남겨주시면 답변드리겠습니다.

감사합니다.