Anaconda Prompt를 켜고(없다면 설치..) conda create -n py27 python=2.7을 입력한다. 설치를 기다린다. 설치가 완료된 뒤
python --version을 입력하면 기존에 사용하던 버전이 나온다. 3.6이라던가..
activate py27을 입력해서 아까 만든 가상 환경을 실행하고 python --version을 입력한다 그러면 python2.7.x.가 나온다.
가상환경을 종료하려면 deactivate py27 입력
scrapy를 설치할 때 lxml 라이브러리가 필요하다. https://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml 여기로 이동해서 운영체제 비트 수에 맞는 파일을 받는다 32비트면
64비트면
다운로드 폴더에 들어가서 해당 파일을 잘라내기 한 뒤 C:\사용자\xx 에 붙여넣기 한다. 이 곳이 홈에 해당하기 때문이다.
명령창으로 이동해서 pip install lxml-4.2.1-cp27-cp27m-win_amd64.whl을 입력한다. 파일명은 바뀔 수 있다. pip install lxml까지만 치고 tab키를 누르면 자동 완성된다.
pip install pypiwin32 명령어로 pypiwin32를 설치해야 한다. 설치가 다 되면 python 2.7 compiler를 설치해야 한다.
http://www.microsoft.com/en-us/download/details.aspx?id=44266
설치가 완료되면
다시 명령창으로 이동해서 pip install Scrapy를 입력해서 scrapy를 설치한다.
설치가 되면
pip install selenium을 입력해서 설치한다. selenium은 자동화 브라우저 라이브러리이다. 크롬에서 제공하는 드라이버를 설치해야 한다.
https://sites.google.com/a/chromium.org/chromedriver/downloads
설치하고 압축을 푼 뒤 드라이버를 C:\사용자\xx에 이동시킨다.
동작 테스트
scrapy shell "http://www.naver.com"
response.text 를 입력하면 해당 url의 html 소스코드를 얻어 올 수 있다. exit()으로 나온다.
pip install ipython으로 설치 후 ipython 입력
from selenium import webdriver
browser = webdriver.Chrome("C:\Users\xx\chromedriver.exe") 입력하면 크롬 창이 하나 뜬다
browser.get("http://www.naver.com") 입력하면 네이버가 들어가진다.
browser.quit()을 입력하면 브라우저가 꺼지고
exit()을 입력하면 selenium이 종료된다.
출처 https://www.youtube.com/watch?v=uTDjtDVVXR4 http://nittaku.tistory.com/134
'Python' 카테고리의 다른 글
Scrapy 데이터 추출하고 수집하기, 파이참에서 (0) | 2018.05.26 |
---|---|
Scrapy의 구조 크롤링 맛보기 (0) | 2018.05.26 |
우분투에서 크롤링하기 위한 설치 (0) | 2018.05.25 |
네이버 홈 section_navbar 크롤링 초간단 (0) | 2018.05.23 |
웹 크롤러 (0) | 2018.05.06 |