: > < " / \ | ? * 등의 예약어는 파일명이 될 수 없음..
import scrapy
class JobSpider(scrapy.Spider):
name = "jobspider"
allowed_domains = ["jobkorea.co.kr"]
start_urls=[
"http://www.jobkorea.co.kr/starter/?schLocal=&schPart=10016&schMajor=&schEduLevel=&schWork=&schCType=&isSaved=1&LinkGubun=0&LinkNo=0&Page=1&schType=0&schGid=0&schOrderBy=0&schTxt="
#"http://www.jobkorea.co.kr"
]
def parse(self, response):
filename = response.url.split("/")[-2]
with open(filename,'wb') as f:
f.write(response.body)
url의 일부를 따와서 파일명으로 만들고 싶다면 위의 예약어가 없는 부분을 골라내야함.
위의 예에선 starter가 파일명이 됨.
https://stackoverflow.com/questions/22620965/ioerror-errno-22-invalid-mode-wb-or-filename
'Python' 카테고리의 다른 글
Scrapy 한글 깨질 때 해결법 (0) | 2018.05.27 |
---|---|
Scrapy response.xpath로 데이터 추출하기 (0) | 2018.05.27 |
Scrapy 데이터 추출하고 수집하기, 파이참에서 (0) | 2018.05.26 |
Scrapy의 구조 크롤링 맛보기 (0) | 2018.05.26 |
윈도우에서 scrapy 설치 및 확인 (0) | 2018.05.26 |