본문 바로가기 메뉴 바로가기

컴맹 : 진화의 시작

프로필사진
  • 글쓰기
  • 관리
  • 태그
  • 방명록
  • RSS

컴맹 : 진화의 시작

검색하기 폼
  • 전체보기.. (876)
    • readme.md (1)
    • 사설 (11)
    • 개발 (473)
      • 개인 프로젝트 (13)
      • IT 컨퍼런스 후기 (25)
      • Linux (88)
      • Cloud (Alibaba) (4)
      • Cloud (AWS) (20)
      • Cloud (GCP) (48)
      • 기계학습 (13)
      • Network (18)
      • PHP (20)
      • python (32)
      • kubernetes (4)
      • docker (13)
      • IaC (10)
      • Vault (2)
      • Apache Airflow (7)
      • Java (1)
      • Node.js (7)
      • Vue.js (2)
      • DB (30)
      • GNU Build System (3)
      • 버전관리시스템 (15)
      • Shell Script (14)
      • Compile error (9)
      • 운영체제 (16)
      • CI.CD (1)
      • tools (15)
      • UML (10)
      • Link (18)
      • 길 잃은 게시물 (15)
    • 생활 (387)
      • 내 집 마련하기 (5)
      • 아빠일기 (0)
      • 주절주절 (172)
      • 리뷰 (39)
      • 외식 (20)
      • 책 (121)
      • 여행 (16)
      • 회고 (10)
      • 블로그 결산 (2)
      • 요리 (1)
      • 잡동사니 (1)
    • 비공개 (1)
      • -----아래는 비공개----- (1)
      • 코드 (0)
      • 임시 (0)
      • FS : 회사 대외비 (0)
      • Wedding : 준비 과정 (0)
      • 개인정보 (0)
  • 방명록

셀레니움 (1)
웹크롤러 scrapy를 소개합니다

scrapy는 웹사이트에서 필요한 데이터를 추출하는 오픈소스 프레임워크입니다. 네, 많고 많은 crawler 중에 하나입니다. 혹시 듣보잡 아니냐고요? 네, 뭐 구글 트렌드로 다른 크롤러와 비교해보면 크게 뒤떨어지는 건 사실입니다. (지난 5년간 대한민국 기준 트렌드 자료입니다. 파란색이 selenium, 노란색이 beautifulsoup, 빨간색이 scrapy) GitHub에 Star를 인기의 척도라고 본다면 scrapy는 상당히 인기 있는 프레임워크로 볼 수 있습니다. 이 말인즉, 개발자에게는 꽤나 인기 있는 크롤러라는 겁니다. 아래를 보세요. 스타 수가 무려 41.1k 개고 아직도 활발히 개발되고 있습니다. scrapy는 가볍고, 빠르고, 확장성이 좋습니다. 개발자는 파이썬 기반으로 spider라고..

개발/python 2021. 7. 15. 16:43
이전 1 다음
이전 다음
최근에 올라온 글
최근에 달린 댓글
글 보관함
Total
Today
Yesterday

Blog is powered by Tistory / Designed by Tistory

티스토리툴바