Canvas of Bliss

*재무제표 :

*PER 

*PBR

*ROE 

 

*크롤링: 우리가 흔히 부르는 웹 크롤러 크롤링의 정식명칭은 'Web Scraping'

"Web scraping is a computer software technique of extracting information from websites."

-> 웹 크롤링이란 컴퓨터 소프트웨어 기술로 웹 사이트들에서 원하는 정보를 추출하는 것

웹 크롤러란 인터넷에 있는 웹페이지를 방문해서 자료를 수집하는 일을 하는 프로그램

한 페이지만 방문하는 것이 아니라 그 페이지에 링크되어 있는 또 다른 페이지를 차례대로 방문하고 이처럼 링크를 따라 웹을 돌아다니는 모습이 마치 거미와 비슷하다고 해서 스파이더라고 부르기도 함 

청난 분량의 웹문서를 사람이 일일 구별해서 모으는 일은 불가능 가깝기 때문에 웹 문서 검색에서는 사람이 일일이 하는 대신 이를 자동으로 수행해 줍니다.

 

웹은 기본적으로 HTML 형태로 되어 있는데, 해당 정보가 HTML 형태로 어떻게 보여지는지도 '페이지 소스 보기' 또는 '개발자 검사' 로 볼 수 있다. 이런 소스들은 보통 개발자들이 어떤 정형화된 형태로 관리하고 있기 때문에 규칙이 생기는데 이런 규칙을 분석해서 우리가 원하는 정보들만 뽑아오는 것을 웹 크롤링 작업이다.

 

'빅데이터' 카테고리의 다른 글

데이터  (0) 2020.08.11

이 글을 공유합시다

facebook twitter kakaoTalk kakaostory naver band