:: 게시판
:: 이전 게시판
|
- PGR21 관련된 질문 및 건의는 [건의 게시판]을 이용바랍니다.
- (2013년 3월 이전) 오래된 질문글은 [이전 질문 게시판]에 있습니다. 통합 규정을 준수해 주십시오. (2015.12.25.)
통합규정 1.3 이용안내 인용"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
18/06/08 13:41
구글에 네이버 크롤링이라 검색하니 많이 나오네요
그런데 네이버 자체에서 크롤링을 어느정도 제한하는 거 같기도 하구요
18/06/08 16:06
엑셀의 신까지는 아니고 전에 공기업 근무할 때 무명 고수(?)의 수준까지는 갔는데 엑셀로는 말씀하신 바 이루기 어렵습니다. 그리고 엑셀 고수도 결국 쓰임이 제한돼 있다보니 손속도로 갈리는 사실..?
18/06/08 16:29
엑셀로 하시려면 VBA를 사용할 줄 아셔야 합니다. 이왕이면 VBA에서 직접 Win API 호출을 통해 웹 자료를 긁어오는 것 외에도, MSHTML.dll을 이용해서 인터넷 익스플로러를 VBA에서 바로 제어하는 방법을 안다면 로그인이 필요한 페이지의 내용을 긁어오는 것도 가능하긴 합니다만... 조금 방식이 낡았다고 할 수 있어서, 편리하게 파이썬이나 Go, Node.js 등 (이미 편리한 크롤링 툴들 또는 headless 브라우저와의 연동이 존재하는) 다른 언어로 접근하시는 게 좋다고 생각합니다.
|