NGMsoftware

NGMsoftware
로그인 회원가입
  • 커뮤니티
  • 강좌 노하우
  • 커뮤니티

    사용자가 직접 강좌와 노하우를 작성하는 공간입니다.

    강좌 노하우

    사용자가 직접 강좌와 노하우를 작성하는 공간입니다.


    스크립트 네이버 블로그의 포스트를 웹크롤링으로 가져오는 방법.

    페이지 정보

    본문

    안녕하세요. 엔지엠소프트웨어입니다. 잘 모르시는 분들이 계셔서 네이버 블로그 포스트 내용을 크롤링하는 방법을 알려드리도록 하겠습니다~ 사실 대부분의 사이트들이 편리함과 유지 보수성 및 개발 생산성을 위해 iframe을 많이 사용하고 있습니다. 여러가지 단점을 가지고 있는데도 말이죠^^; 참고로 전... iframe을 싫어합니다-_-; 초창기 웹시절부터 개발해오다 한동안 웹과 인연을 끊었었는데요. iframe은 사용하지 말자는 의견들이 지배적이었던때가 있었습니다. 아... 헛소리는 그만할께요^^;

    img.gif

     

     

    엔지엠의 웹 크롤링을 이용해서 iframe안에 숨겨져 있는 내용을 가져오려면 인스턴트 모드로는 안됩니다. (Http request의 한계로 인해...) 그래서 셀레니움을 이용해야 하죠. 셀레니움을 이용한다는 말은 웹API의 "연결"을 사용해야 한다는 뜻입니다. 아래와 같이 연결을 하나 추가하세요^^ 그리고, 아이디 및 웹드라이버와 블로그 주소를 설정합니다.

    img.png

     

     

    해당 블로그의 프레임 아이디를 알아야겠죠? 크롬을 사용중이라면 F12를 눌러서 개발자 모드로 전환하세요. 그리고, 단축키 Ctrl+Shift+C를 누른 후 웹페이지 아무곳이나 클릭합니다. 그러면 우측에 html이 표시됩니다. 여기서 가장 위에 iframe의 아이디를 복사해주세요.

    img.png

     

     

    웹크롤러를 추가하고, 아래 그림과 같이 iframe을 사용함으로 설정하세요. 그리고, 블로그 포스트 주소를 넣어줍니다. 물론, 위에서 복사한 iframe의 ID도 같이 넣어줘야 합니다.

    img.png

     

     

    실행해보면 실제 모든 내용이 표시되는 것을 알 수 있습니다. 예제 스크립트를 첨부했으니 참고해서 해보세요^^;

    img.png
    • 네이버 공유하기
    • 페이스북 공유하기
    • 트위터 공유하기
    • 카카오스토리 공유하기
    추천0 비추천0

    첨부파일

    댓글목록

    profile_image

    시네라리아님의 댓글

    no_profile 시네라리아 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 작성일 Date

    앗 ㅋㅋ 한발 늦었습니다 안그래도  예제 하나 만들려고 보고 있는중이였는데 ㅎ
    잘보겠습니다 ^^

    profile_image

    여리여리님의 댓글

    no_profile 여리여리 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 작성일 Date

    좋은 내용 잘 봤습니다 ^^ 응용하면 수도없이 많은 페이지들을 쓱 해올 수 있겠네요

    profile_image

    지유아빠님의 댓글

    no_profile 지유아빠 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물 작성일 Date

    감사합니다. 참고할게요~!