제육's 휘발성 코딩
반응형

JSOP 라이브러리

// https://mvnrepository.com/artifact/org.jsoup/jsoup
    implementation group: 'org.jsoup', name: 'jsoup', version: '1.14.1'
  • mvnrepository 에서 jsop 라이브러리 받아오기 (gradle 버전)

  • Document : 웹사이트의 모든 소스코드 (HTML, CSS, Javascript 포함)

  • Elements : Document의 특정 범위, 일부 Tag를 담을 수 있다.

  • Element 는 Elements에서 얻은 최종 요소

크롤링캡쳐1

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.select.Elements;

public class Crawler {
    public static void main(String args[]){
        Document document;
        try {
            document = Jsoup.connect("https://www.namgarambooks.co.kr/category/출간 도서 소개").get();
            Elements elements = (Elements) document.select("#container #content #searchList ol li a");
            elements.stream().forEach(name -> System.out.println("name = " + name.text()));
        } catch (Exception e) {
            System.out.println(e.getMessage());
        }
    }
}
  • CSS Select를 이용하여 태그정보를 가져올 경우 태그명을 그대로 적는다. (div태그면 div)
  • id를 기준으로 가져올 때는 #id명
  • class 를 기준으로 가져올 때는 .class명
반응형
profile

제육's 휘발성 코딩

@sasca37

포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요! 맞구독은 언제나 환영입니다^^