Python/data2 크롤링(Beautiful Soup) Beautiful Soup도서 쪽수 가져오기 파서(parser) - 입력 데이터를 받아 데이터 구조를 만드는 소프트웨어 라이브러리파싱(parsing) - 위와 같은 과정html.parser - 파이썬에 기본 내장된 HTML 파서 find() : 지정된 이름을 가진 첫 번째 태그를 찾음- 첫 번째 매개변수 : 찾을 태그 이름 지정- attrs 매개변수 : 찾으려는 태그의 속성을 딕셔너리로 지정class 속성이 gd_name인 태그를 찾아라 prd_link를 딕셔너리 처럼 사용해서 태그 안의 속성을 참조한다이 방법으로 링크 주소인 href 속성의 값을 얻는다 id 속성이 infoset_specific인 div태그 찾기상세 페이지 안에서 항상 유일한 것인지 확인해야함 : HTML 태그를 특정할 수 있어.. 2023. 1. 18. 웹 기반 API(JSON, XML) API란 - Application Programming Interface - 두 프로그램이 서로 대화하기 위한 방법을 정의한 것 웹 브라우저 -> 웹 서버 : 웹 데이터 요청(HTTP) 웹 서버 -> 웹 브라우저 : 웹 데이터 전송(HTML) : HTTP 프로토콜을 사용해 웹 페이지를 구성하는 HTML 데이터를 주고 받음. HTTP 프로토콜(통신규약)을 사용해 API를 만드는 것이 웹 기반 API 웹 기반 API를 사용하는 방법을 아는 것이 중요. 웹 기반 API 프로그램 A -> 프로그램 B : 데이터 요청(HTTP) 프로그램 B -> 프로그램 A : 데이터 전송(CSV, JSON, XML) : HTML은 구조가 복잡해서 다른 걸 선호, 프로그램 간의 약속대로 전송하는API에서는 적절하지 않음. JSO.. 2023. 1. 14. 이전 1 다음