[PHP] 스크래핑 작업(nuskin)

[PHP] 스크래핑 작업(nuskin)

개발환경 : PHP5 CLI, MySQL
요구사항 : 각 분류에 대한 처리, 상세페이지에서 설명과 이미지 저장

사용자 삽입 이미지

해당 사이트를 어느 부분을 캡쳐한 부분 입니다.
해당 사이트에서의 정보를 일정 부분 취득하기를 원하기에 해당 사이트의 정보를 가지고 작업을 하였습니다.

사용자 삽입 이미지


목록이 구성되어 있으며 해당 목록페이지에 묶음 상품도 있어서 해당 내역도 처리를 해야 합니다.
일반 상품과 묶음상품을 구분해서 분류를 확장해야 하며, 일반 상품이 소속된 분류도 처리를 해야 합니다.

사용자 삽입 이미지


제품 상세 페이지 이며, 해당 페이지에서도 원하는 부분만을 가지와 와서 처리를  해야 하는 작업입니다.
원하는 부분이 있고, 원하는 않은 부분이 있기에 잘 구분해서 원문을 이상없이 수집하는 규칙에 맞게 설정을 해서 수집을 해야 합니다.

사용자 삽입 이미지


위 사진은 수집한 부분에서 일정부분을 화면 캡쳐 한 사진 입니다.
위에서 처럼 각 부분을 가지고 해서 처리를 해야 하는 일입니다.

사용자 삽입 이미지


이번에는 작업이 다른것은 이미지 파일 이름을 임의로 변경을 하지 않고, 그대로 유지한채로 가져서 local에 저장을 해서 처리를 할 수 있습니다.
그럼 원본 사이트의 이미지파일 이름을 알면은 local에서도 동일한 파일을 찾을 수 있습니다.