일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- PYTHON
- java
- 자바기초
- dagger-hilt
- LinkedList
- 자바
- 우분투 파이썬
- Data structure
- 안드로이드 mvp
- prisma
- Dependency Injection
- MVVM pattern
- Kotlin
- flutter
- unit test
- Android
- ubuntu python
- Android test
- 안드로이드 디자인패턴
- 안드로이드
- 유니티
- graphQL
- mvvm
- Design Pattern
- Apollo Server
- 웹크롤링
- Nexus GraphQL
- 안드로이드 테스트
- 파이썬 크롤링
- Apollo GraphQL
- Today
- Total
목록파이썬 크롤링 (4)
Hun's Blog
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/bqPknj/btqDebp3i0l/3D7CKGs69pJalSDBhhbpQ0/img.png)
참고 파이썬 레시피 - 웹 활용 입문편을 공부하면서 정리한 내용 https://wikidocs.net/36472 위키독스 온라인 책을 제작 공유하는 플랫폼 서비스 wikidocs.net 색감테스트 해보기 http://zzzscore.com/color/ 색감 테스트! 나는 몇점일까? 색감 테스트, 나의 눈은 얼마나 정확한가?! zzzscore.com 1. 태그 구성 -> 버튼이 4 -> 9 -> 16 ... 으로 늘어난다. -> div로 되어있다. -> xpath 찾기 -> //*[@id="grid"]/div[1] -> //*[@id="grid"]/div[2] ... 2. 스크립트 작성 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 2..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/bUh67y/btqDfBVPC6o/NwZSYgVZFFQZXXqedEYMfK/img.png)
참고 파이썬 레시피 - 웹 활용 입문편을 공부하면서 정리한 내용 https://wikidocs.net/36472 위키독스 온라인 책을 제작 공유하는 플랫폼 서비스 wikidocs.net 1to50 게임해보기 http://zzzscore.com/1to50/ 순발력 테스트! 추억의 1부터50까지 손은 눈보다 빠르다! 추억의 1부터50까지 zzzscore.com 1. 태그 구성 -> 25개의 버튼은 div로 되어있다. -> 게임에 사용되는 모든 버튼 요소 정보를 가져온다. -> 각 버튼의 내부 텍스트를 파악하여 몇번 버튼인지 파악한다. -> 찾는 숫자면 클릭한다. -> div 태그 내부에 style 이라는 정보밖에 없어서 구분할 수가없다. 이럴 땐 xpath를 사용한다. -> xpath를 찾는다. ->*[@i..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/b0ECh2/btqDc3MzmgK/JNsOkPXkOJva0lbW1RhGE0/img.png)
참고 파이썬 레시피 - 웹 활용 입문편을 공부하면서 정리한 내용 https://wikidocs.net/36472 위키독스 온라인 책을 제작 공유하는 플랫폼 서비스 wikidocs.net *urllib 모듈을 활용하여 네이버 웹툰의 썸네일을 찾아서 지정된 폴더에 다운로드한다. urllib ? URL 작업을 위한 여러 모듈을 모은 패키지이다. urllib.request -> URL 을 열고 읽는다 -> urlretrieve() : address 와 저장될 이름을 인자값으로 받아서 해당 url의 이미지 파일을 다운로드하여 저장한다. urllib.parse -> URL 구문 분석 urllib.robotparser -> robots.txt 파일 구문 분석을 위함 re? 파이썬의 정규표현식을 지원하는 모듈이다. (..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/c2yzP5/btqDeJ7yNnh/sPDEdgOnsOaVG0IwzKwQa1/img.png)
참고 파이썬 레시피 - 웹 활용 입문편을 공부하면서 정리한 내용 https://wikidocs.net/36472 위키독스 온라인 책을 제작 공유하는 플랫폼 서비스 wikidocs.net *BeautifulSoup + requests 를 활용해 네이버 웹툰의 제목을 가져와보자. 1. 스크립트 작성 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 from bs4 import BeautifulSoup from pprint import pprint import requests html = requests.get("http://comic.naver.com/webtoon/weekday.n..