크롤링

    구글에서 파이썬 셀레니움을 통한 이미지 크롤링

    3월 초부터 해결 방법을 알지 못해 손을 놓고 있던 이미지 크롤링을 몇 일 전부터 계속 구글링했다. 뭐가 문제인지 정말 많이 찾아봤었는데 범인은 코랩이었나보다.. 나는 정말 코랩이를 좋아했는데.. 편하고 인터넷으로 바로 켤 수 있고.. 근데 코랩이에서 크롬 드라이브 경로를 넣어도 인식을 못했다. 혹시나 해서 주피터 노트북에 넣고 돌려보니 바로 진행되었다. 내 사라진 시간들은 나의 멍청함이 먹어 치웠나보다 ㅎㅎ www.youtube.com/watch?v=1b7pXC1-IbE 조코딩님의 이미지 크롤링 자료를 2개 봤는데 다른 하나는 구글에서 막아놔서 사용이 불가능 했고, 셀레니움을 통한 크롤링은 사용이 가능했다. # 크롬 드라이브를 다운받아야한다. chromedriver.chromium.org/downloa..

    기사 제목 크롤링을 통한 워드클라우드 시각화하기 [완료]

    기쁨의 워드클라우드 탈출기. 무언가 해놓은게 없다는 판단에 배운거라도 써먹을 수 있도록 기사제목 크롤링 후 워드클라우드로 일자 별 키워드를 한눈에 볼 수 있는 코드를 짜봤다. 3월 21일에 시작을 하고 끝까지 다 왔지만 워드클라우드의 한글 폰트 적용문제로 3일간 디버깅을 시도하였고, 코랩, VS Code, Jupyter notebook등에서 시도해도 되지 않던 한글폰트 적용을 24일 밤에 성공했다 ㅋㅋㅋㅋ 남들에겐 아무것도 아닌 쉬운 작업일지 몰라도 뉴비인 나에겐 엄청 큰 발전이다. 아래는 코드. pip install konlpy #한글의 형태소 분석등을 위한 꼬꼬마를 사용하기위해 설치 import requests import pandas as pd from bs4 import BeautifulSoup ..