이제 검색엔진을 만들어보고 한 페이지의 페이지랭크에 대해 해보겠습니다! 페이지랭크에 대한 알고리즘을 실행하고 웹 브라우저에 시각화를 하는 것이죠! 페이지랭크 알고리즘의 특징은 어떤 페이지가 가장 최고의 링크를 가지는지 알아내는 것입니다.이 일단 먼저 프로세스를 보겠습니다. spider.py로 하나의 URL을 DB에 집어넣습니다. 그다음 검색되지 않은 페이지를 찾습니다. 또 고른 페이지를 검색하고 해당 페이지를 파싱하게 됩니다. 그리고 검색되지 않은 페이지들을 DB에 저장하게 되는 것이죠. 페이지랭크 알고리즘은 옛날 순위를 통해 새로운 순위를 계산하고 옛날 순위를 새로운 순위로 교체합니다. 그래서 다대다 테이블을 생성해 페이지를 가리키는 용도로 사용합니다. 이번 포스팅에서는 spider.py의 역할과 코드..
네이버 Data Science Competition 2019에 참가하게 되어 추천강의를 받았다. 5. 캡스톤 : 파이썬을 이용한 데이터 검색, 처리 및 시각화 머신러닝을 위한 Python R을 활용한 통계학개론 : 6. 통계적 추론 I R을 활용한 통계학개론 : 7. 통계적 추론 II R을 활용한 통계학개론 : 8. 두 모집단의 비교 R을 활용한 통계학개론 : 10. 범주형 자료의 분석 R을 활용한 통계학개론 : 11. 분산분석 R을 활용한 통계학개론 : 12. 비모수 통계학 Statistics 110 from Harvard (Advanced - 선택) Data Science from MIT 인공지능 및 기계학습 개론 I : 2. Fundamentals of Machine Learning 인공지능 및 기..