빅데이터 분석과 시각화
전문과정, 한국기술교육대학교, 2024
과목 개요
Python을 활용한 빅데이터 분석과 시각화 기법을 학습하는 실무 중심 과정입니다. 실제 데이터셋을 활용하여 데이터 수집부터 인사이트 도출까지 전 과정을 실습합니다.
학습 목표
- Python 데이터 분석 라이브러리 활용 능력 습득
- 다양한 데이터 시각화 기법 이해 및 적용
- 실무 프로젝트를 통한 문제 해결 능력 배양
- 데이터 기반 의사결정 역량 강화
주차별 커리큘럼
1-4주: Python 기초 및 데이터 처리
- Python 프로그래밍 기초
- NumPy, Pandas 라이브러리
- 데이터 전처리 기법
- 결측값 및 이상치 처리
5-8주: 데이터 분석 기법
- 기술통계 및 추론통계
- 상관분석 및 회귀분석
- 시계열 데이터 분석
- 기계학습 기초
9-12주: 데이터 시각화
- Matplotlib, Seaborn 활용
- 대화형 시각화 (Plotly, Bokeh)
- 대시보드 구축 (Streamlit)
- 스토리텔링과 인사이트 전달
13-16주: 실무 프로젝트
- 팀 프로젝트 수행
- 실제 데이터 분석 사례
- 결과 발표 및 피어 리뷰
- 포트폴리오 작성
사용 도구 및 기술
- 프로그래밍 언어: Python 3.9+
- 개발 환경: Jupyter Notebook, VS Code
- 주요 라이브러리:
- 데이터 처리: Pandas, NumPy
- 시각화: Matplotlib, Seaborn, Plotly
- 머신러닝: Scikit-learn
- 웹앱: Streamlit
평가 방법
- 중간고사: 25%
- 기말 프로젝트: 35%
- 과제: 20%
- 출석 및 참여: 20%
수강생 프로젝트 예시
- 코로나19 데이터 분석 대시보드
- 실시간 데이터 수집 및 업데이트
- 지역별 확진자 추이 시각화
- 예측 모델 구현
- 주식 시장 분석 시스템
- 주가 데이터 크롤링
- 기술적 지표 계산
- 투자 시뮬레이션
- 소셜 미디어 감성 분석
- 텍스트 마이닝
- 감성 분류 모델
- 워드 클라우드 생성
교재 및 참고자료
주교재:
- “파이썬으로 데이터 주무르기” (민형기 저)
부교재:
- “Hands-On Machine Learning” (Aurélien Géron)
- “Python for Data Analysis” (Wes McKinney)
온라인 리소스:
- Kaggle 튜토리얼
- Google Colab 실습 노트북
- 강의 GitHub 저장소
수강 후기
“실무에서 바로 적용할 수 있는 실용적인 내용이었습니다. 특히 프로젝트를 통해 실제 문제를 해결하는 경험이 가장 유익했습니다.”
- 2024년 수강생 김○○
“교수님의 풍부한 실무 경험이 녹아있는 강의였습니다. 데이터 분석가로 전직하는 데 큰 도움이 되었습니다.”
- 2023년 수강생 이○○
