빅데이터 분석과 시각화

전문과정, 한국기술교육대학교, 2024

과목 개요

Python을 활용한 빅데이터 분석과 시각화 기법을 학습하는 실무 중심 과정입니다. 실제 데이터셋을 활용하여 데이터 수집부터 인사이트 도출까지 전 과정을 실습합니다.

학습 목표

  • Python 데이터 분석 라이브러리 활용 능력 습득
  • 다양한 데이터 시각화 기법 이해 및 적용
  • 실무 프로젝트를 통한 문제 해결 능력 배양
  • 데이터 기반 의사결정 역량 강화

주차별 커리큘럼

1-4주: Python 기초 및 데이터 처리

  • Python 프로그래밍 기초
  • NumPy, Pandas 라이브러리
  • 데이터 전처리 기법
  • 결측값 및 이상치 처리

5-8주: 데이터 분석 기법

  • 기술통계 및 추론통계
  • 상관분석 및 회귀분석
  • 시계열 데이터 분석
  • 기계학습 기초

9-12주: 데이터 시각화

  • Matplotlib, Seaborn 활용
  • 대화형 시각화 (Plotly, Bokeh)
  • 대시보드 구축 (Streamlit)
  • 스토리텔링과 인사이트 전달

13-16주: 실무 프로젝트

  • 팀 프로젝트 수행
  • 실제 데이터 분석 사례
  • 결과 발표 및 피어 리뷰
  • 포트폴리오 작성

사용 도구 및 기술

  • 프로그래밍 언어: Python 3.9+
  • 개발 환경: Jupyter Notebook, VS Code
  • 주요 라이브러리:
    • 데이터 처리: Pandas, NumPy
    • 시각화: Matplotlib, Seaborn, Plotly
    • 머신러닝: Scikit-learn
    • 웹앱: Streamlit

평가 방법

  • 중간고사: 25%
  • 기말 프로젝트: 35%
  • 과제: 20%
  • 출석 및 참여: 20%

수강생 프로젝트 예시

  1. 코로나19 데이터 분석 대시보드
    • 실시간 데이터 수집 및 업데이트
    • 지역별 확진자 추이 시각화
    • 예측 모델 구현
  2. 주식 시장 분석 시스템
    • 주가 데이터 크롤링
    • 기술적 지표 계산
    • 투자 시뮬레이션
  3. 소셜 미디어 감성 분석
    • 텍스트 마이닝
    • 감성 분류 모델
    • 워드 클라우드 생성

교재 및 참고자료

주교재:

  • “파이썬으로 데이터 주무르기” (민형기 저)

부교재:

  • “Hands-On Machine Learning” (Aurélien Géron)
  • “Python for Data Analysis” (Wes McKinney)

온라인 리소스:

  • Kaggle 튜토리얼
  • Google Colab 실습 노트북
  • 강의 GitHub 저장소

수강 후기

“실무에서 바로 적용할 수 있는 실용적인 내용이었습니다. 특히 프로젝트를 통해 실제 문제를 해결하는 경험이 가장 유익했습니다.”

  • 2024년 수강생 김○○

“교수님의 풍부한 실무 경험이 녹아있는 강의였습니다. 데이터 분석가로 전직하는 데 큰 도움이 되었습니다.”

  • 2023년 수강생 이○○

강의 자료