Fundamentals of Data Science (Technical)
데이터사이언스 파이썬 프로그래밍 과정
데이터 사이언스의 강력한 통찰력을 적용하기 위한 이론적 지식과 기술적 역량을 제공하고
데이터 사이언스 관련 경력 축적을 위한 기본 사항을 학습할 수 있습니다.
해당 수업은 데이터 사이언스의 이론적 구성 요소에 대해 소개하고 Python을 사용하여
데이터 사이언스 문제에 대한 해결책을 수립하기 위한 체험적 실습을 제공하도록 설계
되었습니다. 본 수업의 평가는 브라우저 기반 Jupyter 노트북 환경에서 제공되는 세 가지
실습 과제에 기반합니다.
Fundamentals of Data Science(Technical)
  • 강의설명
    수업은 6주간 진행 됩니다.
    1Week
    본 수업 관련 담당 강사 및 참석자들을 만나게 되며 향후 6주 동안 수행할 사항과 우리가 교육생을 지원하는 방법에 대해 자세하게 살펴 봅니다.
    수업 실습 및 과제를 위해 사용할 웹 기반 환경인 Jupyter의 “체험적” 실습을 수행합니다. 또한 이 기간 동안 프로그래밍 언어에 익숙하거나 재교육 수준의 교육생을 위해 Python Primer 활동이 포함되어 있습니다.
    2Week
    데이터 사이언스의 기본적인 용어와 프로세스에 대해 배우고, 데이터 탐구에 도움을 주는 기술 환경과 이러한 방대한 양의 데이터에 숨겨진 가치를 찾기 위해 데이터 과학자가 사용하는 도구에 대해 살펴 봅니다. 또한 이 주간에는 데이터 사이언스용 Python 사용에 대해 소개합니다.
    3Week
    데이터 수집, 저장 및 관리에 중점을 두고 데이터 사이언스의 체험적 실습을 경험하기 시작하며 다양한 데이터 소스와 잠재적인 통찰력 증진을 위해 이러한 소스들이 결합될 수 있는 방법에 대해 배우게 됩니다.
    4Week
    데이터 사이언스 팀이 통계부터 기계 학습에 이르기까지 일반적으로 사용하는 기술 범위를 포함하여 이러한 데이터의 분석 방법을 이해하는 데 도움을 줍니다. Python을 사용하여 이러한 분석적 기법을 실제 데이터 세트에 적용합니다.
    5Week
    다양한 데이터 시각화 기법을 사용하여 데이터 사이언스 작업의 결과물을 보고할 수 있는 방법에 대해 배웁니다. 주요 결과물을 강조하고 보고서 영향을 향상시키기 위해 특정 유형의 데이터를 표시할 수 있는 다양한 방법을 탐구합니다.
    6Week
    데이터 사이언스의 미래에 대해 살펴 보고 교육생의 과제 마무리를 지원하는 데 중점을 둡니다.
    체험적 실습 및 과제
    각 주마다 교육 자료, 셀프 스터디 자료, 활동 및 실질적 온라인 실습 자료가 포함되어 있습니다.
    1주차에는 Python에 대한 (옵션) 소개 / '재교육'이 포함됩니다. 여기에는 자신의 수준에 맞게 수행하기 위한 온라인 실습이 포함되어 있습니다. 이 실습 과정은 등급 차이가 없습니다. 2주차에는 세부적인 Python 실습이 포함되어 있습니다. 이러한 실습이 교육생 과제에 도움을 주기 때문에 실습을 장려합니다. 마찬가지로 이러한 실습은 등급 차이가 없습니다. 3, 4 및 5주차 각각에서는 온라인 실습(등급 차이 없음) 및 관련 등급별 코스 과제를 제공합니다.
    기간 6주 (60시간) 수강
    대상자
    프로그래밍에 대한 적절한 이해도가 있으며, Python 또는 유사한 언어를 사용한 경험이 있는 분
    데이터 과학에서 경력을 쌓기를 원하거나 데이터 과학의 강력한 기술을현재의 비즈니스 과제에 적용하는 방법을 배우려는 분
    강사 Elena Simperl 교수 학습 자료 비디오 자습서, 프리젠 테이션, 온라인 연습, 추가 읽기
    100%
    온라인 전달
    개인 및 그룹 자습서, 핵심 자료를 통한 자습 학습, Q&A,동료 토론 및 교과 과정을 포함한 지원되는 코드 구현 평가 및
    피드백
    과제 (3 개), 코스 전반에 걸쳐 안내 및 형성 피드백을 제공하는 전문 교사
    교육료
    무통장 입금안내
    결제 진행 시 무통장을 선택해주세요.
    금액 250만원 입금주 ㈜솔트룩스파트너스 계좌번호 KB국민은행 445737-01-013536
  • 목표 및 학습 결과
    본 수업에서는 유능한 데이터 과학자가 되기 위해 필요한 지식 및 전문 기술을 제공합니다.
    성공적으로 본 모듈을 완료하면 다음을 수행할 수 있습니다.
    실제 응용 분야 및 데이터 과학자가 사용하는 툴킷을 포함하여 데이터 사이언스의 주요 개념을 이해합니다. 데이터 사이언스를 위한 데이터 수집, 관리 및 저장 방법에 대해 설명합니다. MongoDB를 사용하여 데이터 수집 및 관리 스크립트를 구현합니다. 데이터 사이언스에 매우 중요한 통계 및 기계 학습의 이해를 시연합니다. 데이터 세트를 통계적으로 분석하기 위해 Python 코드를 생성합니다. 데이터로부터 의사 소통 스토리를 위한 설계 및 사용에 기반한 데이터 시각화를 비판적으로 평가합니다. Python 및 Bokeh를 사용하여 데이터로부터 시각화를 계획 및 생성합니다.
    성공적으로 코스 완료 시 수료증 및 등급 인증서를 받게 됩니다.
  • 기술 스택
    시각화 Bokeh (Python) 통계/분석 NumPy / SciPy / Pandas
    관리/쿼링 MongoDB (Python 사용) 기본 Python
  • 평가
    본 수업은 총 3번의 과제를 제공하여, 수업을 성공적으로 완료할 수 있도록 도와줍니다.
    과제 1 - 라이브러리 요청, Json, BS4 – BeautifulSoup, urllib, robotparser – RobotFileParser, Pymongo – MongoClient.

    첫 번째 과제에서 API로부터 데이터를 수집한 다음 관련 성과를 위해 데이터를 처리합니다. 이 과제를 완료하기 위해 다른 라이브러리를 사용할 수 있지만 아래 나열된 Python 라이브러리에 액세스합니다.
    과제2 Numpy, Pandas, Bokeh – charts, Scikit-learn: model_selection – train_test_split, linear_model – LinearRegression, metrics – mean_squared_error.

    두 번째 과제의 경우 통계적 분석 및 기계 학습 알고리즘의 생성을 통해 문제에 대한 해결책을 수립하기 위해 다음 라이브러리를 사용하여 기능을 생성해야 합니다.
    다음은 해결책 생성 시 사용하기 위해 제안된 Python 라이브러리입니다.
    과제3 Ipywidgets: interact, interactive, Hbox, Label, Slider; Bokeh: palettes - Spectral6, io – output_notebook, output_file, show, push_notebook, curdoc; models: TapTool, CustomJS; models.sources: ColumnDataSource; models.tiles – WMTSTilesSource, tile_providers; Bokeh.io – output_file, output_notebook, show and push_notebook; Ipython: display.

    세 번째 및 최종 과제를 위해 이전 작업에서 수집한 데이터의 사용자 친화적이고 유용한 대화형 시각화를 생성해야 합니다. 이 과제의 경우 다른 라이브러리 및 도구를
    자유롭게 사용할 수 있지만 교육생을 위해 라이브러리 및 패키지 세트를 가져옵니다.

    이러한 모든 라이브러리와 이러한 개념을 목록, 사전, 시리즈, 데이터프레임 및 .loc로 사용한 경험을 바탕으로 권장되는 주당 10시간 연구 이내에 본 코스를 쉽게 완료할 수 있어야 합니다. 대부분의 이러한 라이브러리를 알고 있지만 몇 가지 라이브러리만 사용한 제한된 경험만 있는 경우 권장되는 주당 10시간 연구는 주별 참석자를 개별 및
    그룹 강의와 결합할 경우 충분해야 합니다.
    이러한 라이브러리 또는 Python을 프로그래밍 언어로 사용에 관한 제한된 인식 또는 이해 상태에서도 다음 제안된 옵션 중 하나 이상을 선택하면 코스를 성공적으로 완료할 수 있습니다.

    프로그래밍 역량이 제한적인 경우 매주 1대1 강의 방식으로 강사가 이해와 응용에 중점을 두고 교육생을 코스 실습 자료를 통해 지도하는 집중적인 지원 상품을 구입할 기회을 제공합니다.
    예를 들어 Software Carpentry Foundation에서 제공하는 Python을 통한 프로그래밍과 Python을 통한 플로팅 및 프로그래밍과 같이 다양한 온라인 무료 Python 코스 중 하나에 참여하여 프로그래밍 역량을 키울 수
    있습니다.

    최종 옵션은 프로그래밍이 포함되지 않고 데이터 사이언스 수행을 고려할 수 있는 데이터에 중점을 두면서, 데이터 사이언스 기본 과정(논테크니컬)을 고려하는 것입니다.
  • 강의 계획서
    본 수업은 아래와 같은 커리큘럼으로 진행 됩니다.
    1Week

    환영 및 코스 정보

    주제
    - 환영 인사 및 소개 - 주별 학습 성과 - 데이터 사이언스란 무엇인가 및 중요한 이유 - 코스 교수 요목 및 학습 성과
    - 토론 포럼 사용 - 자기 소개 - 지원 및 강의 지원 - 코스 과제 세부 정보
    - '체험형' Jupyter 숙련 활동 - Python Primer - 용어집
    2Week

    핵심 개념 및 기술 소개

    주제
    - 소개 - 주별 학습 성과 - 간략한 데이터 사이언스 - 용어
    - 데이터 사이언스 프로세스 - 데이터 사이언스 툴킷 - 데이터 유형 - 응용 프로그램 예
    - 세부적인 판독 - 요약
    3Week

    데이터 수집 및 관리

    주제
    - 소개 - 주별 학습 성과 - 데이터 소스 - 데이터 수집 및 API
    - 데이터 탐구 및 수정 - 데이터 저장 및 관리 - 여러 데이터 소스 사용 - 세부적인 판독
    - 요약
    4Week

    데이터 분석

    주제
    - 소개 - 주별 학습 성과 - 용어 및 개념 - 통계 소개 통계 속성 및 소개 중심 집중 경향 및 분포 분산 분포 속성 및 연산 샘플/CLT
    - 기본 기계 학습 알고리즘 선형 회귀 SVM 나이브 베이스 - 세부적인 판독 - 요약
    5Week

    데이터 시각화

    주제
    - 소개 - 주별 학습 성과 - 데이터 시각화 유형 탐구 설명
    - 시각화 데이터 데이터 유형 데이터 인코딩 레티날 변수 변수를 인코딩에 매핑 시각적 인코딩 - 시각화 기술 - 세부적인 판독 - 요약
    6Week

    데이터 사이언스의 미래

    주제
    - 소개 - 주별 학습 성과 - 데이터 사이언스의 미래
  • 추가 강의 지원
    우리의 모든 코스는 가능한 신속하게 교육생의 지식 및 경쟁력을 개발하기 위해 강의 지향적으로 설계되었습니다. 표준 비용에는 매주 안내 세미나 참가 및 코스 전반에 걸쳐 강사의 지원이 포함되어 있습니다.

    코스를 수강하고 싶지만 Python 또는 통계 지식이 부족한 열정적인 교육생의 경우 5개의 집중적인 1시간 분량 강의로 구성된 추가 팩을 제공할 수 있습니다. 이러한 보충 강의는 코스에서 부딪힐 수 있는 문제를 해결하는 데 도움을 주어 데이터 사이언스용 Python 배포 시 신속하게 자신감을 가질 수 있습니다.