KDI국제정책대학원(KDIS) 데이터사이언스 전공 2025년 봄학기, Python과 Korean Economic Development 수업에 이어, 나머지 3개 핵심 과목(R Fundamentals for Public Policy, Introduction to Computational Social Science, Statistical Foundations for Data Scientists)에 대한 학습 경험과 소회를 정리함.
■ R Fundamentals for Public Policy (김병구 교수님) → 내 성적: A-
정책 데이터 분석에 특화된 R 프로그래밍 입문 수업. Python과 마찬가지로 완전 초보를 대상으로 기초 문법, 데이터 프레임 다루기, 시각화(ggplot2), 간단한 데이터 전처리(dplyr) 등을 다뤘다. 수업은 기초이론 설명과 실습이 적절히 섞여 있으며, 실제 공공 데이터셋(예: UN, OECD 등)을 활용해 실습하는 점이 인상적이었다.
R은 Python과 문법이 다르고 R과 Python 수업을 번갈아 듣다보니 명령어가 헷갈리기도 했다. 하지만 교수님의 수업 슬라이드와 R 스크립트에 중간중간 실습 사례가 들어있어 따라가기 수월했다.
과제는 각자 다양한 방법으로 확보한 데이터를 R로 분석·시각화하여 인사이트를 도출하는 미니 프로젝트였고, 나는 같은 학교 학생 Laura와 팀을 이뤄 영국의 차량 사고 데이터(Road safety statistics)를 확보하여 공유형 전기스쿠터(E-scooter) 시범사업 지역에서 전기스쿠터 사고 추이를 연구하였다. 워낙 tidy하게 정리된 데이터였기에 데이터 전처리엔 큰 시간이 필요하지 않았다. ggmap, sf 등 library를 활용해서 영국 지도상에 시각화를 할 수 있었고, 오픈소스 기반 지도 플랫폼인 OpenStreetMap의 DB도 적극 활용하였다. 연구결과로는 시범사업을 통해 공유형 전기스쿠터 운행을 허용한 지역이 다른 지역보다 전기스쿠터 사고 증가가 적었는데 (영국은 이외 지역에서 개인 스쿠터를 공공도로에서 타는 것은 '불법'이다.) 우리 팀은 이 결과를 '적절한 전기스쿠터 허용 정책과 이에 수반하는 규제가 오히려 사고를 방지하는 데에 도움이 된다.'고 해석하였다.
시험은 없다
감상: Python과 마찬가지로 R 역시 데이터사이언스의 필수 언어임을 체감했다. R은 통계 분석과 시각화에 강점이 있어 정책 데이터 분석에 특히 유용하다. 앞으로도 실무에서 R을 적극적으로 활용할 계획이다.
■ Introduction to Computational Social Science (박재혁 교수님) → 내 성적: A-
계산사회과학 입문 과목으로, 데이터사이언스가 사회과학 연구에 어떻게 접목되는지 개념과 사례를 폭넓게 다뤘다. 네트워크 분석, 시뮬레이션, 에이전트 기반 모델링, 텍스트 분석 등 최신 연구방법론의 기초를 소개한다. 이론적 배경과 실제 논문 사례를 번갈아 다루며, 사회현상을 데이터와 알고리즘으로 어떻게 해석할 수 있는지 보여준다.
2024년에 첫 출범한 Data Science 전공의 총책 박재혁 교수님이 Computational Social Science 분야의 논문들(주로 Nature, Science 등 탑저널에 게재된)을 엄선하여 안내하고, 학생들은 매주 수업마다 2개의 논문을 리뷰하는 발제 세미나 방식의 수업이다. 발제를 맡은 팀(학생 3~4인)은 해당 논문을 철저히 분석하여 마치 논문 작성자가 된 것처럼 다른 학생들에게 발표하고 질문을 받는 방식으로 수업이 진행되었다.
과제는 팀마다 학기 전체에 걸쳐 할당된 2~3개의 논문 발표였으며, 학기말 최종 과제는 수업에서 배운 것들을 토대로 학생 각자의 연구 주제에 대해 3p 가량의 연구계획서를 작성하는 것이었다.
시험은 없다.
감상: 논문의 수식, 모델, 그래프 중 명확히 이해하지 못 한 것들이 꽤 있었지만 좋은 품질의 논문 원문을 반복해서 읽으며 연구자들의 문법에 전보다 훨씬 익숙해졌다. 막연히만 느껴지던 논문 작성이 조금은 가깝게 느껴지게 되었고, 한편으로는 탑저널에 게재되는 논문들의 높은 수준을 확실히 체감할 수 있었다.
■ Statistical Foundations for Data Scientists (김병구 교수님) → 내 성적: A-
데이터사이언스의 기초가 되는 통계학 입문 과목. 확률, 통계적 추정, 가설검정, 회귀분석 등 데이터 분석의 핵심 이론을 다뤘다. 수업 중간중간에 사례를 들어주시기는 하였지만, 실제 데이터 해석과 응용 수업이 아닌 순수한 기초수학, 통계학 수업이었다.
모든 개념을 영어로 새로 배워야 했지만, 수업 초반에는 고등학교·학부 시절에 배웠던 미적분, 확률통계 내용이라 익숙했다. 행정고시 준비 과정에서 조사방법론 과목을 배웠던 점도 수업을 따라가는데 도움이 되었다. 나는 통계적 분석에 대한 지식이 약했기 때문에 이 수업을 통해 최대한 보완하려 했다. 이로써 쁘아송 분포, 정규분포, t-test, ANOVA 등 조사방법론을 통해 수박 겉핡기식으로 배웠던 개념들을 좀 더 확실하게 배울 수 있었다.
과제는 3~4번 정도 있었는데, 문제풀이였다.
시험은 중간고사, 기말고사로 이뤄지며 과제와 마찬가지로 문제풀이 방식이었다. 나는 과제는 완벽하게 해냈고 (수업 슬라이드를 옆에 놓고 했으니..), 중간고사는 만점에 가까운 점수를 받았다. 학부 때 미적분(Linear Algebra)을 재수강한 끝에 A+를 받았으니, 미적분은 자신 있었다. 다만 기말고사는 반타작도 못 했는데, 여전히 통계적 분석 개념이 취약하여 하나하나의 문제 세트를 끝까지 풀지 못 하였다. 그럼에도 불구하고 A-라는 기대 이상의 점수가 나온 것을 보면, 중간고사에서 만점에 가까운 점수를 받은 덕분인 것 같다.
감상: 통계학은 데이터사이언스 뿐 아니라 모든 사회과학의 뼈대임을 다시 확인했다. 앞으로 머신러닝, 인공지능 등 고급 과정에서도 통계적 사고가 필수적이므로, 기초를 더 탄탄히 다져야겠다고 느꼈다. A-라는 만족스러운 점수를 받았지만, 통계적 분석 기초는 여전히 약하다는 걸 확인했으므로 KDIS 도서관에 있는 파이썬+통계학 또는 R+통계학 서적을 빌려서 따로 복습해야겠다.
■ 총평
KDIS 데이터사이언스 전공의 핵심 과목들은 실무와 이론을 균형 있게 다루며, 공공정책 데이터 분석에 특화된 커리큘럼을 제공한다. Python과 R, 통계, 계산사회과학 등 기초를 다지는 한 학기였다. 각 과목별로 내 학습성과에 대한 아쉬움도 있었지만, 실습 중심의 수업과 다양한 사례 덕분에 재미있게 데이터사이언스의 기초 체력을 쌓을 수 있었다.
데이터사이언스 전공 과목 수업들은 모두 KDIS 메인캠퍼스가 아니라 3km 거리에 있는 세종공동캠퍼스(KDIS가 임차하여 사용하는 공유형 캠퍼스)에서 진행되었다. 이 때문에 메인캠퍼스의 학생들과 교류가 적다는 단점은 있으나, 깨끗한 새 시설을 쾌적하게 사용할 수 있다는 점과 데이터사이언스 전공 학생들끼리 더 큰 유대감을 형성할 수 있다는 장점도 있었다.
다음 Summer 학기에는 머신러닝(Machine Learning 1), 인공지능 윤리 (AI Ethics) 등 심화 과목과 함께 논문 준비를 위한 지도교수님과의 정기 미팅인 Advanced Research Seminar, 국제업무를 위해 필수적으로 알아야 할 무역법과 정책(Trade Law and Policy in Practice) 수업을 들으려 한다.
Summer 학기 이후에는 영국으로 떠나므로 올해 수업을 같이 들었던 KDIS 동료 학생들과는 작별이다. 특히, 외국인 학생들은 앞으로 영영 보지 못 할지도 모른다. 이번 학기는 논문 작성과 케임브리지 진학 준비뿐 아니라 외국인 학생들과의 추억을 더 쌓고 싶다.
데이터사이언스 전공 새 출범 후 2기 입학생(2025년 Spring)으로서, 실무와 연구 모두에 도움이 되는 KDIS 데이터사이언스 커리큘럼을 적극 추천한다.
'Study > Data Science' 카테고리의 다른 글
[Weekly Papers] LLM 기반 임베딩으로 인간 신념 구조 모델링하기 (3) | 2025.06.15 |
---|---|
KDI국제정책대학원 데이터사이언스 전공 후기(1) – 2025년 봄학기 성적 및 과목별 리뷰 (1) | 2025.05.13 |
나는 왜 데이터사이언스를 전공했는가 (0) | 2025.05.08 |