KHU 2025-1/데이터분석캡스톤디자인

[Week 1~2] 주제 선정기 & 프로젝트 시작

예지레슬리초이 2025. 3. 23. 17:56

 

2025-1학기 경희대학교 데이터분석캡스톤디자인 프로젝트를 시작하며,
이번 한 학기 동안의 여정을 기록해보고자 한다.


내가 어떤 마음가짐으로 프로젝트를 시작했는지, 어떤 기준으로 주제를 정했는지, 그리고 어떤 어려움들을 겪고 극복했는지 꼼꼼하게 남겨두고 싶다. 나중에 회고할 때, 문제와 그 해결 과정을 생생히 떠올릴 수 있는 그런 기록을 남기는 것을 목표로 한다 :)

 


 

주제 선정기 (Week 1~2)

사실 주제를 선정하는 데에만 거의 2주가 걸렸다.


프로젝트를 할 때마다 늘 느끼는 거지만, originality와 realisticity 두 마리 토끼를 동시에 잡는 건 정말 어렵다.

남들이 안 했을 법한 참신한 아이디어가 나오면, 정작 관련 데이터셋이 없거나 너무 추상적인 경우가 많고,
기존의 데이터셋을 기반으로 아이디어를 짜자니 또 너무 흔하고 식상해 보이는 주제밖에 떠오르지 않는다.

 

여러 아이디어가 오갔지만,

최종적으로 우리 네 명이 선택한 주제는 "생체 데이터 기반 개인 맞춤 학습/건강 관리 스케줄러"이다.
(사실 교수님 피드백을 반영해서 이 제목도 추후 수정할 가능성이 높다..)

 

이 아이디어는 내가 처음 제안했다.
하지만 솔직히 말하면, 주제가 정해진 지금도 “이거, 언제든지 엎어질 수도 있겠다”는 불안한 마음이 한편에 있다.
그만큼 데이터 수집이 까다롭고, 기획도 뚜렷하게 잡히지 않은 어려운 주제인 것 같다.

 


# 아이디어의 배경

이 주제를 떠올리게 된 배경은 꽤나 개인적인 경험에서 비롯되었다.

나는 공부를 시작하면 한 번에 꽤 오래 앉아 있는 편이다. 집중하고 있을 땐 잘 모르지만, 공부를 끝내고 집으로 돌아갈 때쯤 되면 온몸이 뻐근하고 다리도 붓는 느낌이 든다.

그렇게 계속 지내다가, 얼마 전 애플워치를 착용하기 시작했다.
이후 내 생체 데이터를 기반으로 "너무 오래 앉아 있었으니 일어나서 1분 동안 움직여라"는 알림이 오기 시작했고, 실제로 그 알림을 받고 일어나 산책을 하고 오면 집중력도 다시 올라오고, 몸의 피로도도 덜했다.

이 경험을 통해,

“생체 데이터를 기반으로 지금 내가 가장 잘할 수 있는 활동을 추천해주는 시스템이 있으면 정말 유용하겠다!”

 

는 생각이 들었고, 그게 이 아이디어의 출발점이 되었다.

 

 

하지만 곧 현실의 벽에 부딪혔다.

 

생체 데이터라는 특성상 데이터 확보가 쉽지 않고 (개인 정보 보안상의 문제도 존재함), 그 데이터를 기반으로 실시간 추천 시스템을 만들기에도 시간과 리소스가 너무 부족했다. 한 학기 캡스톤 프로젝트로 감당하기엔 꽤 무거운 주제였던 것이다.

그래서 우리 팀은 일주일 동안

  • 어떤 데이터를 실제로 확보할 수 있는지
  • 확보한 데이터로 어떤 피처를 만들 수 있는지
  • 그 피처로 어떤 기능을 구현할 수 있을지

에 대해 깊이 고민했다.


# 최종 주제

결국 우리는 "생체 데이터 기반 개인 맞춤 학습/건강 관리 스케줄러"를 주제로 정했다.

이 프로젝트에서는

공부, 운동, 수면 이 세 가지 요소 간의 상관관계를 분석하여,
더 생산적이고 효율적인 학습 생활을 지원하는 스케줄링 서비스를 구상한다.

 

# 예시 시나리오

예를 들어, 사용자가 이렇게 입력했다고 하자:

"3일 후 기계학습 중간고사가 있는데, 총 30시간은 공부해야 할 것 같아."

 

이때, 시스템은 사용자의 최근 생체 데이터(ex. 수면 시간, 운동량 등)를 분석해서 현재 상태를 파악한다. (e.g. "최근 3일간 수면 부족", "운동량 거의 없음" 등)

 

그리고 그 데이터를 기반으로,

“너는 지금 체력도 떨어져 있고, 수면도 부족해. 이 상태로는 집중력이 30%밖에 안 나와.
지금 3시간 자고, 그 후 4시간 공부하고, 20분 운동 후 다시 7시간 공부하는 게 가장 효율적이야.” ~

 

와 같은 맞춤 스케줄을 제안해주는 것이다.

 


 

# 의문점: 집중도를 어떻게 측정할 것인가?

이 아이디어에서 가장 큰 허들은 바로 "집중도"를 어떤 생체 지표로 측정할 수 있을까? 였다.

논문을 찾아보니 스트레스 호르몬인 코르티솔 수치가 낮을수록 집중이 잘 된다는 연구는 있었지만,

문제는 코르티솔 측정이 애플워치 같은 웨어러블 기기로는 불가능하다는 점이었다.

 

그래서 나온 솔루션 - 나랑 준혁이는 우리가 직접 실험쥐(?ㅎㅎ)처럼 일지를 기록하기로 했다. 

→ actually still kind of skeptical about this..

  • 매일 목표 공부 시간을 정하고
  • 실제 공부 시작/종료 시간,
  • 그 시간 동안 집중이 얼마나 잘 되었는지 (1~5점 척도)를 기록한다.

이렇게 수집된

  • 공부 시간
  • 집중도 (자가 평가)
  • 수면/운동 데이터
    를 기반으로 상관관계 분석이나 모델링(회귀, 클러스터링 등) 을 시도할 예정이다.

# 연구 계획

1. 데이터 수집

  • 애플워치/아이폰의 건강 앱 '내보내기' 기능을 활용해 생체 데이터 수집
  • 추출 가능한 feature:
    • 심박수 변동성
    • 기초 대사량
    • 수면 시간 및 깊이
    • 칼로리 소비량
    • 걸음 수, 이동 거리 등
  • Cozie라는 앱도 생체 데이터 수집에 활용 가능

2. 데이터 전처리 및 특징 엔지니어링

  • 시간 단위 (일/주/월)로 정리
  • 학습, 수면, 운동 간의 상관관계 파악을 위한 피처 생성
  • 팀원들의 실사용 데이터를 일정 기간 축적하여 분석

3. 모델링 (To be discussed)

  • 집중도 예측 또는 스케줄링 최적화 모델 적용 예정
  • 딥러닝
  • 어쩌면 강화학습까지도..?

 

# 보완점 및 피드백

*준혁이가 잘 정리해준 교수님 피드백 ㅎㅎ 샤라웃 투 준혁

 

1. 확보할 수 있는 데이터 더 찾아보기

  • 수면 - 수면시간, 운동 -심박수, 공부 -뇌파 등 → 찾고자 하는 변수의 구체적인 지표가 될 수 있는 정보들
  • 특히 ‘공부’ 측면에서 잘된다, 잘 안된다를 객관적으로 측정할 수 있는 데이터 지표를 발굴하고 적용하는 것이 필요함.

2. 학습, 운동 수면 간 상관관계 분석

  • 특히 ‘공부’ 측면에서 잘된다, 잘 안된다를 객관적으로 측정할 수 있는 데이터 지표를 발굴하고 적용하는 것이 필요함.
  • 모델링이 필요없을지도 모른다는 피드백 있었음.

3. 데이터 수집에 대한 우려

  • 직접 학습 데이터를 수집한다 하더라도 누적 데이터가 필요하기 때문에 시간이 너무 소요될 수 있다는 문제가 존재

4. 선행 연구 탐색하기

  • 꼭 공부, 운동, 수면의 관계가 아닌 웨어러블 기기를 활용한 다른 분야를 찾아보는 것도 하나의 방법
  • 기타 선행 연구가 있었는지 (꼭 심박수, 혹은 무거운 주제가 아니더라도 scientific journal 에서 다른 연구 선행된 게 있는지 찾아보기

5. 너무 복잡하게 생각하지 말기 :)

  • 프로젝트가 처음부터 너무 거대하게(?) 야망 있게 기획될 필요가 없다.
  • 먼저 간단하게 기획할 수 있는 것들부터 하고, 거기서 하나씩 추가하는 방향으로 나아가자~

 


# 느낀 점

이렇게 프로젝트의 첫 단추를 꿰었다.
물론 아직 갈 길이 멀고, 풀어야 할 난제도 많다. 교수님께 거의 한 시간 동안 피드백을 받은 것 같다. 그만큼 우려스러운 점도 많고, 틀어질 구석이 많은 아이디어 주제인 듯하다. 이번 캡스톤 프로젝트는 공식적으로(?) 나의 4번째 프로젝트가 된다. 그동안의 경험을 돌아보면, 나는 확실한 결과가 보장된 안정적인 주제보다는 많이 부딪히고 시행착오가 있더라도 얻어가는 게 많은 프로젝트를 선호하는 것 같다. 아직은 배우는 입장이니까, 이런 프로젝트를 통해 내 그릇이 조금이라도 더 넓어지고 조금씩 성장할 수 있기를 바란다. 어렵겠지만! 이 아이디어가 점점 구체화되고, 현실적인 프로젝트로 다듬어지는 그 과정이 기대되기도 하고, 무엇보다 팀원들과 함께 잘 밟아나가고 싶다.

 

다음 회차에서는 교수님의 피드백을 반영해서 주제를 조금 더 구체화하고 제기된 우려들을 어떻게 보완할지, 팀원들과 논의한 내용을 바탕으로 정리해볼 생각이다.

 

가능하다면 데이터 수집 및 전처리 과정도 다룰 수 있었으면 좋겠는데...
쓸 수 있기를,, 바란다...!!