HOME
home
2025 LOOKIE
home

음성 치매진단 연구실 인터뷰

Agenda
1.
AMORI 팀 소개 + 솔루션 개요
2.
랩에서 제작 중인 치매환자 음성진단 솔루션 이야기 듣기
3.
음성진단 솔루션 데이터 수집의 페인포인트 듣기
4.
가장 유의미하고 효율 좋은 데이터는 무엇일까? 에 대한 견해 (어떤 상태로 데이터를 제공해주는 것이 가장 좋은 것인가 및 의미를 도출해낼 수 있게 만드려면 데이터를 어떻게 만들어야 하나)
5.
MOU
산업공학과 교수님
비전, 센서 등. 제조업 도메인에서 나오는 이상탐지 등의 연구
세브란스쪽은
치매 - 삼성전자와 NDA맺고 데이터를 준비하는 단계. 삼성전자 안에서는 스마트링으로 수면이나 생활리듬
음성데이터 쌓인걸로 진단하는 것. 치매든 파킨슨이든. 어려운 것이 잘 정제되어 있는 데이터가 많지 않다. 외국 데이터도 100-200개밖에 안된다.
권한을 가지려면 IRB 승인이 있어야 한다.
AI hub는 못쓰는 수준이 많다.
들을수도 없다. - 가공되어있는 안심 zone에서만 들을 수 있다.
진단을 할 때는 사진을 찍거나 들어가야 하는데
치매 vs MCI 판별하려면 팻 이미지, MRI 이미지 등이 촬영되어야 한다.
치매 환자가 가지고 있는 음성 차별성이 있을 것이다.
테스트 참여에 거부감이 많다.
다양한 실험을 진행하는 데 인센티브를 준다.
알려줘야 한다.
동의만 받으면 된다.
음성은 아직 완전하지 않다고 생각한다.
정상, MCN, AD
정상 경증 중증 나누는 정도의 레이블이 필요할 것이다.
심리학 - AI hub - 고령층 병원 데이터 ~ 구술데이터 / 센티멘트, 반복 등, 맥락에서 벗어났다 등
치료 뒤에 있는 raw data check 한것들
의료법이 적용되지 않는 중간 경계에
“환자들이 직접 체크해서 동의해서 준 데이터” 가 중요 - 연구 목적으로 쓸 때도 돈 받고 팔 것이다. 데이터를 잘 구축해서 파는 것이 수익이다.
회사와 산학협력을 하는 모델이 훨씬 좋다.
서울형 창업 뭐 → 교수님 + 창업하는 회사.
기업들에 팔아야지 학교에 파는건 ㅋㅋ
연구비가 데이터를 사기에 어렵게 되어 있다.
진단 솔루션을 다른 모델로 만들면 된다.
질문의 유형별로 만드는 것이 다르다.
그림 설명 등

1. AMORI 팀 소개 + 솔루션 개요 (현황 공유)

2. 랩에서 제작하는 솔루션은?

어떤 유형의 치매를 타겟으로 하는가?
인지장애 수준을 음성으로 어떻게 구분하고 있는가?
현재 연구에서 가장 중요한 진단 지표(지속시간, 발화속도, 주저함 등)는 무엇인가요?
아직 정해져있지 않다.
텍스트 기반 vs 음향 기반 중 어느 쪽에 더 집중하고 계신가요?
최종 아웃풋은 정상 경증 중증을 나누는 것. scoring metric
인과관계를 찾아가고 있다.
최소 2~500명정도만 구해도.. 많으면 많을수록 좋다.
소리로 분석하는 게 1단계 + 맥락을 통해서 분석하는 게 2단계.
, 생활에서 찾는게 2단계
가장
구축할 때 공유를 할 것이라는
데이터를 어떻게 구축해야지 IRB 승인 없이 갈 수 있을지 IRB 발급해주시는 분들한테 가서 물어봐바라.
정상인도 비슷한 나잇대로 가야한다.
플러스 질문들:

“AI 진단 알고리즘이 가장 잘 작동하는 ‘음성 상황’은 어떤 건가요?”

예: 질문-답변 구조? 감정 유도 상황? 일상 회화? → 어떤 종류의 대화 시나리오를 수집하면 좋을지

“환자의 음성뿐 아니라 가족과의 대화가 진단에 도움이 될 가능성도 있을까요?”

→ 반복전화 데이터는 ‘쌍방 대화’이기 때문에, 가족 음성까지 분석에 활용될 가능성 있음.

“현재까지 수집된 치매 관련 음성데이터셋 중 가장 이상적이거나 참고할 만한 사례는 있나요?”

→ 우리가 참고할 수 있는 오픈소스 데이터셋이나, 레이블링 구조에 대해 인사이트 얻기

3. 데이터 수집의 현실적 어려움 (페인포인트)

IRB, 개인 정보, 실제 피험자 확보 등
어떤 상황(대화/질문/답변)이 실험에 유의미했는지
현실적으로 가장 어려운 건 무엇인가요? (예: 레이블링? 환경소음?)
일반 가정 환경 데이터도 진단에 쓰일 수 있다고 보시나요?

4. “좋은 데이터”란 무엇인가? & AMORI 협력 가능성

어떤 형태로 데이터를 제공하는 것이 의미 분석에 좋을지
저희의 전화 기반 실제 치매 환자 통화(반복불안 상황)가 진단에 쓸 수 있는가?
시간/상황/감정 레이블이 붙어 있는 실 환경 통화 데이터가 진단에 얼마나 의미 있을까요?
라벨링 방식에 대한 조언을 받을 수 있을까요?
어떤 케이스가 진단 성능을 가장 끌어올리나요?
꼭 진단뿐이 아니라, 범용적인 음성데이터의 쓰임새 제안?
진단 AI 개발용 파일럿 연계 가능성?

“진단 정확도를 높이기 위해 꼭 포함돼야 하는 메타데이터가 있을까요?”

→ 나이, 성별, 진단 시점, 시간대, 상황 태그 등
→ 수집 시 우리도 어떤 부가정보를 함께 저장해야 하는지 기준 설정 가능

“현장에서 바로 활용 가능한 진단 솔루션을 만들기 위해 연구실이 바라는 이상적인 산업 파트너는 어떤 모습인가요?”

→ 교수님의 기대를 명확히 이해하고, 우리가 그 기대에 부합하는지를 판단할 수 있음

번외) 음성 진단 솔루션 외에도, 혹시 어떻게 응대해야하는지에 대한 인사이트도 있으신가, 혹은 우리 솔루션을 적용시켜 볼 만한 다른 분야나 응용방법 있을지.

확률에 대한 검증장치도 계속 있어야 한다.