Agenda
1.
AMORI 팀 소개 + 솔루션 개요
2.
랩에서 제작 중인 치매환자 음성진단 솔루션 이야기 듣기
3.
음성진단 솔루션 데이터 수집의 페인포인트 듣기
4.
가장 유의미하고 효율 좋은 데이터는 무엇일까? 에 대한 견해 (어떤 상태로 데이터를 제공해주는 것이 가장 좋은 것인가 및 의미를 도출해낼 수 있게 만드려면 데이터를 어떻게 만들어야 하나)
5.
MOU
산업공학과 교수님
비전, 센서 등. 제조업 도메인에서 나오는 이상탐지 등의 연구
세브란스쪽은
치매 - 삼성전자와 NDA맺고 데이터를 준비하는 단계. 삼성전자 안에서는 스마트링으로 수면이나 생활리듬
음성데이터 쌓인걸로 진단하는 것. 치매든 파킨슨이든. 어려운 것이 잘 정제되어 있는 데이터가 많지 않다. 외국 데이터도 100-200개밖에 안된다.
권한을 가지려면 IRB 승인이 있어야 한다.
AI hub는 못쓰는 수준이 많다.
들을수도 없다. - 가공되어있는 안심 zone에서만 들을 수 있다.
진단을 할 때는 사진을 찍거나 들어가야 하는데
치매 vs MCI 판별하려면 팻 이미지, MRI 이미지 등이 촬영되어야 한다.
치매 환자가 가지고 있는 음성 차별성이 있을 것이다.
테스트 참여에 거부감이 많다.
다양한 실험을 진행하는 데 인센티브를 준다.
알려줘야 한다.
동의만 받으면 된다.
음성은 아직 완전하지 않다고 생각한다.
정상, MCN, AD
정상 경증 중증 나누는 정도의 레이블이 필요할 것이다.
심리학 - AI hub - 고령층 병원 데이터 ~ 구술데이터 / 센티멘트, 반복 등, 맥락에서 벗어났다 등
치료 뒤에 있는 raw data check 한것들
의료법이 적용되지 않는 중간 경계에
“환자들이 직접 체크해서 동의해서 준 데이터” 가 중요 - 연구 목적으로 쓸 때도 돈 받고 팔 것이다. 데이터를 잘 구축해서 파는 것이 수익이다.
회사와 산학협력을 하는 모델이 훨씬 좋다.
서울형 창업 뭐 → 교수님 + 창업하는 회사.
기업들에 팔아야지 학교에 파는건 ㅋㅋ
연구비가 데이터를 사기에 어렵게 되어 있다.
진단 솔루션을 다른 모델로 만들면 된다.
질문의 유형별로 만드는 것이 다르다.
그림 설명 등
1. AMORI 팀 소개 + 솔루션 개요 (현황 공유)
2. 랩에서 제작하는 솔루션은?
•
어떤 유형의 치매를 타겟으로 하는가?
•
인지장애 수준을 음성으로 어떻게 구분하고 있는가?
•
현재 연구에서 가장 중요한 진단 지표(지속시간, 발화속도, 주저함 등)는 무엇인가요?
아직 정해져있지 않다.
•
텍스트 기반 vs 음향 기반 중 어느 쪽에 더 집중하고 계신가요?
최종 아웃풋은 정상 경증 중증을 나누는 것. scoring metric
인과관계를 찾아가고 있다.
최소 2~500명정도만 구해도.. 많으면 많을수록 좋다.
소리로 분석하는 게 1단계 + 맥락을 통해서 분석하는 게 2단계.
, 생활에서 찾는게 2단계
가장
구축할 때 공유를 할 것이라는
데이터를 어떻게 구축해야지 IRB 승인 없이 갈 수 있을지 IRB 발급해주시는 분들한테 가서 물어봐바라.
정상인도 비슷한 나잇대로 가야한다.
플러스 질문들:
“AI 진단 알고리즘이 가장 잘 작동하는 ‘음성 상황’은 어떤 건가요?”
예: 질문-답변 구조? 감정 유도 상황? 일상 회화? → 어떤 종류의 대화 시나리오를 수집하면 좋을지
“환자의 음성뿐 아니라 가족과의 대화가 진단에 도움이 될 가능성도 있을까요?”
→ 반복전화 데이터는 ‘쌍방 대화’이기 때문에, 가족 음성까지 분석에 활용될 가능성 있음.
“현재까지 수집된 치매 관련 음성데이터셋 중 가장 이상적이거나 참고할 만한 사례는 있나요?”
→ 우리가 참고할 수 있는 오픈소스 데이터셋이나, 레이블링 구조에 대해 인사이트 얻기
3. 데이터 수집의 현실적 어려움 (페인포인트)
•
IRB, 개인 정보, 실제 피험자 확보 등
•
어떤 상황(대화/질문/답변)이 실험에 유의미했는지
•
현실적으로 가장 어려운 건 무엇인가요? (예: 레이블링? 환경소음?)
•
일반 가정 환경 데이터도 진단에 쓰일 수 있다고 보시나요?
4. “좋은 데이터”란 무엇인가? & AMORI 협력 가능성
•
어떤 형태로 데이터를 제공하는 것이 의미 분석에 좋을지
•
저희의 전화 기반 실제 치매 환자 통화(반복불안 상황)가 진단에 쓸 수 있는가?
•
시간/상황/감정 레이블이 붙어 있는 실 환경 통화 데이터가 진단에 얼마나 의미 있을까요?
•
라벨링 방식에 대한 조언을 받을 수 있을까요?
•
어떤 케이스가 진단 성능을 가장 끌어올리나요?
•
꼭 진단뿐이 아니라, 범용적인 음성데이터의 쓰임새 제안?
•
진단 AI 개발용 파일럿 연계 가능성?
“진단 정확도를 높이기 위해 꼭 포함돼야 하는 메타데이터가 있을까요?”
→ 나이, 성별, 진단 시점, 시간대, 상황 태그 등
→ 수집 시 우리도 어떤 부가정보를 함께 저장해야 하는지 기준 설정 가능
“현장에서 바로 활용 가능한 진단 솔루션을 만들기 위해 연구실이 바라는 이상적인 산업 파트너는 어떤 모습인가요?”
→ 교수님의 기대를 명확히 이해하고, 우리가 그 기대에 부합하는지를 판단할 수 있음
번외) 음성 진단 솔루션 외에도, 혹시 어떻게 응대해야하는지에 대한 인사이트도 있으신가, 혹은 우리 솔루션을 적용시켜 볼 만한 다른 분야나 응용방법 있을지.
확률에 대한 검증장치도 계속 있어야 한다.