보다 유연한 AI를 위한 EPFL의 새로운 다중 모드 모델

텍스트, 이미지, 비디오 및 사운드를 통해 학습할 수 있으며 모듈식 덕분에 원하는 수 또는 조합의 예측을 생성할 수 있습니다.

머신 러닝: EPFL의 보다 유연한 AI를 위한 새로운 다중 모드 모델
보다 유연한 AI를 위한 EPFL의 새로운 다중 모드 모델(Photo: Brian Penny/Pixabay)

OpenAI든 ChatGPT든 대부분의 챗봇은 생성 인공 지능 소위를 기반으로합니다. 대형 언어 모델 (LLM), 모델 깊은 학습 많은 양의 텍스트를 통해 정보를 학습함으로써 제기된 질문에 대한 답변을 제공하도록 대규모로 훈련되었습니다.

마지막 개척지생성 적 AI 나도 다중 모드 모델, 언어이해와 이미지, 영상, 오디오를 결합하여 더욱 발전된 경험과 서비스를 제공합니다.

그러나 이러한 모델의 생성에는 특히 소규모로 다중 모드 모델을 구축하려는 의도인 경우 몇 가지 과제가 있습니다. 누락된 데이터의 존재 정보를 사용할 수 없기 때문에 거의 항상 자원의 부분적인 가용성으로 인해 발생합니다.

즉, 모델이 부족함을 기반으로 학습하고 계산과 예측이 왜곡될 위험이 있습니다. 그리고 이것이 EPFL이 새로운 프로젝트를 시작한 곳입니다.

로잔 기술 대학과 취리히에서 녹색 에너지 연합
3D에서 가상 현실을 유형으로 만드는 기술 장갑

기계 학습
로잔 연방 폴리테크닉 캠퍼스(사진: Facebook/EFPL)

로잔에서 탄생한 모듈형 멀티모달 모델 MultiModN

연구원 로잔 연방 폴리테크닉 (EPFL)는 공학 및 정보 기술 분야에서 세계 최고의 대학 중 하나이며 실제로 멀티모드N, 최근 NeurIPS2023에서 발표된 독특한 모듈식 다중 모드 모델입니다.

EPFL 컴퓨터 과학 및 커뮤니케이션 대학의 교육용 기계 학습(ML4ED) 및 기계 학습 및 최적화(MLO) 연구소의 연구원들은 대규모와 정반대이지만 더 작은 규모로 생각하기로 결정했습니다.

선생님이 이끄는 메리 앤 하틀리, MLO와 예일 의과대학에서 공동 주최한 글로벌 지능형 건강 기술 연구소 소장이자 교수 탄자 케저ML4ED의 이사인 팀은 텍스트, 이미지, 비디오, 사운드로부터 학습할 수 있지만 기존 모델과 달리 다양한 수의 작은 모듈, 자율적이며 입력별로 다릅니다.

후자는 사용 가능한 정보를 기반으로 선택한 다음 일련의 숫자, 조합 또는 입력 유형으로 함께 구성할 수 있습니다. 따라서 예측의 수 또는 조합을 생성할 수 있습니다.

"우리는 MultiModN을 다음에서 평가했습니다. 열 가지 실제 활동의학적 진단, 학업성적 예측, 일기예보 지원 등을 포함한다” 그는 설명했다 비니트라 스와미, ML4ED 및 MLO의 박사 과정 학생이자 프로젝트의 첫 번째 공동 저자입니다.

“이러한 실험을 통해 우리는 MultiModN이 다중 모드 모델링에 대한 본질적으로 해석 가능하고 데이터 누락 방지 접근 방식인 최초의 접근 방식이라고 믿습니다.".

더 강력한 양자 컴퓨터를 위한 EPFL의 "레시피"
인공 지능에서 암호 화폐로의 결정적인 향상?

기계 학습
EPFL 컴퓨터 과학 및 커뮤니케이션 학교(사진: Facebook/EPFL IC)

첫 번째 사용 사례: 의료진을 위한 임상 결정

MultiModN의 첫 번째 사용 사례는 임상 결정 자원이 제한된 환경의 의료진을 위한 것입니다.

실제로 의료 부문에서는 자원이 제한되어 있거나(환자가 특정 검사를 받을 여유가 없음), 반대로 자원과 정보가 풍부하기 때문에 임상 데이터가 누락되는 경우가 많습니다. MultiModN은 소위 편향을 흡수하지 않고 이러한 실제 데이터로부터 학습할 수 있으며 입력의 조합이나 수에 맞춰 예측을 조정할 수 있습니다.

"누락된 데이터는 리소스가 제한된 상황에서 나타나는 특징이며, 모델이 이러한 누락된 패턴을 학습함에 따라 예측에 오류가 발생할 수 있습니다.” 그는 지적했다 메리 앤 하틀리.

“예측할 수 없는 리소스 사용에 직면한 유연성에 대한 필요성이 MultiModN에 영감을 준 것입니다.".

주요 이벤트에서 AI 및 기계 학습이 서비스에 미치는 영향
디지털 아트에서 AI의 영향력이 커지는 모든 이유

기계 학습
분석 실험실 (Photo: Michal Jarmoluk/Pixabay)

실험실에서 실제 생활까지: 폐렴과 결핵에 대한 실험이 진행 중입니다.

그러나 이 출판물은 구현 및 현장 테스트를 향한 첫 번째 단계일 뿐입니다. Hartley 교수는 로잔 대학 병원(CHUV) 및 베른 대학 병원 Inselspital의 동료들과 협력하여 임상 연구 자원이 제한된 환경에서 폐렴과 결핵을 진단하는 데 중점을 두고 있으며 수천 명의 환자를 모집하는 과정에 있습니다. 남아 프리카 공화국, 탄자니아, 나미비아 e 베냉.

연구 그룹은 광범위한 교육 계획을 수행했습니다. 의사 100명 이상 MultiModN이 자원이 부족한 지역의 실제 데이터에 민감하도록 훈련될 수 있도록 초음파 이미지 및 비디오를 포함한 다중 모드 데이터를 체계적으로 수집합니다.

"우리는 MultiModN이 처리하도록 설계된 종류의 복잡한 다중 모드 데이터를 정확히 수집하고 있습니다.", 의사가 말했다 노에미 보일라-블랑코, CHUV의 전염병 전문가.

“우리는 이 제품을 감상할 수 있는 모델을 보게 되어 매우 기쁩니다. 누락된 리소스의 복잡성 우리의 상황과 일상적인 임상 평가의 체계적 부족", 의사를 추가했습니다 크리스티나 카이텔 스위스 수도에 있는 대학병원인 Inselspital의

AI의 안전성? 블레츨리 파크 성명은 매우 중요하다
저널리즘 서비스에서 AI를 위한 Axel Springer-OpenAI 축

EPFL의 혁신은 전문 의학 지식에 대한 접근을 제공함으로써 임상 의사결정을 개선하도록 설계되었습니다(사진: Irwan/Unsplash)

공익을 위한 머신러닝

MultiModN의 개발 및 교육은 기계 학습 도구를 현실과 공익을 위해 적용하려는 EPFL의 지속적인 노력을 나타내며, MultiModN 출시 직후에 이루어집니다. 메디트론, 의료 부문을 위해 특별히 설계된 인공 지능 모델입니다.

Meditron도 LLM(Large Language Models) 범주에 속하지만 광범위한 작업을 수행하는 일반 모델과 달리 다음 사항에 중점을 둡니다. 의료 분야, 크기 측면에서 더 컴팩트하지만 효율성은 동일합니다.

메디트론의 목표는 의료 정보에 대한 접근을 민주화하다 품질이 높아 임상 결정에 도움이 됩니다.

EPFL 연구자들은 각각 7억 개와 70억 개의 매개변수를 가진 두 가지 버전을 개발했으며, 모델은 동료 검토 과학 문헌 및 다양한 임상 지침을 포함하여 엄선된 고품질 의료 데이터 소스에 대해 훈련되어 광범위하고 정확한 지식 기반을 보장합니다.

따라서 2023년 XNUMX월에 발표된 Meditron과 MultiModN은 EPFL의 새로운 AI 센터의 사명과 일치합니다. 이는 인공 지능이 사회 모든 부문의 이익을 위해 기술 혁신을 어떻게 촉진할 수 있는지에 초점을 맞추고 있습니다.

수백만 개의 배터리를 절약할 수 있는 혁신적인 센서
AI: 이제 곧 일어날 전쟁은 우리가 예상한 것과 같지 않을 것이다…

머신 러닝: EPFL의 보다 유연한 AI를 위한 새로운 다중 모드 모델
로잔 연방 폴리테크닉 로고가 있는 EPFL 캠퍼스 외관 (사진: Facebook/EFPL IC)