EPFLден ийкемдүү AI үчүн жаңы мультимодалдык модель

Ал тексттен, сүрөттөрдөн, видеодон жана үндөн үйрөнө алат жана модулдуктун аркасында каалаган санды же божомолдордун комбинациясын чыгарат.

Machine Learning: EPFLден ийкемдүү AI үчүн жаңы мультимодалдык модель
EPFLден ийкемдүү AI үчүн жаңы мультимодалдык модель (Сүрөт: Брайан Пенни / Pixabay)

Биз OpenAI же ChatGPT жөнүндө айтып жатабызбы, чатботтордун басымдуу көпчүлүгү генеративдик жасалма интеллект деп аталгандарга негизделген Чоң тил модели (LLM), моделдери терең билим алуу чоң көлөмдөгү текст аркылуу маалыматты үйрөнүү менен аларга берилген суроолорго жооп берүүгө үйрөтүлгөн.

акыркы чек арасыгенеративдик AI болуп саналат мультимодалдык моделдер, бул тилди түшүнүү менен сүрөттөрдү, видео жана аудиону айкалыштыруу үчүн дагы алдыңкы тажрыйбаны жана кызматты сунуштайт.

Бирок аларды түзүү бир нече кыйынчылыктарды туудурат, айрыкча, эгер кичинекей масштабда мультимодалдык моделдерди куруу ниети болсо: тез-тез жетишпеген маалыматтардын болушу маалыматтын жетишсиздигинен, дээрлик дайыма ресурстардын жарым-жартылай болушунан улам.

Кыскача айтканда, тобокелдик моделдин жетишпестиктин негизинде үйрөнүп, эсептөөлөр жана божомолдор бурмаланган. Бул жерде EPFL өзүнүн жаңы долбоору менен башталды.

Лозанна жана Цюрих техникалык университетинен жашыл энергия үчүн коалиция
3D форматында Виртуалдык Чындыкты сезгич кыла турган технологиялык колкап

машина Learning
Лозаннадагы Федералдык Политехникалык Кампусу (Фото: Facebook/EFPL)

MultiModN, модулдук мультимодалдык модель Лозаннада төрөлгөн

Изилдөөчүлөр Лозаннадагы федералдык политехникалык (EPFL), инженердик жана маалымат технологиялары жагынан дүйнөдөгү эң мыкты университеттердин бири, чындыгында өнүгүп калды MultiModN, жакында NeurIPS2023 көргөзмөсүндө сунушталган уникалдуу модулдук мультимодалдык модель.

EPFLдин Компьютердик илим жана коммуникация мектебинин Билим берүү үчүн машинаны үйрөнүү (ML4ED) жана машинаны үйрөнүү жана оптималдаштыруу (MLO) лабораторияларынын изилдөөчүлөрү чоң, бирок кичине масштабда ойлонуштуруунун так карама-каршысын иштеп чыгууну жана сынап көрүүнү чечишти.

Мугалим жетектеген Мэри-Эн Хартли, MLO жана Йель медицина мектебинде биргелешип уюштурулган Глобалдык интеллектуалдык ден соолук технологиялары лабораториясынын директору жана профессор Tanja Käser, ML4ED директору, команда тексттен, сүрөттөрдөн, видеолордон жана үндерден үйрөнө ала турган мультимодалдык моделди түздү, бирок ал учурдагылардан айырмаланып, кичинекей модулдардын өзгөрүлмө саны, автономдуу жана киргизүүгө тиешелүү.

Акыркысы жеткиликтүү маалыматтын негизинде тандалып, анан каалаган сандын, комбинациянын же киргизүү түрүнүн ырааттуулугуна бириктирилиши мүмкүн. Демек, ал болжолдоолордун каалаган санын же комбинациясын чыгара алат.

«Биз MultiModNди бааладык он реалдуу ишанын ичинде медициналык диагностиканы колдоо, академиялык жетишкендикти болжолдоо жана аба ырайын болжолдоо, түшүндүрүп берди Vinitra Swamy, ML4ED жана MLO боюнча PhD студенти жана долбоордун биринчи авторлошу.

"Бул эксперименттер аркылуу биз MultiModN мультимодалдык моделдештирүү үчүн биринчи ички интерпретацияланган жана жетишпеген маалыматтарга туруктуу мамиле деп ишенебиз.".

EPFLдин күчтүүрөөк кванттык компьютерлер үчүн "рецепт"
Жасалма интеллекттен криптовалюталар үчүн чечүүчү түрткү болобу?

машина Learning
EPFL информатика жана байланыш мектеби (Фото: Facebook/EPFL IC)

Биринчи колдонуу учуру: медициналык кызматкерлер үчүн клиникалык чечимдер

MultiModN биринчи колдонуу учуру колдоо системасы катары болот клиникалык чечимдер ресурстары чектелген шарттарда медициналык кызматкерлер үчүн.

Саламаттыкты сактоо тармагында, чындыгында, клиникалык маалыматтар, балким, ресурстардын чектелгендигинен (оорулуунун белгилүү бир тестти өткөрө албайт) же, тескерисинче, ресурстардын жана маалыматтын көптүгүнөн улам жок болот. MultiModN бул реалдуу маалыматтардан анын бир тараптуулук деп аталганын өзүнө сиңирип албастан үйрөнө алат жана болжолдоолорду каалаган комбинацияга же киргизүүлөрдүн санына ылайыкташтыра алат.

«Дайындардын жетишсиздиги ресурстун чектелген контексттериндеги өзгөчө белги болуп саналат жана моделдер бул жетишпеген калыптарды үйрөнгөндөн кийин, алар өздөрүнүн божомолдорундагы каталарды коддой алышат. деп баса белгиледи ал Мэри-Эн Хартли.

"Күтүлбөгөн жеткиликтүү ресурстардын алдында ийкемдүүлүктүн зарылдыгы MultiModNди шыктандырган.".

Эң негизгиси, AI жана машинаны үйрөнүүнүн кызматтарга тийгизген таасири
Санариптик искусствого AI таасиринин күчөшүнүн бардык себептери

машина Learning
Анализ лабораториясы (Сүрөт: Михал Жармолук/Pixabay)

Лабораториядан реалдуу жашоого: пневмония жана кургак учук боюнча сот процесси жүрүп жатат

Басылма, бирок, ишке ашырууга жана талаа сыноосуна карай биринчи гана кадам болуп саналат. Профессор Хартли Лозанна университетинин ооруканасында (CHUV) жана Инсельспиталда, Берн университетинин ооруканасында кесиптештери менен бирге иш алып барды. клиникалык изилдөөлөр ресурсу чектелген шарттарда пневмония жана кургак учук дарттарын аныктоого багытталган жана миңдеген бейтаптарды тартуу процессинде. Түштүк Африка, Танзания, Намбия e бенин.

Изилдөө топтору кеңири окутуу демилгесин көтөрүштү 100дөн ашык дарыгерлер MultiModN аз ресурстук аймактардан реалдуу маалыматтарга сезимтал болууга үйрөтүлүшү үчүн, системалуу түрдө мультимодалдык маалыматтарды, анын ичинде УЗИ сүрөттөрүн жана видеолорун чогултуу.

"Биз MultiModN иштетүү үчүн иштелип чыккан татаал мультимодалдык маалыматтарды чогултуп жатабыз", - деди дарыгер Ноэми Бойлат-Бланко, ЧУВнын инфекционист.

«Биз баалай турган моделди көргөнүбүзгө кубанычтабыз жетишпеген ресурстардын татаалдыгы биздин контекстте жана күнүмдүк клиникалык баа берүүнүн системалуу жоктугу", деп кошумчалады дарыгер Кристина Кейтел Швейцариянын борборундагы университеттик оорукананын Inselspital.

AI коопсуздугу? Bletchley Park билдирүүсү абдан маанилүү
Axel Springer-OpenAI огу журналистика кызматында AI үчүн

EPFLдин инновациясы атайын медициналык билимге жетүүнү камсыз кылуу аркылуу клиникалык чечимдерди кабыл алууну жакшыртуу үчүн иштелип чыккан (Фото: Irwan/Unsplash)

Машинаны үйрөнүү коомдук жыргалчылыкка кызмат кылат

MultiModNди иштеп чыгуу жана окутуу EPFLнин машиналык окуу куралдарын чындыкка жана коомдук жыргалчылыкка ыңгайлаштыруу аракеттеринин уландысын билдирет жана ишке киргизилгенден көп өтпөй келет. Meditron, атайын медициналык сектор үчүн иштелип чыккан жасалма интеллект модели.

Meditron ошондой эле Large Language Models (LLM) категориясына кирет, бирок кеңири чөйрөдөгү милдеттерди аткарган жалпы моделдерден айырмаланып, ал медицина тармагы, жана көлөмү жагынан кыйла компакттуу, бирок бирдей эффективдүү.

Meditron максаты болуп саналат медициналык маалыматка жетүүнү демократиялаштыруу жогорку сапаттагы, ошентип клиникалык чечимдерди кабыл алууга жардам берет.

EPFL изилдөөчүлөрү тиешелүүлүгүнө жараша 7 миллиард жана 70 миллиард параметрлери бар эки версияны иштеп чыгышкан жана моделдер тандалган, жогорку сапаттагы медициналык маалымат булактарында, анын ичинде рецензияланган илимий адабияттар жана ар кандай клиникалык көрсөтмөлөр боюнча окутулган, кенен жана так билим базасын камсыз кылышкан.

2023-жылдын ноябрында сунушталган Meditron да, MultiModN да EPFLдин жаңы AI борборунун миссиясына шайкеш келет, ал жоопкерчиликтүү жана эффективдүү жасалма интеллект коомдун бардык секторлорунун жыргалчылыгы үчүн технологиялык инновацияларды кантип илгерилетүүсүнө багытталган.

Миллиондогон батареяларды үнөмдөй турган революциялык сенсорлор
AI: баштала турган согуш биз күткөндөй болбойт…

Machine Learning: EPFLден ийкемдүү AI үчүн жаңы мультимодалдык модель
Лозаннадагы Федералдык Политехникалык логотип менен EPFL кампусунун сырткы көрүнүшү (Фото: Facebook/EFPL IC)