MedGemma от Google: Открытый медицинский ИИ для изображений, ЭМК и не только
🧬 Что такое MedGemma?
MedGemma — последнее пополнение Google Research в рамках Health AI Developer Foundations (HAI‑DEF), представляющее собой открытые мультимодальные ИИ‑модели, специализированные для медицинской сферы. Основанная на мощной архитектуре Gemma 3, MedGemma расширяет возможности моделей в области обработки медицинских изображений, электронных медицинских карт (ЭМК) и традиционного медицинского текста.
🆕 Новинки
-
MedGemma 27B Multimodal
- Интерпретирует объединённые длительные пациентские записи и медицинские изображения (например, рентген грудной клетки, гистопатология, дерматология, фундус‑фотография)
- Достигает 87,7% точности на бенчмарке MedQA, превосходя даже более крупные модели при значительно меньших вычислительных затратах.
-
MedSigLIP
- Компактный кодировщик на 400 млн параметров, предназначенный для приведения медицинских изображений и текста к общей репрезентации.
- Позволяет осуществлять классификацию, zero-shot‑предсказания и семантический поиск между различными модальностями.
📊 Эффективность MedGemma
Модель | Параметров | Типы входа | Оценка MedQA |
---|---|---|---|
4B Multimodal | 4B | Изображение + Текст | 64,4% |
27B Только текст | 27B | Текст | 87,7% |
27B Multimodal | 27B | Изображение + Текст | 87,7% |
- Отчёты о рентгене грудной клетки: Сгенерированные отчёты MedGemma 4B были пригодны для ведения пациентов в 81% случаев клинической валидации — сопоставимо по качеству с работой врачей‑радиологов.
🔧 Почему открытость важна
- Конфиденциальность и свобода развёртывания: Могут работать как локально на устройстве, так и в облаке, обеспечивая сохранность данных.
- Высокая настраиваемость: Подстраивается под уникальные клинические задачи — например, традиционную китайскую медицину, экстренную сортировку рентгеновских снимков.
- Воспроизводимость результатов: Поставляется как открытые контрольные точки для стабильной, развиваемой сообществом разработки.
- Доступная экосистема: Доступна на Hugging Face, Vertex AI и GitHub для разработчиков по всему миру.
👩 Примеры использования
- DeepHealth (США): Применяется для сортировки рентгеновских снимков грудной клетки и обнаружения узлов.
- Больница Чан Гун (Тайвань): Адаптирована для работы с текстами по традиционной китайской медицине.
- Tap Health (Индия): Используется для резюмирования медицинских записей и клинических рекомендаций.
📈 Почему это важно
-
Медицинские технологии мирового класса — в вашем телефоне. MedGemma 4B достаточно компактна для работы на потребительских устройствах, открывая новые возможности для регионов с ограниченными ресурсами.
-
Снижение барьеров для инноваций. Маленькие клиники и малообеспеченные регионы получают доступ к передовым возможностям в области ИИ для здравоохранения без закрытых платформ.
-
Надёжные инновации на ИИ. Открытые и прозрачные релизы способствуют более безопасному и совместному развитию медицинских ИИ‑систем.
🧭 Как начать
- Изучите модель на:
- GitHub
- Hugging Face
- Google Vertex AI
- Выберите вариант:
- 4B для компактных мобильных приложений
- 27B для клинических рассуждений и сложной диагностики
- Дообучите или настройте prompts для вашей задачи.
🛑 Важные замечания и будущее развитие
- Не является медицинским изделием — для клинического применения требуется локальная валидация.
- Активные направления разработки: ввод нескольких изображений, поддержка других языков, многошаговое рассуждение.
🧠 Вывод
Модели MedGemma от Google — это значительный прорыв в области медицинского ИИ: мультимодальные, точные, открытые и доступные. От рентгеновских снимков и дерматологии до сложных клинических рассуждений — MedGemma предоставляет мощные ИИ‑инструменты даже на небольших устройствах.
Оригинальный пост: > MedGemma: Our most capable open models for health AI development →