Сомнительные данные в моделях ИИ для прогнозирования инсульта и диабета
Группа исследователей, возглавляемая Адрианом Барнеттом из Квинслендского технологического университета, обнаружила, что множество моделей ИИ, использующих данные для оценки риска инсульта и диабета, обучены на сомнительных наборах данных. В своей работе, опубликованной в журнале Nature, они проанализировали 124 рецензируемые статьи, в которых применялись два общедоступных набора медицинских данных с неопределенным происхождением.
Первый набор, касающийся инсульта, включает данные о 5 110 пациентах и был скачан более 288 000 раз. Однако исследователи отметили, что в нем почти отсутствуют пропуски, что ненормально для реальных данных. Второй набор, о диабете, содержит информацию о 100 000 человек, но лишь 18 значений уровня глюкозы, что также вызывает сомнения. Обе коллекции данных использовались в научных исследованиях, однако их надежность поставлена под сомнение, так как это может привести к ошибочным медицинским заключениям. Журнал Scientific Reports уже отозвал несколько статей из-за вопросов относительно достоверности данных.