Давайте я приведу еще один пример – уже реально действующий и преображающий жизни миллионов людей. Всего несколько лет назад Ноттингемский университет разработал приложение под названием MyBabyFace при содействии Фонда Билла и Мелинды Гейтс. Проблема: общемировая младенческая смертность остается высокой – 22 смерти на 1000 живых новорожденных, – особенно в странах, где нет высокотехнологичных установок для УЗИ и квалифицированных врачей. Большинство из этих смертей случается из-за математических ошибок: очень трудно высчитать точный возраст младенца, если не знать даты зачатия. Соответственно, не всегда понятно, что роды преждевременные, и врачи часто упускают возможности для простого, недорогого вмешательства, которое предотвратило бы осложнения от преждевременных родов, например гипотермию. Приложение MyBabyFace использует всю мощь краудсорсинга. Родители всего мира выкладывают фотографии пяток, лица и ушей младенцев, а также неделю, на которой они были рождены. На данный момент приложение только собирает данные, но разработчики надеются, что удастся сделать базу данных, которая поможет оценить, сколько недель ребенок пробыл в утробе. Еще одно приложение, Neogest, оценивает, насколько до срока родился ребенок, используя параметры вроде глубины морщинок на пятках и округлости глаз.
Эффект Google
Знаете, почему инструменты по анализу данных вроде Google так великолепны? Это постоянно эволюционирующая гигантская система каталогизации – организации всей информации в Интернете. В компьютерном мире структуру данных, содержащую огромное количество данных, закодированных таким способом, чтобы их можно было легко найти и просмотреть, называют хеш-таблицами. Но Google работает еще лучше, чем, скажем, хеш-таблица, которая используется в огромной библиотеке, чтобы расставлять, хранить и отслеживать книги. Каждый раз, когда кто-то проводит поиск на сайте, Google улучшает выдачу результатов и сайт становится еще мощнее. Именно такая мощь придет и в мир медицины в «Завтра…»; у нас будут хеш-таблицы для геномики, протеомики, факторов окружающей среды (например, жизни возле скоростного шоссе), образа жизни (например, палеодиеты или курения), медицинских проблем (например, диабета или аллергии на моллюсков). Каждый день я лечу пациентов, похожих на тех, кто приходил ко мне на прошлой неделе; тем не менее я не улучшаю качество своего лечения или рекомендаций на основе знаний, полученных от предыдущих пациентов, потому что система для этого не подготовлена. Но вскоре она будет готова. Сила «гугловского» подхода к данным состоит в том, что качество моей работы будет улучшаться с каждым новым пациентом; в базе данных будет все больше информации, на которой можно основывать принятие решений, так что и я, и мои пациенты сможем работать лучше. Данных сейчас собирается просто колоссальное количество: по некоторым оценкам, за два дня 2015 года генерируется больше данных, чем было собрано с начала цивилизации до 2003 года.
Вот хороший вопрос: кто будет заниматься хостингом и управлением всеми этими данными, многие из которых – приватная информация? Нужно создать некую новую некоммерческую организацию, которая будет хранить все эти данные и сделает их безопасными и анонимными. Эти данные – ценнейший мировой ресурс, и их нужно охранять и защищать от предвзятости, которую, несомненно, проявят государства и коммерческие компании, получив к ним доступ. Они вполне могут злоупотребить этими данными в целях дискриминации или, хуже того, шантажа. Нам нужен только один хост, чтобы база оказалась достаточно большой, чтобы из нее можно было извлечь ответы.
Моя клиника, к примеру, и еще одиннадцать клиник по всей стране сотрудничают с суперкомпьютером IBM под названием Watson, который научили анализировать генетические данные о раковой опухоли пациента и искать в научной литературе способы его лечения. Искусственный интеллект «когнитивного» компьютера получает все больше информации и учится находить подходящее лечение для пациентов, и, таким образом, Watson помогает нам приблизиться к главной цели – по-настоящему персонализированной медицине. Эту надежду отлично сформулировали в статье