Янив Эрлих — израильско-американский учёный . Ранее он занимал должность доцента кафедры компьютерных наук в Колумбийском университете и был главным научным сотрудником MyHeritage . [1] Работа Эрлиха сочетает в себе компьютерные науки и геномику .
Доктор Эрлих родился в Израиле . Он получил степень бакалавра наук в области наук о мозге в 2006 году в Тель-Авивском университете и степень доктора философии в области биоинформатики в 2010 году в Школе биологических наук Уотсона в лаборатории Cold Spring Harbor . С 2010 по 2015 год Эрлих был научным сотрудником Института Уайтхеда Массачусетского технологического института . С 2015 по 2019 год он руководил лабораторией в Колумбийском университете по вычислительной геномике. [2] С 2020 года по настоящее время он занимает должность генерального директора Eleven Therapeutics. [3]
Команда Эрлиха опубликовала исследование в журнале Science , в котором сообщалось о краудсорсинге десятков миллионов генеалогических записей с сайта Geni.com . [4] Команда смогла создать единое генеалогическое древо из 13 миллионов человек, которые все связаны и охватывают десятки поколений и более 600 лет истории. [5] Исследование использовало данные для анализа генетики долголетия и семейной дисперсии [6]
В другом направлении исследований Эрлих и Джо Пикрелл создали веб-сайт под названием DNA.Land для сбора геномных наборов данных участников потребительской геномики. [7] К ноябрю 2018 года на веб-сайте было собрано более 130 000 наборов данных.
Группа Эрлиха опубликовала несколько исследований на тему генетической конфиденциальности . В 2013 году они сообщили о возможности восстановления фамилии мужчины из его якобы анонимного геномного набора данных, что может привести к отслеживанию его полной личности. [8] Метод использует совместное наследование фамилий и Y-хромосом в большинстве обществ. Таким образом, сравнивая Y-хромосому интересующего человека с генетической генеалогической базой данных Y-хромосом, в некоторых случаях можно вывести фамилию. Команда подсчитала, что 12% мужчин в США подлежат успешному восстановлению фамилии. Команда также продемонстрировала, что после восстановления фамилии основные демографические идентификаторы, такие как возраст и место жительства, могут позволить отследить личность человека. Чтобы продемонстрировать силу метода, они восстанавливают идентичность нескольких 1000 геномов путем выведения фамилии.
В 2014 году Эрлих и Арвинд Нараянан опубликовали обзор методов взлома геномных наборов данных. [9] Они предсказали, что аутосомный поиск в GEDmatch может быть использован для отслеживания личности анонимных людей, как только база пользователей GEDmatch достигнет определенного размера, что действительно произошло в 2018 году, когда веб-сайт использовался для поимки « Убийцы из Золотого штата» .
В 2018 году команда Эрлиха опубликовала исследование в журнале Science, в котором сообщалось, что около 60% американцев европейского происхождения имеют по крайней мере троюродного брата, совпадающего в GEDmatch, что теоретически может позволить их идентификацию. [10] Через два-три года практически любого человека в этой этнической группе можно будет теоретически отследить с помощью этой техники, если текущие темпы роста GEDmatch сохранятся. [11] Команда предложила технику криптографической подписи, чтобы снизить вероятность неправомерного использования прямых поисков на потребительских веб-сайтах полицией.