Бесплатная поисковая система по схожести текста
eTBLAST был бесплатным сервисом текстового сходства, ныне несуществующим. Первоначально он был разработан Александром Перцемлидисом и Гарольдом «Скипом» Гарнером в 2005 году в Юго-Западном медицинском центре Техасского университета. Он предлагал доступ к следующим базам данных:
eTBLAST искал в базах данных цитирования [1] и базах данных, содержащих полный текст, таких как PUBMED . Он сравнивал естественный текстовый запрос пользователя с целевыми базами данных, используя гибридный алгоритм поиска. Алгоритм состоял из низкочувствительного, взвешенного, основанного на ключевых словах первого прохода, за которым следовал новый второй проход, основанный на выравнивании предложений. Позднее eTBLAST стал веб-сервисом Лаборатории инноваций в Институте биоинформатики Вирджинии .
Механизм текстового сходства изучал дублирующие публикации и потенциальный плагиат в биомедицинской литературе. eTBLAST получил тысячи случайных образцов рефератов Medline для масштабного исследования. Те, у кого было наибольшее сходство, были оценены, а затем введены в онлайн-базу данных. Работа выявила несколько тенденций, включая увеличивающуюся скорость дублирования в биомедицинской литературе, согласно известным научным журналам Bioinformatics , [2] Anaesthesia and Intensive Care , [3] Clinical Chemistry , [4] Urologic oncology , [5] Nature , [6] and Science . [7]
Смотрите также
Ссылки
- ^ Льюис, Дж.; Оссовски, С.; Хикс, Дж.; Эррами, М.; Гарнер, ХР. (2006). «Сходство текста: альтернативный способ поиска в MEDLINE». Биоинформатика . 22 (18): 2298–304. doi : 10.1093/bioinformatics/btl388 . PMID 16926219.
- ^ Errami, M; Hicks, JM; Fisher, W; Trusty, D; Wren, JD; Long, TC; Garner, HR (2007). «Deja vu: исследование дублирующихся цитат в Medline». Bioinformatics . 24 (2): 243–9. doi : 10.1093/bioinformatics/btm574 . PMID 18056062.
- ^ Loadsman, JA; Garner, HR; Drummond, GB (2008). «К устранению дублирования в анестезиологии и интенсивной терапии». Анестезия и интенсивная терапия . 36 (5): 643–5. doi : 10.1177/0310057X0803600502 . PMID 18853580.
- ^ Джордж, AC; Лонг, TC; Гарнер, HR (2010). «Quaere Verum». Клиническая химия . 56 (4): 673–4. doi : 10.1373/clinchem.2009.130468 . PMID 20093558.
- ^ Гарнер, HR (2011). «Борьба с неэтичными публикациями с помощью служб обнаружения плагиата». Urologic Oncology . 29 (1): 95–9. doi :10.1016/j.urolonc.2010.09.016. PMC 3035174. PMID 21194644 .
- ^ Эррами, М.; Гарнер, Х. (2008). «Рассказ о двух цитатах». Nature . 451 (7177): 397–9. Bibcode : 2008Natur.451..397E. doi : 10.1038/451397a . PMID 18216832. S2CID 4358525.
- ^ Лонг, TC; Эррами, M; Джордж, AC; Сан, Z; Гарнер, HR (2009). «Реагирование на возможный плагиат». Science . 323 (5919): 1293–4. doi :10.1126/science.1167408. PMID 19265004. S2CID 28467385.
Внешние ссылки