stringtranslate.com

Википедия: Запросы на изменение ссылок/URL

  • WP:URLREQ

Эта страница предназначена для запроса изменений URL-адресов, таких как пометка их как устаревших или переход на новый домен. Некоторые боты предназначены для исправления гниения ссылок; их можно уведомить здесь. К ним относятся InternetArchiveBot и WaybackMedic . Эту страницу могут отслеживать операторы ботов из других языковых вики, поскольку изменения URL-адресов применимы повсеместно.

Ремонт MetaCritic

Metacritic недавно обновил свои веб-страницы. В частности, для видеоигр у них теперь есть центральная целевая страница для игр, которая не зависит от платформы, и отображение конкретных результатов для данной платформы теперь является параметром запроса в URL-адресе. См. пример Special:Diff/1182032153 . Вероятно, это затронет 50 000–100 000 или более URL-адресов. -- хорек ( обсуждение ) 18:41, 26 октября 2023 г. (UTC) Ответить [ ответить ]

Пользователь:Ferret : Просматриваю внешние ссылки...
  • Сравните новый со старым архивом. Старый архив лучше. Это регрессивный дрейф контента, дрейф от хорошего к плохому.
  • Этот http://www.metacritic.com/film/titles/inthenameoftheking возвращает 404. Однако по адресу https://www.metacritic.com/movie/in-the-name-of- есть живая страница фильма. the-king-a-dungeon-siege-tale/ с хорошим содержанием.. как обнаружить перенаправление? WaybackMachine спрятал его в снимках 2010 года: нажмите на 12 декабря и следуйте перенаправлениям. Таким образом, теоретически можно было бы преобразовать эту страницу в новый URL-адрес, выполнив обнаружение старого перенаправления в WM. Но все ли URL-адреса имеют перенаправление 2010 года? Без понятия. И всегда ли полезна живая страница? Предыдущий пример предполагает, что нет. Сложные осложнения.
  • Может быть, если бы я только сделал /game/<platform>/<title> и преобразовал их в /game/<title>/critic-reviews/?platform=<platform> .. У MC также есть фильмы, книги, музыка и т. д. но не знаю, как их конвертировать, на данный момент.
  • Анализ первого прохода: MetaCritic — очень большой сайт, который за годы менялся несколько раз. Вероятно, в Википедии не проводилось особого обслуживания. Содержание иногда дрейфовало, иногда регрессировало. Перенаправления, которые когда-то существовали, больше не работают, но их можно найти в WaybackMachine. У большинства мертвых ссылок на MetaCritic есть живая страница, но из-за масштаба и изменений с течением времени найти их вручную сложно. В худшем случае решение — конвертировать мертвые ссылки в архивные URL-адреса, что до сих пор было решением по умолчанию. -- Зеленый C 21:41, 26 октября 2023 г. (UTC) Ответ [ ответ ]
Да, я могу говорить только об изменениях в форматировании /game/. Насколько это влияет на фильмы, книги, музыку и т. д., я не знаю. В случаях, которые я проверял в играх, их восстанавливает простая перетасовка URL-адресов. -- хорек ( разговор ) 22:30, 26 октября 2023 г. (UTC) Ответить [ ответить ]

Пользователь:Ferret — Добавили перенаправления. Попробуй это!

Основное отличие теперь заключается в том, что первая ссылка перенаправляет на страницу сводки для всей платформы, тогда как раньше она вела на страницу сводки для конкретной платформы. Сравните со старой версией рядом с названием игры есть серый значок «ПК». В новой версии нет сводной страницы для конкретной платформы. Большинство ссылок относятся к этому типу ссылок на сводную страницу. Другая проблема заключается в том, что в примере Special:Diff/1182032153, приведенном выше, ссылка на страницу сводки была преобразована в страницу критических обзоров. Возможно, именно это и было задумано для этих цитат, но я не могу через бота определить, что все ссылки на страницы сводки должны быть конвертированы в страницы с критическими отзывами. Конечно, это хорошее предположение, но, возможно, не все изменения являются правильными. Изменение такого масштаба потребует обсуждения с другими, поэтому я могу указать на обсуждение на случай, если кто-то будет жаловаться, если вы все еще хотите это сделать. Я воздержусь от каких-либо действий, пока не получу от вас ответ о том, как вы хотите действовать. Не торопитесь, спасибо. -- Зеленый C 23:31, 30 октября 2023 г. (UTC) Ответ [ ответ ]

Я думаю, что с перенаправлениями мы в лучшей форме. Это не идеально, но вполне осуществимо, и таким образом вы все равно сможете получить результат. -- хорек ( обсуждение ) 23:35, 30 октября 2023 г. (UTC) Ответить [ ответить ]
Пользователь:Ferret : Вспомните пример inthenameoftheking выше. Они создали перенаправление в 2010 году, но в какой-то момент оно перестало работать, возможно, когда позже они изменили целевой URL. Они не поддерживали многоуровневое перенаправление. Текущие перенаправления могут продлиться некоторое время, но в конечном итоге они, скорее всего, тоже зайдут в тупик. Я могу заранее изменить URL-адреса на новый целевой URL-адрес, это выиграет Википедии больше времени и сделает будущие обновления менее сложными. Это большой проект, но не срочный, сделаю, если время позволит. Что вы думаете? -- Зеленый C 15:33, 31 октября 2023 г. (UTC) Ответ [ ответ ]
Да, дерзай. Вы более осведомлены о будущих проблемах. Я просто не хотел, чтобы ты работал, если сейчас ты чувствуешь, что это достаточно хорошо. Насколько я могу судить, для полной четности URL-адрес следует изменить с /game/<platform>/<title> на game/<title>/critic-reviews/?platform=<platform> -- Ferret ( talk ) 16:04, 31 октября 2023 г. (UTC) Ответить [ ответить ]
Re: паритет, страница сводки — это не то же самое, что страница отзывов критиков. На сводной странице есть подробная информация + отзывы пользователей + отзывы критиков. Например, сводка включает описание, издателя и дату выпуска. Вероятно, это часто цитируется в Википедии, но на странице критических обзоров этого нет. Я думаю, что безопаснее сохранять ссылку на страницу сводки, если только не указана конкретная страница.. таким образом, страница сводки /game/<platform>/<title> перейдет в /game/<title> .. потому что есть на новом сайте нет сводной страницы для конкретной платформы, и это было главное изменение. Единственный способ получить платформу — это страница обзоров критиков. Таким образом, нет полного равенства для сводных страниц, но, по моему мнению, это все равно хорошо. -- Зеленый C 17:29, 31 октября 2023 г. (UTC) Ответ [ ответ ]
Metacritic для видеоигр используется только для получения оценок Critic Review. Мы не используем его для указания даты выпуска, издателя и т. д. Это связано с тем, что эти данные получены из GameFAQ, ненадежной базы данных USERG. Именно поэтому мы не собираем отзывы пользователей (если только они не подтверждены надежным вторичным источником) – хорек ( обсуждение ) 17:45, 31 октября 2023 г. (UTC) Ответить [ ответить ]
ХОРОШО. В таком случае я преобразую сводные страницы в обзоры критиков. -- Зеленый C 19:27, 31 октября 2023 г. (UTC) Ответ [ ответ ]
@ GreenC Обнаружена неожиданная проблема. «switch» необходимо преобразовать в «nintendo-switch». Замечено на Special:Diff/1182880804 . На данный момент это единственная проблема, я проверил множество других ссылок и платформ. -- хорек ( обсуждение ) 23:41, 31 октября 2023 г. (UTC) Ответить [ ответить ]
Я исправил это, но в очереди около 400. Я вернусь и починю те, что на вики. Немного сложнее, чем поиск-замена из-за URL-адресов архивов, которые еще нужно «переключить». Если увидите что-нибудь еще, дайте мне знать, спасибо за выборочную проверку. Ремонтировать вещи не проблема. -- Green C 00:30, 1 ноября 2023 г. (UTC) Ответить [ ответить ]
@GreenC Нашел еще один . «ios» на «ios-iphoneipad». Пример : Special:Diff/1182883899 . -- хорек ( обсуждение ) 00:44, 1 ноября 2023 г. (UTC) Ответить [ ответить ]
Спасибо. "switch" и "ios" сделаны, отремонтировано около 300 страниц. Всего существует около 10 400 страниц с URL-адресом /game/. Первые 2500 готовы. -- Green C 01:57, 1 ноября 2023 г. (UTC) Ответить [ ответить ]
Работа бота(ред):
  • Проверено 10 409 страниц, содержащих один или несколько URL-адресов /game/.
  • Преобразовали 20 018 URL-адресов в новый формат.
  • Добавлено 9 URL-адресов архивов, где URL-адрес /game/ не работает с новым форматом и существует архив.
  • Добавлено 39 , где URL-адрес /game/ не работает с новым форматом и архива не существует.{{dead link}}
  • Различные другие исправления: преобразование в https, переустановка |url-status=из мертвого состояния в живое.
-- Green C 00:48, 2 ноября 2023 г. (UTC) Ответить [ ответить ]

apnews.com

По запросу в Википедии:Доска_объявлений администратора#Major_source_problem_with_Associated_Press . -- Зеленый C 21:49, 30 октября 2023 г. (UTC) Ответ [ ответ ]

Я создал список страниц с неработающими ссылками на страницах исправления User:Bri/AP . ☆ Бри ( обсуждение ) 21:57, 31 октября 2023 г. (UTC) Ответить [ ответить ]
По приведенной выше ссылке я подожду еще немного, чтобы посмотреть, исправится ли AP самостоятельно. Они признали наличие проблемы. Спасибо за результаты поиска рецептов. -- Green C 04:09, 2 ноября 2023 г. (UTC) Ответить [ ответить ]

Глядя на [1] (15 мая 2000 г.) из ...Baby One More Time (альбом), ссылка остается недействительной. -- Зеленый C 17:29, 13 ноября 2023 г. (UTC) Ответ [ ответ ]

rpgfan.com

Некоторое время назад они переместили свои обзоры игр и обзоры саундтреков в новую структуру ссылок, и их старые превью игр, похоже, исчезли навсегда. Любая ссылка, заканчивающаяся на .html, не работает.

Обзоры игр: Старый [2] Новый [3]

Обзоры саундтреков: Старый [4] Новый [5]

Превью: Старый [6] QuietCicada - Обсуждение 11:57, 4 ноября 2023 г. (UTC) Ответить [ ответить ]

QuietCicada : Их трудно или невозможно определить. Например http://www.rpgfan.com/reviews/romancingsagaminstrel/index.html -> http://www.rpgfan.com/reviews/romancing-saga-minstrel/, но нет способа определить, куда поместить «-». На некоторых из них уже есть тире, и достаточно просто удалить index.html. В этом домене около 1000 ссылок, и возможно, потратив много времени и усилий, я смогу сэкономить несколько сотен. Я думаю, что лучшее решение — позволить IABot добавлять URL-адреса архивов, когда ссылка не работает. Кроме того, если вы хотите создать карту старых->новых URL-адресов на индивидуальной основе, мой бот может использовать эту карту для обновления цитат. -- Зеленый C 15:52, 6 ноября 2023 г. (UTC) Ответ [ ответ ]

report.iihf.hockey

Сайт reports.iihf.hockey не отвечает. Судя по всему, все эти ссылки придется переписать на «stats.iihf.com». Майо Т. ( обсуждение ) 13:45, 5 ноября 2023 г. (UTC) Ответить [ ответить ]

Майо Т .: бот отредактировал 1706 страниц. Он изменил 8795 URL-адресов. Пример: Special:Diff/1090651163/1184693466 . Плюс прочее разное. На чемпионате мира по инлайн-хоккею с шайбой 2009 года было обнаружено несколько десятков неработающих ссылок / Special:Diff/1178262869/1184678508 . Может быть, URL-адреса содержат синтаксическую ошибку? -- Green C 01:33, 12 ноября 2023 г. (UTC) Ответить [ ответить ]

Большое спасибо GreenC!
Что касается этих неправильных URL-адресов, то там отсутствует слово «встроенный». Правильный URL-адрес выглядит так: https://stats.iihf.com/Hydra/inline/137/IHM137A04_74_5_0.pdf.
Майо Т. ( разговор ) 10:56, 12 ноября 2023 г. (UTC) Ответ [ ответ ]
Ничего страшного. Эта задача заняла большую часть дня, потому что мой шаблонный код не соответствовал этой задаче из-за того, как URL-адреса использовались в статье, и потребовалось время, чтобы разобраться, поэтому я смог внести улучшения в шаблон для обобщенное использование в будущем. Также исправлена ​​недостающая строка: Special:Diff/1184690551/1184846336Green C 00:21, 13 ноября 2023 г. (UTC) Ответить [ ответить ]

Metrolyrics.com

впервые сообщается на Meta:User_talk:InternetArchiveBot#metrolyrics.com.

Домен мертв и имеет доступ к шаблону. Сообщил пользователь: Биллингхерст . -- Зеленый C 17:35, 7 ноября 2023 г. (UTC) Ответ [ ответ ]

Пользователь: Billinghurst : бот нашел около 40 страниц, требующих обновления, и я не смог найти ничего в пространстве имен шаблона. -- Green C 02:44, 12 ноября 2023 г. (UTC) Ответить [ ответить ]
@ GreenC : В Викиданных показаны три шаблона, но широко используется только один (Шаблон: Песня MetroLyrics (Q13256314) , которую намеревались упомянуть в метавики. Я оставлю заметку на всех соответствующих страницах обсуждения, где она будет размещена. невидимый, <пожимает плечами> — Billinghurst sDrewth 07:31, 12 ноября 2023 г. (UTC) Ответ [ ответ ]
Пользователь: Billinghurst : Он был удален Wikipedia:Templates_for_discussion/Log/2021_November_20#Template:MetroLyrics_song на enwiki. К сожалению, мой бот не может исправлять шаблоны на других вики, и я не знаю ни одного бота, который мог бы это сделать, поскольку для каждой вики требуется подать заявку и получить разрешения для ботов. Я имею в виду, что, возможно, так и было бы, если бы я замаскировался под IABot, одного из немногих ботов с предустановленными глобальными разрешениями для ботов. Однако для этого потребуется специальный код, а это трудоемкий проект. Я подумаю об этом. -- Green C 00:10, 13 ноября 2023 г. (UTC) Ответить [ ответить ]

biblioteca.sernageomin.cl

​Этот домен, на который неоднократно ссылались, главным образом в цитатах, кажется, часто ломается. Можно ли сделать массовое архивное дополнение к его использованию, особенно в цитатах? Джо-Джо Эумерус ( обсуждение ) 15:48, 11 ноября 2023 г. (UTC) Ответить [ ответить ]

ХОРОШО. Сделаю. -- Зеленый C 16:13, 11 ноября 2023 г. (UTC) Ответ [ ответ ]

Jo-Jo Eumerus , бот обработал 161 страницу, содержащую *.sernageomin.cl, и получил следующие результаты:

-- Зеленый C 23:58, 12 ноября 2023 г. (UTC) Ответ [ ответ ]

Спасибо. Я подозреваю, что некоторые из этих «мертвых ссылок» можно заменить другими ссылками - есть ли где-нибудь список? Джо-Джо Юмерус ( обсуждение ) 09:20, 13 ноября 2023 г. (UTC) Ответить [ ответить ]

Джо-Джо Эумерус : 4 из этих ссылок, например, в Хоркере (кальдера), могут быть ложноположительными, т.е. ссылка не существует. -- Green C 15:19, 13 ноября 2023 г. (UTC) Ответ [ ответ ]

Да, похоже, для некоторых из них подойдет замена на https://catalogobiblioteca.sernageomin.cl/Archivos/. Я поработаю над этим. Джо-Джо Эумерус ( обсуждение ) 17:23, 13 ноября 2023 г. (UTC) Ответить [ ответить ]

веб-рекордер.io

Преобразуйте URL-адреса архива webrecorder.io, как в этом примере Special:Diff/1184954276/1184954464 . -- Зеленый C 17:25, 13 ноября 2023 г. (UTC) Ответ [ ответ ]

Сделанный. -- Зеленый C 18:27, 13 ноября 2023 г. (UTC) Ответ [ ответ ]

bookcritics.org

В домене много soft-404. -- Green C 00:59, 14 ноября 2023 г. (UTC) Ответить [ ответить ]

Сделанный. Отредактировано 190 страниц и исправлено около 220 цитат, большинство из которых soft404. ОбразецGreen C 05:16, 15 ноября 2023 г. (UTC) Ответ [ ответ ]

top10cinema.com

Хотя здесь говорится, что он доступен, эта ссылка перенаправляет в другое место. Похоже на узурпацию . Интересно, сколько таких ссылок? Kailash29792 (обсуждение) 04:39, 15 ноября 2023 г. (UTC) Ответить [ ответить ]

137. Я узурпирую их, но это может занять некоторое время, потому что это будет частью следующей партии WP:JUDI , которой потребуется время, чтобы найти 30 или 40 доменов для заполнения следующей партии. Если только нет срочной заявки. Добавлен . -- Green C 05:22, 15 ноября 2023 г. (UTC) Ответить [ ответить ]

Washingtonindependent.com

См. Википедию:Надежные источники/Доска объявлений#Washington Independent .
Вероятно, нам следует избавиться от любых ссылок на действующий домен (это мусор и может быть занесено в черный список) и следует использовать только снимки archive.org, сделанные до 2015 года. Если старого снимка нет, ссылку следует полностью удалить. Это возможно?
Снимок за сентябрь 2014 года, где последние заголовки относятся к январю 2012 года. Снимки домашней страницы убедительно свидетельствуют о том, что сайт не работал с 2015 по 2019 год. В 2020 году срок действия домена истек, уведомление от godaddy гласит: «Срок действия этого доменного имени истек 22.06.2020». . Алексис Джаз ( поговори или позвони мне) 14:27, 15 ноября 2023 г. (UTC) Ответить [ ответить ]

Пользователь: Alexis Jazz : У меня есть настройка для подобных вещей, прежде чем включать удаление цитат без URL-адреса архива. Некоторые статьи выглядят вполне законно, как здесь. Эта статья была опубликована в 2009 году, но в прямой ссылке указан 2020 год. Я думаю, вы правы в этом решении. Измените статус на узурпированный, так как домен был захвачен неизвестным лицом, внесшим неверные изменения. Единственное, если вы внесете в черный список, я не смогу помочь, потому что черный список не позволит моему боту вносить изменения. 122 страницы. -- Зеленый C 15:45, 15 ноября 2023 г. (UTC) Ответ [ ответ ]
GreenC , да, они переиздали некоторые оригинальные статьи, что сбивает с толку. Если вы просмотрите архивы, то заметите, что оригинал был написан Спенсером Акерманом, а автором в 2021 году была Кери Синклер. В текущей версии автор вообще не указан. Этим переизданным версиям, даже если текст идентичен, также не следует доверять, поскольку автор и дата ненадежны, и маловероятно, что у них есть лицензия на публикацию этих статей. Поэтому должна быть архивная ссылка, и она должна быть старой. Надежные газеты не пишут статей с заголовком «5 лучших онлайн-казино США прямо сейчас».
Я бы запросил внесение в черный список только после того, как все существующие ссылки будут узурпированы. Кстати, боты имеют sboverrideправо, поэтому даже занесение в черный список не должно быть проблемой? (кроме того, бот будет удалять URL-адрес, чтобы редактирование никогда не блокировалось?) Алексис Джаз ( поговорите или позвоните мне) 16:48, 15 ноября 2023 г. (UTC) Ответить [ ответить ]
Пользователь: Alexis Jazz , отслеживается по адресу WP:JUDI , где сейчас находится в очереди . Это не случай JUDI, но по сути то же самое (узурпированный домен) с точки зрения бота. Как скоро вы хотите, чтобы это было сделано? Обычно я запускаю их партиями по 30 или 40 доменов, это проще, но если вы хотите внести его в черный список, я могу провести его раньше, сейчас в очереди только 3 домена. Надеюсь, sboverride теперь работает. -- Green C 04:52, 16 ноября 2023 г. (UTC) Ответить [ ответить ]
GreenC , спасибо! Никакой спешки, это не большой объем. Алексис Джаз ( поговори или позвони мне) 05:26, 16 ноября 2023 г. (UTC)Ответить [ ответить ]
sboverride теоретически должен работать. Я вижу это в официальном списке Special:ListGroupRights . – Novem Linguae ( обсуждение ) 05:28, 16 ноября 2023 г. (UTC) Ответ [ ответ ]

Nationalgeographic.com

Много soft-404. -- Green C 01:41, 18 ноября 2023 г. (UTC) Ответить [ ответить ]

..также *.natgeotv.(com|org).* например. www.natgeotv.com.au Green C 16:54, 20 ноября 2023 г. (UTC) Ответить [ ответить ]

Результаты для nationalgeographic.(com|org):

-- Green C 05:12, 24 ноября 2023 г. (UTC) Ответить [ ответить ]

Для natgeotv: проверил 266 статей, отредактировал 190 статей, добавил 153 архивных URL-адреса, изменил 19 URL-статусов -- Green C 19:50, 25 ноября 2023 г. (UTC) Ответить [ ответить ]

charattack.com

@GreenC , возможно , этот тоже подойдет JUDI? Chart Attack раньше был бумажным журналом, который, вероятно, был надежным, по крайней мере, в отношении простых заявлений. Извините, неправильная ссылка, она была (до мая 2018 г.) в целом надежной согласно Wikipedia: WikiProject Albums/Sources / WP:RSN . Теперь это просто мусор. 2023 год: https://www.chartattack.com/best-crypto-investment/.
Это была фигня в 2020 году? [7]: «Не многие люди знают, как играть в онлайн-слоты и зарабатывать деньги».
Это был мусор в 2019 году? Возможно, но не так очевидно.
В 2018 году сайт выглядел совсем иначе и фактически был ориентирован на музыку. Я не думаю, что для этого нужна конечная дата. Лучше перестраховаться, чем потом сожалеть: дата окончания — 24 мая 2018 г. Возможно, количество плохих ссылок ограничено, и, вероятно, все их можно найти среди этих 38 результатов. (которые не так уж и плохи и достаточно малы, чтобы их можно было прочесть вручную). Однако их следует узурпировать. Алексис Джаз ( поговори или позвони мне) 10:28, 18 ноября 2023 г. (UTC) Ответить [ ответить ]

Там 1300 страниц. Да, в 2018 или 2019 году произошли серьезные изменения в направленности сайта. Не знаете, как назвать такой контент, поисковые ловушки Google? Например, они проверяют популярные поисковые запросы Google, а затем пишут аналитические статьи на эту тему, чтобы захватить поисковый трафик и монетизировать его с помощью рекламы. Контент может генерироваться полуавтоматически с помощью искусственного интеллекта, поэтому его стоимость невелика.
На странице «О программе» старого сайта написано (апрель 2018 г.): «Chart Attack — это путеводитель по инди и альтернативной музыке, базирующийся в Торонто, Канада, онлайн с 1996 года. Мы стремимся демонстрировать великолепную музыку, которая оправдывает ожидания от жанра». . Название подходит. У них есть главный редактор и авторы-фрилансеры. Без проблем. Новый сайт не имеет к этому никакого отношения. Это узурпация. Это много страниц, которые можно узурпировать, но я думаю, что вы правы. -- Зеленый C 23:20, 18 ноября 2023 г. (UTC) Ответ [ ответ ]
Waybck показывает, что домен был заброшен примерно 24 мая 2018 года. Другой сайт andpop.com владел им в следующем месяце 2019 года. Затем его получили реселлеры мирового класса и продали нынешним владельцам в апреле 2019 года. -- Зеленый C 23: 36, 18 ноября 2023 г. (UTC) Ответить [ ответить ]
О, Chart Attack имеет больше информации. -- Green C 23:40, 18 ноября 2023 г. (UTC) Ответ [ ответ ]
GreenC , ах, ладно, тогда у вас есть крайняя дата: 24 мая 2018 года.
В некоторых случаях здесь также воспроизводятся статьи с оригинального сайта, например [8] против [9]. Обратите внимание на изменение имени автора, как и в случае с Washington Independent. Воспроизведение оригинального контента — это, вероятно, просто SEO . Алексис Джаз ( поговорите или позвоните мне) 00:00, 19 ноября 2023 г. (UTC) Ответить [ ответить ]
Добавлено в очередь JUDI. Возможно, я доберусь до него раньше, чем позже, из-за количества страниц. -- Green C 00:47, 19 ноября 2023 г. (UTC) Ответить [ ответить ]

vh1.com

Я заметил, что http://www.vh1.com/news/articles/1497672/03022005/mudvayne.jhtml просто перенаправляет на https://www.facebook.com/VH1/, что менее чем полезно. Потом я заметил даже перенаправление http://www.vh1.com/ на Facebook.
Рассматриваемая статья была заархивирована и на самом деле все еще доступна по адресу https://www.mtv.com/news/xu79dk/mudvayne-lose-the-makeup-find-inspiration-in-isolation, поэтому, если какая-либо статья не была заархивирована, она возможно, стоит иметь журнал того, что не удалось, чтобы кто-нибудь мог найти его на mtv.com. Алексис Джаз ( поговори или позвони мне) 10:35, 18 ноября 2023 г. (UTC) Ответить [ ответить ]

Для меня VH1 не перенаправляет на Facebook. Ссылка на madvayne.jhtml — это ошибка 404, а целевая страница vh1.com — ошибка 404. https://www.vh1.com ведет на домашнюю страницу сайта, которая выглядит следующим образом (сегодняшний снимок архива). Может быть, редирект Facebook был временным? -- Зеленый C 22:36, 18 ноября 2023 г. (UTC) Ответ [ ответ ]
ГринС , да? Нет, на самом деле он перенаправляется на Facebook. Думаю,
мне нужно WP:EVADEGDPR . Если половина(?) наших читателей не сможет получить к нему доступ, мы можем с таким же успехом считать его мертвым. (и в любом случае, если ссылка на статью для вас 404, у нас в любом случае ссылка гнила) Алексис Джаз ( поговорите или пингуйте меня) 00:02, 19 ноября 2023 г. (UTC) Ответить [ ответить ]
Это неудачно. Я не уверен, что такое консенсус сообщества. На странице EVADEGPR написано: «Не используйте Wayback Machine в качестве бесплатного прокси». Я могу/обязательно обработаю домен на 404 и soft-404. -- Green C 00:51, 19 ноября 2023 г. (UTC) Ответить [ ответить ]
GreenC , я написал страницу EVADEGDPR, эта строка означает (и я сейчас разъясню это...) то, что вам не следует систематически сохранять страницы только для того, чтобы вы могли лично просмотреть их один раз , но если вы подозреваете, что это будет полезный справочник, их можно сохранить. Идея заключается в том, что тратить хранилище archive.org на поиск мусора или случайных ссылок — плохая идея, для этого вам следует использовать VPN или прокси. Но если это действительно ценно, не проблема, сохраните.
Я не уверен, что существует консенсус относительно того, как обращаться с действующими, но географически ограниченными ссылками. Алексис Джаз ( поговори или позвони мне) 01:26, 19 ноября 2023 г. (UTC) Ответить [ ответить ]
Это возникало раньше на протяжении многих лет (не могу сказать, где сейчас), и был спор об архивировании сайтов с целью обхода блокировок политики. Невозможно идти в ногу со временем, политики меняются, и особенно в случае региональных блоков это заставляет всех остальных по умолчанию использовать архив вместо активной страницы. Иногда я делаю это для ограниченного набора страниц в домене с платным доступом, но для всего домена это было бы сложно без консенсуса (около 3000 страниц). Возможно, можно было бы увидеть добавление URL-адресов архива, сохраняющее статус в актуальном состоянии, но мой бот не настроен на то, чтобы он никогда не делал этого раньше. Попытка идти в ногу с подобными политическими изменениями и обойти их – это кошмар. -- Green C 02:27, 19 ноября 2023 г. (UTC) Ответить [ ответить ]
Простое добавление URL-адресов архива, но сохранение статуса в актуальном состоянии (когда ссылка действительно активна, а не 404, как в madvayne.jhtml), очень помогло бы.
Если ваш бот не настроен для этого, возможно, другой бот сможет обрабатывать действующие в настоящее время, но географически ограниченные ссылки? Алексис Джаз ( поговори или позвони мне) 04:59, 19 ноября 2023 г. (UTC) Ответить [ ответить ]
Хорошо, первый проход исправит неработающие ссылки. Затем я попробую еще раз добавить архивы к действующим ссылкам в шаблонах CS1 | 2 с активным статусом URL. Пока не уверен насчет квадратных и голых ссылок. Это займет некоторое время. В настоящее время я работаю в джунглях с Nationalgeographic, в котором более 8000 страниц и множество крайних случаев, которые нужно обнаружить. -- Зеленый C 16:04, 19 ноября 2023 г. (UTC) Ответ [ ответ ]

Шаг 1. Исправьте неработающие ссылки

Шаг 2. Добавьте в CS1|2 URL-адреса архивов, у которых нет URL-адреса архива, и установите|url-status=live

Пользователь: Alexis Jazz : дело сделано. -- Зеленый C 22:56, 1 декабря 2023 г. (UTC) Ответить [ ответить ]

GreenC , спасибо! Есть ли способ найти те 203 статьи, которые были отмечены тегом {{ мертвая ссылка }}, чтобы я мог найти эти статьи на сайте mtv.com? Алексис Джаз ( поговори или позвони мне) 16:23, 2 декабря 2023 г. (UTC)Ответить [ ответить ]

Пользователь: Alexis Jazz : здесь 154 страницы с 203 URL-адресами, отмеченными моим ботом (могут существовать и другие). Кстати, я заметил, что многие URL-адреса архивов имеют низкое качество: из-за музыкальных клипов в исходных ссылках у поставщиков архивов часто возникают проблемы с видео. -- Зеленый C 16:37, 2 декабря 2023 г. (UTC) Ответ [ ответ ]{{dead link}}

использоватьmod.com

Перенесено из обсуждения в Википедии: Link rot/cases/Judi.

Может ли usemod.com работать на WP:JUDI ? См. https://en.wikipedia.org/wiki/Wikipedia:URLREQ/Special:LinkSearch?target=*.usemod.com.

Умеет ли бот обновлять ссылки? http://www.usemod.com/cgi-bin/mb.pl?GoodBye должно быть http://meatballwiki.org/wiki/Wikipedia:URLREQ/GoodBye WhatamIdoing ( обсуждение ) 06:02, 28 ноября 2023 г. (UTC) Ответить [ ответить ]

Что я делаю , да, я могу кое-что переместить, а тех, кто не может, можно узурпировать, как Джуди. -- Зеленый C 15:22, 28 ноября 2023 г. (UTC) Ответ [ ответ ]
Спасибо! WhatamIdoing ( обсуждение ) 15:48, 28 ноября 2023 г. (UTC) Ответить [ ответить ]
Также не могли бы вы добавить в Википедию предложение :Внешние ссылки#Захваченные и перерегистрированные сайты со ссылкой на эту страницу? Редакторы могли бы с большей вероятностью сообщить о доменах, если бы знали, что их очистит бот. WhatamIdoing ( обсуждение ) 15:50, 28 ноября 2023 г. (UTC) Ответить [ ответить ]
Сделанный. Специальное предложение: Diff/1184135778/1187332424Green C 16:15, 28 ноября 2023 г. (UTC) Ответить [ ответить ]
WhatamIdoing , похоже, кто-то другой, я не знаю, кто и когда, уже преобразовал их. На usemod.com есть только 4 основные страницы — Green C 00:38, 2 декабря 2023 г. (UTC) Ответить [ ответить ]
Спасибо. Special:LinkSearch говорит, что это есть в Wikipedia:WikiProject Organized Labor (и примерно на 450 других страницах), но я не могу найти ссылку на этой странице. Может, в включении? Но, по крайней мере, основное пространство относительно свободно от этой ошибки. WhatamIdoing ( обсуждение ) 01:16, 2 декабря 2023 г. (UTC) Ответить [ ответить ]
В Wikipedia:WikiProject Organized Labor оно исключено из Wikipedia:WikiProject Organized Labor/Participants , где оно встроено в чей-то подписанный комментарий. Я удалил это. Поскольку спам-ссылки их, наверное, следует удалить? Обычно я этого не делаю, поскольку эти страницы могут быть непредсказуемыми. Например, хочу ли я добавить URL-адрес архива и в User:Sj/Presentation ? Это много личного пространства и комментариев на странице обсуждения, которые можно изменять без разрешения. -- Green C 06:50, 2 декабря 2023 г. (UTC) Ответить [ ответить ]{{usurped}}
Я уверен, что @ Sj был бы рад иметь рабочую ссылку, но я согласен, что в другом месте это может быть сложно. WhatamIdoing ( обсуждение ) 17:39, 3 декабря 2023 г. (UTC) Ответить [ ответить ]
Спасибо за уведомление. на сайте usemod.com было несколько разных Perl-скриптов; вы хотите отличить вещи под mb.pl (перемещенные в Meatballwiki) от остальных (которые можно указать на архив машины обратного пути). –  SJ  + –  SJ  + 12:57, 4 декабря 2023 г. (UTC) Ответ [ ответ ]

Предупреждение о троянах/вредоносных программах на Pelenop.fr

Редактировал здесь неработающую ссылку , и при попытке использовать исходный сайт он был немедленно заблокирован моим антивирусом. Судя по всему, теперь его узурпировали на сайт, внедряющий вредоносное ПО (или, возможно, просто эту ссылку, я не очень хочу иметь дело с цитатой, которая снова дает мне вредоносное ПО). Я исправил архив, сделав его рабочей и безопасной версией ссылки, и установил ссылку как узурпированную. Думаю, было бы разумно упомянуть об этом здесь, на случай, если в Wiki скрываются другие ссылки на этот сайт.

Вот ссылки на мои 2 редактирования для быстрого ознакомления. Опять же, архив выглядит безопасным, но я бы не рекомендовал переходить на исходный сайт без активной антивирусной защиты. 1. 2.

(Примечание: к сожалению, я не могу вспомнить или найти предыдущую цитату/сайт, на котором мне предоставили вредоносное ПО, но она должна быть в списке моих удаленных изменений, если у кого-то есть к ней доступ, с очень очевидной цитатой «ТРОЯНСКОЕ ПРЕДУПРЕЖДЕНИЕ») Silverleaf81 ( обсуждение ) 05:53, 2 декабря 2023 г. (UTC) Ответ [ ответ ]

Спасибо, что превратили его в узурпированный и уведомили эту страницу, это правильное место. Похоже, что домен существует только в этой статье: [10] — Green C 06:57, 2 декабря 2023 г. (UTC) Ответить [ ответить ]

Flare.com

Доменное имя Flare.com продается! Журнал переехал на https://fashionmagazine.com/flare/, но старого контента, похоже, больше нет в сети. Большая часть из них была заархивирована в обычных местах. Certes ( обсуждение ) 17:32, 6 декабря 2023 г. (UTC) Ответить [ ответить ]

Пользователь:Certes , я отключил домен на iabot.org и начал его обработку. -- Green C 20:04, 6 декабря 2023 г. (UTC) Ответить [ ответить ]

Старые ссылки на nextbestpicture.com

Здравствуйте, пожалуйста, измените все ссылки (в основном пространстве имен) вида http://www.nextbestpicture.com/2/post/2020/12/the-2020-indiana-film-journalists-association-ifja-winners.html. на https://nextbestpicture.com/the-2020-indiana-film-journalists-association-ifja-winners/ (т. е. все, что находится между первой косой чертой после имени домена и последней в ссылке, должно быть удалено, расширение «. html» следует заменить косой чертой, а HTTP следует изменить на HTTPS). Многие из этих ссылок, похоже, помечены InternetArchiveBot как мертвые, в том числе на Clarke Peters (где я заметил это и исправил вручную) и On the Rocks (фильм) . Спасибо! Graham87 ( обсуждение ) 07:06, 12 декабря 2023 г. (UTC) Ответ [ ответ ]

Нет проблем, я займусь этим, спасибо. Все, что помечено как мертвое, будет восстановлено к жизни, если оно будет проверено вживую. Я оставлю старый URL-адрес архива на месте, если только вы не захотите удалить его или заменить архивом на новый URL-адрес. -- Green C 04:19, 13 декабря 2023 г. (UTC) Ответить [ ответить ]

Graham87 : вот, пожалуйста Special:Diff/1186100009/1190645424 . Хорошая находка. Он отредактировал более 500 страниц, исправил множество цитат. Было сложно использовать блокировщик ботов, поэтому у Wayback Machine и IABot возникли проблемы. У меня было решение для этой проблемы, и я смог проверить работу новых ссылок; в некоторых случаях для этого требовался URL-адрес архива. -- Green C 02:43, 19 декабря 2023 г. (UTC) Ответить [ ответить ]

Энциклопедия внесолнечных планет

Форматирование записей каталога exoplanet.eu недавно изменилось, и теперь все записи имеют числовой идентификатор (например, 1261 для Kepler-62f ). Предыдущий формат (в котором было только название планеты) по-прежнему мягко перенаправляет на правильную цель, но старые ссылки, использующие предыдущий формат, необходимо исправлять вручную. – Laundry Pizza 03 ( d c̄ ) 01:29, 15 декабря 2023 г. (UTC) Ответ [ ответ ]

Пользователь:LaundryPizza03 : Есть ли пример старой ссылки и соответствующей новой ссылки? -- Green C 04:08, 15 декабря 2023 г. (UTC) Ответить [ ответить ]

@ GreenC : В этом примере прежний URL-адрес был https://exoplanet.eu/catalog/kepler-62_f/, а теперь https://exoplanet.eu/catalog/kepler_62_f--1261/. – Laundry Pizza 03 ( d c̄ ) 04:10, 15 декабря 2023 г. (UTC) Ответ [ ответ ]
Я бы посоветовал обратиться к Linksearch за примерами страниц и примерами старого формата, который теперь является жестким 404. 55 Cancri b является примером; URL-адрес http://exoplanet.eu/planet.php?p1=55+Cnc&p2=b связан; старый формат URL-адреса имел https://exoplanet.eu/catalog/55_cnc_b/, а текущая страница базы данных для этой планеты находится по адресу https://exoplanet.eu/catalog/55_cnc_b--25/. Обратите внимание, что звезды-хозяева больше не доступны напрямую в базе данных; информацию о них можно получить через записи об их планетах.
exoplanet.eu: Linksearch en (insource) - мета - de - fr - simple - wikt:en - wikt:fr • MER-C X-wiki • gs • Отчеты: Ссылки на en - COIBot - COIBot-Local • Обсуждения: отслеживаются - расширенный - RSN • Отчеты COIBot-Link, Local и XWiki - Википедия: en - fr - de • Google: поиск • мета • Домен: domaintools • AboutUs.comLaundry Pizza 03 ( d c̄ ) 04:18, 15 декабря 2023 (UTC) Ответ [ ответ ]

Я вижу, что «кеплер-62» (тире) теперь называется «кеплер_62» (подчеркивание). Возможно, можно будет преобразовать ?p1=55+Cnc&p2=bи 55_cnc_bзатем загрузить эту страницу https://exoplanet.eu/catalog/55_cnc_b/ и извлечь новый URL-адрес из HTML. Как вы предлагаете, я посмотрю на поиск ссылок и посмотрю, насколько однородны. Я доберусь до этого не сразу. -- Green C 04:35, 15 декабря 2023 г. (UTC) Ответить [ ответить ]

Пользователь:LaundryPizza03 : Видел много подобных ссылок. Я добавил URL-адрес архива, поскольку ссылка на источник не работает. Я бы предпочел преобразовать их в новую схему URL-адресов /catalog, но нет возможности связать их со звездой, только с планетами, как здесь. Я что-то пропустил? Что вы порекомендуете для URL-адресов с star.php?st=-- Green C 19:02, 21 декабря 2023 г. (UTC) Ответить [ ответить ]

Единственное, что я могу понять, на странице каталога https://exoplanet.eu/catalog введите star_name="HD 5319"и нажмите «Применить фильтр», появится список планет. Однако нет возможности дать ссылку на этот результат поиска. Найти его сможет только человек, вручную введший имя звезды, API или механизма для автоматического использования не существует. -- Зеленый C 19:21, 21 декабря 2023 г. (UTC) Ответ [ ответ ]
@GreenC : Я бы посоветовал удалить все эти ссылки. Вы все равно можете конвертировать ссылки на планеты старого формата, как вы описали. – Laundry Pizza 03 ( d c̄ ) 05:25, 22 декабря 2023 г. (UTC) Ответ [ ответ ]
Например, многочисленные ссылки на звезды exoplanet.eu в Списке экзопланет, открытых космическим телескопом Кеплер: 1–500 , которые кажутся полезными для проверки данных. Кто-то может возразить, почему ссылки удаляются, ведь URL-адреса архивов работают и проверяются. -- Green C 06:46, 22 декабря 2023 г. (UTC) Ответить [ ответить ]
Попробуйте получить архивы для ссылок, которые еще не заархивированы. – Laundry Pizza 03 ( d c̄ ) 07:21, 22 декабря 2023 г. (UTC) Ответ [ ответ ]
Да, бот добавит архивы для мертвых ссылок: Special:Diff/1143718768/1191219614 . Я работаю медленно, потому что в журналах есть ошибки в данных, которые требуют исправления вручную. Например, эта планета Special:Diff/1168566545/1191217938 была переименована, но название статьи по-прежнему имело старое название. Аналогичный пример Special:Diff/1188022306/1191211568 . Или синтаксические ошибки, Special:Diff/1188040396/1191199379 . -- Зеленый C 17:07, 22 декабря 2023 г. (UTC) Ответить [ ответить ]
Пользователь:LaundryPizza03 — эта итерация завершена. Отредактировано 694 страницы, из 705 проверенных. Он преобразовал ссылки звездной системы в URL-адреса архивов. Ссылки на планеты в основном конвертированы. В конце процесса я заметил, что не конвертируются ссылки планеты, которые уже имели URL-адрес архива и в противном случае были неработающими ссылками ... они требуют ручной проверки. Вероятно, что-то изменилось с планетой, например, ее название или существование. Большинство из них можно будет найти в каталоге, если потратить некоторое время и поискать.
Кроме того, я был не в курсе . Со временем отдельные страницы сайта перестанут работать, и стандартные инструменты уничтожения ссылок не смогут их обнаружить и исправить, если ссылки абстрагируются за счет специального шаблона внешних ссылок. Я предполагаю, что шаблон может быть полезен, если весь сайт изменит структуру, но, скорее всего, данных в шаблоне будет недостаточно для размещения новой схемы URL. Таким образом, в лучшем случае шаблон делает добавление ссылки немного быстрее и более единообразным, но за счет увеличения порчи ссылок и проблем в будущем, когда изменится схема URL-адреса. Я всегда считал, что стандартные шаблоны цитирования — лучший вариант, потому что существует множество инструментов, которые их поддерживают. -- Green C 02:51, 23 декабря 2023 г. (UTC) Ответить [ ответить ]{{Cite EPE}}

Международная Метеорологическая Организация

Привет. Я заметил, что после нажатия на эту ссылку IMO появляется сообщение, что веб-сайт переехал на новый URL-адрес, а старый будет доступен до этого месяца. Просматривая ссылки IMO в Википедии, некоторые форматы уже можно поменять местами:

Есть и другие, которые не входят в эти три категории и которых я не вижу на новом сайте. Вот некоторые примеры. Мне было интересно, можно ли заменить старые ссылки public.wmo.int на новые ссылки wmo.int, где это возможно, а неработающий файл public.wmo.int без нового URL-адреса можно заархивировать. Нужно пройти 436 ссылок. Спасибо! MrLinkinPark333 ( обсуждение ) 00:29, 17 декабря 2023 г. (UTC) Ответить [ ответить ]

К счастью, вы нашли это вовремя. Я расставлю это по приоритетам. Если общедоступный старый сайт отключится, его будет намного сложнее перенести. -- Green C 01:34, 17 декабря 2023 г. (UTC) Ответить [ ответить ]

MrLinkinPark333 : Вот что я сделал: перенес ссылки, где это возможно, как вы узнали выше, например, в пресс-релизах, просто изменив URL-адрес. Этот метод сработал только для некоторых, на новом сайте не все страницы со старого сайта. Таким образом, все, что он не смог найти на новом сайте, было преобразовано в public-old.wmo.int, чтобы обойти информационную страницу, на которой говорится, что ссылка обречена. Затем он сохранил копию ссылки public-old.wmo.int на Wayback Machine. Затем он добавил эти ссылки Wayback в цитату как архивные URL-адреса со статусом URL-адреса «мертвый» (скоро мертвый). Я думаю, что этот метод спас большую часть контента от неминуемого уничтожения. Позже, когда новый сайт заработает, я смогу внести дополнительные изменения, если вы увидите способы конвертировать ссылки public-old.wmo.int на новый сайт wmo.int. В 160 статьях 195 общедоступных ссылок. -- Зеленый C 19:14, 18 декабря 2023 г. (UTC) Ответ [ ответ ]

Это работает. Я всегда могу вернуться к ссылкам позже, чтобы посмотреть, можно ли их поменять местами. Спасибо! MrLinkinPark333 ( обсуждение ) 19:19, 18 декабря 2023 г. (UTC) Ответить [ ответить ]

Финеас Ф. Брези

Дальнейшее чтение Корбетт, Коннектикут (1958) Наши пионеры-назаряне. Канзас-Сити, Миссури: Издательство Назарянина. [2][постоянная мертвая ссылка]

Это можно исправить, указав одну из следующих ссылок: https://whdl.org/en/browse/resources/6629 https://nmi.whdl.org/en/browse/resources/6629 https://apnts. whdl.org/en/browse/resources/6629

Спасибо! 174.127.124.132 (обсуждение) 07:22, 17 декабря 2023 г. (UTC) Ответить [ ответить ]

 Сделанный ! В будущем лучшее место, где можно предложить улучшение отдельной статьи (например, «Финес Ф. Брези »), — это страница обсуждения статьи (например, «Обсуждение:Финеас Ф. Брези »). На этой странице можно запросить улучшение сотен или тысяч статей с одной и той же проблемой. Спасибо! GoingBatty ( обсуждение ) 01:27, 18 декабря 2023 г. (UTC) Ответить [ ответить ]

Подсайт веб-сайта, занесенного в черный список, изменил URL

Подсайт "inventors.█████.com" ("о" подвергнут цензуре из-за вики-фильтра) теперь выглядит как " Thoughtco.com ", со ссылками/внешними ссылками, ведущими либо на ту же статью на новом сайте. или просто не работают. Судя по всему, существует более 150 статей, использующих URL-адрес изобретателя (1), и, похоже, более 500 результатов поиска по внешним ссылкам (2), хотя значительная часть находится на страницах обсуждения. Silverleaf81 ( обсуждение ) 09:28, 17 декабря 2023 г. (UTC) Ответ [ ответ ]

Пользователь: Silverleaf81 , сайт хитрый. Они были исключены из ссылки Wayback Machine. Некоторые из них есть на Archive.today. Однако сравните эту ссылку с новой ссылкой на Thoughtco, обратите внимание на смещение контента: они внесли изменения в контент в Thoughtco. Поэтому консервативный курс — преобразовать их в архивные URL-адреса, чтобы проверить исходную ссылку. Проблема в том, что на archive.today может быть не полное освещение, а замещающая ссылка на thinkco может не подтверждать приведенный факт.
Что могу попробовать, конвертировать в archive.today, где это возможно. Если нет, оставьте это в покое. Куда бы он ни перенаправлялся, туда он и идет, и кто-то должен будет вручную выяснить, проверяется новая страница или нет. Возможно, через год исключение Wayback будет снято, и эти архивы снова станут доступны. -- Green C 04:09, 23 декабря 2023 г. (UTC) Ответить [ ответить ]

Пользователь:Silverleaf81 : Готово. Это досталось большинству из них. Он добавил 341 URL-адрес archive.today. Список из около 50 сомнительных вопросов можно найти в Википедии: Link_rot/cases/inventors.about.com , но не все из них действительно являются проблемой. -- Green C 02:24, 26 декабря 2023 г. (UTC) Ответить [ ответить ]

runeberg.org наконец-то на https

Мой веб-сайт runeberg.org совсем недавно переехал с http: на https:, поэтому было бы неплохо, если бы кто-нибудь мог соответствующим образом обновить оставшиеся 11 000 ссылок . Это не срочно, так как с автоматическими редиректами все работает нормально, но было бы неплохо. Спасибо. -- LA2 ( обсуждение ) 22:57, 17 декабря 2023 г. (UTC) Ответ [ ответ ]

Пользователь:LA2 : Хорошо, без проблем. Я получил много запросов здесь, в то же время в других местах появилось много других вопросов. Со временем я доберусь до этого, это подходящее место/инструмент для такой работы. Я сообщу вам, когда все будет готово. -- Зеленый C 17:53, 18 декабря 2023 г. (UTC) Ответить [ ответить ]
Пользователь:LA2 : runeberg.org (http или https) существовал в 6769 статьях. Он проверил, что каждая ссылка имеет статус 200 после преобразования в https. Все, что не было, добавили тег. Остальные конвертируются в https. Были некоторые опечатки и нерабочие ссылки на Google Translate, которые я исправил вручную. Список ссылок http runeberg.org — Green C 20:31, 26 декабря 2023 г. (UTC) Ответить [ ответить ]{{dead link}}
Большой! Спасибо! -- LA2 ( обсуждение ) 22:20, 27 декабря 2023 г. (UTC) Ответ [ ответ ]

www.nwt.org выставлен на продажу, ссылки на него требуют внимания.

Похоже, что епископальная епархия Северо-Западного Техаса использовала URL-адрес www.nwt.org для получения информации о кандидатах. Этот сайт сейчас продается. Ссылки на этот сайт, например https://en.wikipedia.org/wiki/Wikipedia:URLREQ/Scott_Mayer_(bishop), должны быть исправлены/удалены. Отец Кевин Пи Джей Коффи, SCP ( разговор ) 16:45, 18 декабря 2023 г. (UTC) Ответ [ ответ ]

Как трехбуквенный домен, он, вероятно, будет продаваться. Я добавил его в список доменов, которые будут узурпированы. Специальное предложение: Diff/1186090244/1190575904Green C 17:49, 18 декабря 2023 г. (UTC) Ответить [ ответить ]

Yahoo! Группы

Я нашел много неработающих ссылок на Yahoo! Группы. Можем ли мы найти архивные копии этих страниц? Джарбл ( обсуждение ) 18:19, 18 декабря 2023 г. (UTC) Ответить [ ответить ]

Просмотрел небольшое количество через archive.org и, кажется, есть требования для входа в систему, поэтому это может отнять много времени без небольшой выгоды. Neils51 ( обсуждение ) 08:36, 22 декабря 2023 г. (UTC) Ответить [ ответить ]
Да, некоторые из самых сложных объектов: soft-404 внутри soft-404. Например, URL-адрес, который перенаправляет на домашнюю страницу (www.yahoo.com), имеет код soft-404 #1. Это приводит к принудительному получению URL-адреса архива, но это также программная ошибка 404, поскольку она содержит экран входа в систему. Решение состоит в том, чтобы найти другого поставщика архивов, который имеет/имеет возможность входа в систему при захвате (archive.today), и создать дополнительное обнаружение soft-404 на втором уровне, специфичном для сайта. Это то, что я делаю сейчас с большим успехом, но требуется время, чтобы понять, как выглядит soft-404, поскольку у Yahoo есть разновидности. -- Green C 06:19, 27 декабря 2023 г. (UTC) Ответить [ ответить ]

Jarble : Бот добавил 1474 новых URL-адреса архивов. Я ограничился добавлением только archive.today, потому что он обеспечивает лучшее покрытие для этого сайта. У Wayback были проблемы с сохранением из-за входов в систему и файлов cookie. Было 115, которые он не смог найти, и добавил файл . Также добавлены архивы в базу данных IABot, чтобы эти обновления распространялись на более чем 300 других вики. -- Green C 04:48, 28 декабря 2023 г. (UTC) Ответить [ ответить ]{{dead link}}

Миграции ATSDR

Многие ссылки с http://www.atsdr.cdc.gov были перенесены на https://atsdr.cdc.gov или https://wwwn.cdc.gov, что привело к поломке многих ссылок . Некоторые автоматические попытки архивирования страниц привели к архивированию ошибок 404 на этой странице. Я заметил это в разделе «Влияние радона на здоровье» , и, к сожалению, идентификаторы на многих из этих страниц («ToxFAQ») не имеют никакого отношения к новым, идентичным страницам на веб-сайтах HTTPS. Кроме того, в некоторых статьях, таких как Peninsula Extension, упоминаются оценки общественного здравоохранения, которые необходимо найти на заархивированной странице, поскольку файлы были удалены и доступны только по запросу по электронной почте. Recon Rabbit ( обсуждение | правки ) 18:38, 19 декабря 2023 г. (UTC) Ответить [ ответить ]

Краткое примечание: похоже, что многие ссылки в формате .pdf все еще не повреждены, но ссылки .htm/.html необходимо заархивировать. Не является приоритетом, поскольку это имело место в течение как минимум 5 лет Recon Rabbit ( обсуждение | правки ) 22:15, 20 декабря 2023 г. (UTC) Ответить [ ответить ]

Пользователь:Reconrabbit : Я понимаю, почему эта проблема так долго оставалась без внимания, это сложно. Я не могу обещать, что все идеально, но у большей части всего, что мертво, теперь есть URL-адрес архива. Они используют перенаправления JavaScript, которые создают проблемы для ботов, отсюда и неверные URL-адреса архивов. Я проверил существующие URL-адреса архивов на soft-404, они несовершенны, но некоторые из них удалось найти и заменить: Special:Diff/1190591816/1192546009. Я исправил несколько ссылок ToxFAQ, просматривая их вручную: Special:Diff/1189670705. /1192547048 Но большинство из них были просто заархивированы: Special:Diff/1121144402/1192546200 Если вы хотите создать карту старого -> нового, бот может использовать ее для внесения изменений в вики.

Ссылки http существовали примерно в 350 статьях. Бот отредактировал 211 страниц. Я думаю, разница в том, что ссылки уже были заархивированы или работали, как PDF-файлы. Он добавил 141 новый URL-адрес архива. И он сделал 127 ходов перенаправления: Special:Diff/1154065478/1192545155 Надеюсь, это поможет. -- Green C 00:05, 30 декабря 2023 г. (UTC) Ответить [ ответить ]

Спасибо. Похоже, что значительная часть перенаправлений не направлена ​​непосредственно на рассматриваемый токсин, но это нормально, поскольку он направляет кого-то прямо на домашнюю страницу ToxFAQ с алфавитным каталогом; не должно быть слишком сложной просьбой к читателю найти оттуда подходящую страницу. Разведывательный кролик 01:17, 30 декабря 2023 г. (UTC) Ответить [ ответить ]
Да, эти случаи не так уж и плохи. Это те, у которых есть tfacts##.html, которые выиграют от сопоставления старого с новым, например Special:Diff/1121144402/1192546200 не так уж и здорово, но это хорошо Special:Diff/1189670705/1192547048, где я вручную нашел новое ссылку и запрограммировал ее в бота. Это отнимало слишком много времени. Если вы хотите сопоставить факты, я добавлю их в бот. Список из 31 старого URL-адреса, индексная страница для новых URL-адресов. Можно найти его, основываясь на контексте цитаты, например. первый в статье «Бензол» будет искать «Бензол» на индексной странице, и это будет новый URL-адрес. -- Green C 02:01, 30 декабря 2023 г. (UTC) Ответить [ ответить ]
Я опробовал метод на нескольких ссылках и обнаружил, что он работает практически для всех: замена /tfacts XX .html на /toxfaqs/tfacts XX .pdf обеспечивает современный PDF-файл для рассматриваемого элемента в каждый раз, когда я пробовал. Пример: архивная ссылка на бензол, действующий PDF-файл Benzene ToxFAQ. Разведывательный кролик 02:22, 30 декабря 2023 г. (UTC) Ответить [ ответить ]
Отличное открытие. Преобразование: Special:Diff/1192545947/1192569315 -- Green C 02:43, 30 декабря 2023 г. (UTC) Ответить [ ответить ]

Зал славы госпел-музыки

Привет. Старый URL-адрес Зала славы госпел-музыки, похоже, узурпирован. Новый URL-адрес работал как минимум до сентября 2023 года. Не уверен, какое решение лучше: 1) преобразовать старую ссылку в новые ссылки и использовать архивные URL-адреса. 2) использовать архивные URL-адреса как для старых, так и для новых ссылок. К счастью, с двумя URL-адресами нужно обработать менее 100 ссылок. Спасибо! MrLinkinPark333 ( обсуждение ) 19:57, 19 декабря 2023 г. (UTC) Ответить [ ответить ]

Обновление: новый URL-адрес работает сегодня. Взглянув на URL-адреса, некоторые из них легче изменить, чем другие:

Будет ли это работать или есть более простое решение? Спасибо! -- MrLinkinPark333 ( обсуждение ) 02:50, 29 декабря 2023 г. (UTC) Ответить [ ответить ]

Пользователь:MrLinkinPark333 - gmahalloffame.org присутствует в 30 статьях в основном пространстве. Я могу конвертировать, где это возможно, используя два найденных вами правила, а для ручных я перейду на архивные URL-адреса. Если вы хотите восстановить их вручную, я предоставлю список статей/URL-адресов, которые были преобразованы в архивные URL-адреса. Он также проверит наличие строки «Биография скоро появится» и считает эти страницы мертвыми. И я проверю, что еще может появиться в журналах, например, перенаправление soft404 на домашнюю страницу. -- Зеленый C 17:12, 31 декабря 2023 г. (UTC) Ответить [ ответить ]
Поскольку это небольшой список, я мог бы исправить то, что не было преобразовано. Спасибо! MrLinkinPark333 ( обсуждение ) 18:38, 31 декабря 2023 г. (UTC) Ответить [ ответить ]
Бот отредактировал только 15 страниц. Вы можете проверить два места: Special: Contributions/GreenC_bot (заканчивается на Dolly Parton). И поиск по gmahalloffame.org. Большинство правок касалось добавления URL-адресов архивов. Страницы, которые он не редактировал, большинство из них уже имели архивные URL-адреса, и, поскольку доступной замены страницы не было, он ничего не мог сделать. -- Зеленый C 19:58, 31 декабря 2023 г. (UTC) Ответить [ ответить ]
Спасибо за быстрый ответ! MrLinkinPark333 ( обсуждение ) 21:11, 31 декабря 2023 г. (UTC) Ответить [ ответить ]

Ильта-Саномат

Около 346 статей (полный список, включая те, которые уже используют архивные URL-адреса) имеют URL-адреса на веб-сайт финской газеты Ilta-Sanomat http://www.iltasanomat.fi/, который теперь перенаправляется на главную страницу https://www. is.fi/

Кажется, что URL-адреса, идентификатор которых начинается с цифр 200000, можно исправить, просто изменив «iltasanomat» на «is», например:

(В этих примерах я также перешел на HTTPS)

Но URL-адреса с идентификаторами, начинающимися с цифры 1, или URL-адреса с совершенно разными шаблонами невозможно исправить, заменив «iltasanomat» на «is», например: («Sivua ei löydy» по-фински означает «Страница не найдена»).

-

-

-

Итак, каков будет оптимальный способ их устранения?

Кроме того, на fi.wikipedia есть тысячи статей по одной и той же проблеме, поэтому мы будем очень признательны за помощь и этому проекту. 85.76.13.79 (обсуждение) 15:12, 20 декабря 2023 г. (UTC) Ответить [ ответить ]

Я проверил информацию о перенаправлении, например, в Wayback Machine или в заголовках, и ничего не нашел, поэтому нет карты, как переместить ссылки, отличные от 20 000. 20000 ссылок можно перемещать. Итак, решение «Б» для enwiki. Что касается фивики, то, к сожалению, мой бот не настроен для работы с финскими шаблонами цитирования. Однако я могу изменить весь домен на «permadead» в настройках IABot, это сообщит IABot о необходимости конвертировать каждую ссылку iltasanomat.fi на более чем 300 вики-сайтах в URL-адрес архива. -- Зеленый C 20:54, 1 января 2024 г. (UTC) Ответ [ ответ ]
Хорошо, план Б для en-wiki и изменение iltasanomat.fi на permadead для других вики звучит неплохо. Заранее спасибо. (Оригинальный плакат). 2001:14BA:9C98:7100:C993:D281:D619:D802 (обсуждение) 15:48, 2 января 2024 г. (UTC) Ответ [ ответ ]
Результаты: 487 страниц содержат домен. Проверил каждую и внес изменения на 378 страницах (на некоторых уже были архивные URL). Преобразовано 163 URL-адреса типа -20000, добавлено 320 новых URL-адресов архивов, добавлено 12 {{dead link}}, изменено 12 |url-status=liveна мертвые. Загрузил результаты (URL-адреса архива) в IABot и изменил домен на «permadead», чтобы он распространялся на другие вики. IABot зафиксировал более 6000 уникальных URL-адресов. -- Green C 20:20, 2 января 2024 г. (UTC) Ответ [ ответ ]

Примечание об этом форуме

В последнее время этот форум получает много запросов. Запросы могут занять много работы, от 1 до 7 дней каждый в зависимости от сложности: индивидуальное программирование, обнаружение данных, запуск тестовых случаев, проверка результатов, разработка алгоритмов, ожидание запуска бота (медленно из-за сети) и т. д. .. Более того, мое время на эту работу ограничено! Если вы делаете запрос, а время идет, вот почему. Мне бы хотелось, чтобы был способ шаблонизировать его, и я максимально обобщил код, но в конечном итоге эта работа носит заказной и художественный характер из-за бесконечного разнообразия условий на удаленных объектах. Я стараюсь отвечать на запросы в хронологическом порядке, за исключением случаев, когда сайт требует проверки из-за неминуемого сбоя, имеет очень большую площадь или может быть быстро обработан, в таких случаях я могу ответить раньше других. -- Зеленый C 20:10, 20 декабря 2023 г. (UTC) Ответить [ ответить ]

Не беспокойся! Не торопитесь :) MrLinkinPark333 ( обсуждение ) 00:54, 22 декабря 2023 г. (UTC) Ответить [ ответить ]
Я знаю, что подбор персонала — сложная задача, но мне бы очень хотелось, чтобы такие области технического обслуживания, как эта, не оставлялись так часто на усмотрение 1-3 редакторов. Спасибо за вашу работу и не торопите события слишком сильно. Mach61 ( обсуждение ) 22:18, 23 декабря 2023 г. (UTC) Ответить [ ответить ]

www.smallsrecords.com

Ребята из WP:JUDI дошли до этого. Я добавлю URL-адреса архива в «Черновик: Крис Байарс» , как только встану со своего школьного ноутбука (который блокирует IA). Ура, Mach61 ( обсуждение ) 22:14, 23 декабря 2023 г. (UTC)Ответить [ ответить ]

NVM только несколько страниц ссылаются на него Mach61 ( обсуждение ) 22:20, 23 декабря 2023 г. (UTC) Ответить [ ответить ]

IPA-шрифты

Согласно этой архивной ссылке, шрифты IPA были переданы из IPA в Совет по продвижению информационных технологий персонажей, который теперь размещает шрифты на своем веб-сайте. Цитата 14 должна иметь ссылку на https://moji.or.jp/mojikiban/font/, а цитата 13 и 22 (неработающая ссылка) должна быть https://moji.or.jp/ipafont/.

(Извините, если это не то место. Я новичок в редактировании и не хотел испортить цитату.) Ichneumonidae (обсуждение) 18:25, 26 декабря 2023 г. (UTC) Ответить [ ответить ]

Извините, я должен был сказать, что речь идет о статье Список шрифтов CJK ! Ichneumonidae (обсуждение) 18:26, 26 декабря 2023 г. (UTC) Ответить [ ответить ]
 Готово : эта страница предназначена для запроса изменений, которые могут затронуть сотни или тысячи страниц. Вы можете проверить, присутствует ли измененный URL-адрес на многих страницах, используя Special:LinkSearch . Если это затрагивает только одну статью (я только что проверил и похоже, что эти конкретные мертвые ссылки присутствуют только в списке шрифтов CJK и Mona (шрифт) ), лучшее место, чтобы предложить улучшения, — это страница обсуждения этой статьи. Спасибо. Recon Rabbit ( обсуждение | правки ) 19:16, 26 декабря 2023 г. (UTC) Ответить [ ответить ]

Отчет о космическом запуске

Веб-сайт www.spacelaunchreport.com широко цитировался во многих статьях о космических полетах, а теперь его узурпировал какой-то сайт с рекламным ПО. Можно ли заархивировать все эти ссылки? Пример ссылки http://www.spacelaunchreport.com/falcon9ft.html#f9stglog из списка ускорителей первой ступени Falcon 9 . Эргзай ( обсуждение ) 10:02, 27 декабря 2023 г. (UTC) Ответить [ ответить ]

В качестве дальнейшего примечания, чтобы убедиться, что это не пустая трата чьего-либо времени. При поиске количества страниц, использующих ссылку, я столкнулся с ошибкой «Во время поиска произошло предупреждение: время ожидания поиска по регулярному выражению истекло, поэтому доступны только частичные результаты. Попробуйте упростить регулярное выражение, чтобы получить полные результаты». так что это должен быть очень хороший кандидат для массовой замены. Эргзай ( обсуждение ) 01:57, 28 декабря 2023 г. (UTC) Ответить [ ответить ]
Пользователь:Ergzay , это известная проблема с азартными играми, описанная на WP:JUDI . Я обрабатываю домены пакетно. Он добавляется в очередь: Special:Diff/1190914504/1192203117 .. при поиске по регулярному выражению рекомендуемого метода: insource:spacelaunchreport insource:/spacelaunchreport.com/ .. первый insource выполняет широкий поиск без регулярных выражений, второй insource выполняет регулярное выражение только в результатах первого поиска. Поскольку регулярное выражение настолько дорогое, оно сужает поиск перед выполнением регулярного выражения. -- Green C 05:01, 28 декабря 2023 г. (UTC) Ответить [ ответить ]

Bird-Stamps.org

Доменbird -stamps.org hsa был узурпирован и перенаправлен на домашнюю страницу. Поиск по ссылкам показывает около 275 статей с такими ссылками, относительно небольшое количество из них было обновлено архивными ссылками. Фабрикатор ( обсуждение ) 08:51, 31 декабря 2023 г. (UTC) Ответить [ ответить ]

Сайт азартных игр WP :JUDI . Добавлено в очередь: Special:Diff/1193111754/1193243552 -- Green C 20:26, 2 января 2024 г. (UTC) Ответить [ ответить ]

Мемориа Глобо

Большинство ссылок Memória Globo не работают (например, https://memoriaglobo.globo.com/programas/entretenimento/novelas/zaza.htm), в португальской Википедии их больше. Notrealname1234 ( обсуждение ) 18:06, 31 декабря 2023 г. (UTC) Ответить [ ответить ]

Пользователь:Notrealname1234 : есть несколько рабочих URL-адресов, например. [11]. Я проверю каждого, не могу всех сдохнуть. Португальская Википедия имеет собственных ботов-архиваторов и поставщика архивов, это один из немногих сайтов, на которых IABot не может работать, а мой бот не может работать нигде, кроме Enwiki. -- Зеленый C 20:34, 2 января 2024 г. (UTC) Ответ [ ответ ]
Готово. Отредактировано 144 страницы, добавлено 243 архивных URL-адреса, 7 {{dead link}}, перенесено 114 URL-адресов на новый URL-адрес (перенаправления), обновлен IABot. -- Green C 01:33, 3 января 2024 г. (UTC) Ответить [ ответить ]

www.amjbot.org

У нас есть сотни ссылок на URL-адреса, такие как http://www.amjbot.org/content/96/3/668.full, которые просто отправляют в ответ HTTP 404. Их можно просто удалить, если они находятся в параметре URL шаблона цитирования с DOI (который ведет к реальному текущему местоположению версии текущего издателя). Немо 16:36, 1 января 2024 г. (UTC) Ответить [ ответить ]

Пользователь:Nemo_bis :
-- Зеленый C 17:48, 3 января 2024 г. (UTC) Ответить [ ответить ]
Хороший! Спасибо, Немо 16:27, 4 января 2024 г. (UTC) Ответить [ ответить ]

ir.uiowa.edu

Этот репозиторий был удален, и его содержимое разошлось по разным направлениям, включая pubs.lib.uiowa.edu и Academicworks.wmich.edu. В настоящее время домен обслуживает ошибки TLS, хотя в какой-то момент казалось, что он перенаправляет все запросы на несвязанную главную страницу. URL-адреса можно заменить , если доступна копия OA, но в качестве первого шага можно просто удалить все ссылки в шаблонах журналов цитирования, где присутствует DOI. Немо 13:34, 6 января 2024 г. (UTC) Ответить [ ответить ]

Пользователь: Nemo_bis — это «ОА» -> «ИА»? В противном случае я не знаю, что означает ОА. Если это IA, пример diff [12] показывает миграцию ir.uiowa.edu -> pubs.lib.uiowa.edu... предлагаете ли вы использовать снимки IA для поиска перенаправления? К сожалению, не похоже, что IA сохранил правильную информацию о перенаправлении. [13] Есть ли еще место, где можно получить новый URL? -- Зеленый C 17:32, 6 января 2024 г. (UTC) Ответить [ ответить ]
Нет, ОА как в открытом доступе . Бот Citation добавит ссылки OA позже, если неработающие ссылки будут удалены. Я только про удаление спросил, извините. Немо 15:51, 7 января 2024 г. (UTC) Ответить [ ответить ]

Пользователь:Nemo_bis , с доменом 418 страниц. Для всех цитируемых журналов с doi: A) В 132 цитатах удален URL Special:Diff/1137009702/1194866745 . Б) В другом 84 был перенесен рабочий редирект Special:Diff/1184196199/1194866750 . Для всего остального не цитируйте журнал с doi: C) Добавлено 198 URL-адресов архивов Special:Diff/1186059609/1194876255 . Перенесены 54 редиректа, такие же, как B). И D) добавлено 8 Special:Diff/1173723334/1194876457 . -- Green C 05:39, 11 января 2024 г. (UTC) Ответить [ ответить ]{{dead link}}

Выдающийся! Я думал, что выяснение перенаправлений будет слишком сложной задачей (некоторые переходят на главную страницу Primo). Немо 21:21, 12 января 2024 г. (UTC) Ответить [ ответить ]
Обычно я могу отловить те, которые перенаправляют на одно и то же место, по характеру того, что один и тот же целевой URL-адрес появляется несколько раз в журналах во время пробного запуска. Я добавляю для них ловушку в код, чтобы эти перенаправления рассматривались как неработающие ссылки, и запускаю ее снова. Почти каждый домен в той или иной степени имеет эту проблему. Полностью автоматизировать сложно, но у меня есть как можно больше. -- Зеленый C 22:27, 12 января 2024 г. (UTC) Ответ [ ответ ]
Прохладный! Имеет смысл. Немо 07:25, 14 января 2024 г. (UTC) Ответить [ ответить ]
Есть ли способ получить список мест, где были внесены эти изменения? По мере свободного времени исправляю все ссылки. Ни один из них не должен быть мертв, и у всех где-то есть живой контент, большинство из них должны использовать DOI (который я добавляю) 1920wr (обсуждение) 16:38, 17 января 2024 г. (UTC) Ответить [ ответить ]
1920wr , Да. Я мог бы предоставить список названий статей для набора C), но в нем не будут учтены ранее существовавшие URL-адреса архивов. Наверное, лучше найти их таким поиском: 196 статей. Для набора D), которые сложно найти, скорее, вот 8, которые бот добавил {{dead link}}: Виктор Л. Литтиг , Джонатан Блюм (писатель, 1967 г.р.) , Джон Хэрриотт , Р. Дуглас Хёрт , Вторая пандемия чумы , Мэры Сиу Город, Айова , Список школьных округов в Айове , Кристофер Б. Кребс … удачи в этом проекте, было бы здорово увидеть их преобразованными в журналы цитирования с DOI, что является серьезным улучшением для этого домена. Если вы думаете, что я могу чем-то помочь с ботом, дайте мне знать. -- Зеленый C 21:15, 17 января 2024 г. (UTC) Ответ [ ответ ]

ebooks.adelaide.edu.au (404)

460 страниц. «eBooks@Adelaide официально закрыта», 7 января 2020 г. Копии или замены сайта нет. До 2014 года это был http://etext.library.adelaide.edu.au (те же пути).

  1. Если путь содержит «.html», преобразуйте его в URL-адрес архива.
  2. Если путь содержит 4 элемента и заканчивается на «/», например. http://ebooks.adelaide.edu.au/k/kant/immanuel/k16p/ затем добавьте «complete.html» и преобразуйте в URL-адрес архива, т.е. http://ebooks.adelaide.edu.au/k/kant/immanuel/k16p/complete.html -> https://web.archive.org/web/20110309070433/http://ebooks.adelaide.edu.au /k/kant/immanuel/k16p/complete.html
  3. Если путь содержит 3 элемента и заканчивается на «/», например. http://ebooks.adelaide.edu.au/m/mill/john_stuart/ преобразовать в URL-адрес архива
  4. Исключениями из правил 2 и 3 являются Плутарх, Вольтер и т. д., например. https://ebooks.adelaide.edu.au/p/plutarch/symposiacs/ .. проверьте журналы на наличие других исключений
  5. При необходимости, если архива нет, либо удалите URL-адрес из цитирования, либо удалите цитирование, если это раздел внешних ссылок.

-- Зеленый C 18:10, 6 января 2024 г. (UTC) Ответить [ ответить ]

Готово, спасены все, кроме нескольких. Существующие ссылки зачастую не были на полный текст, архивная версия не соответствовала дереву глав, поэтому тексты были неполными. Я переместил многие из них в версию «complete.html», которая представляет собой весь текст на одной странице, а затем преобразовал эту страницу в версию archive.org. Специальное: Diff/1061289409/1195386287 .. Кроме того, большинство из них — это тексты 19-го века, их можно заменить Гутенбергом и т. Д. — Green C 04:57, 14 января 2024 г. (UTC) Ответить [ ответить ]

oxfordislamicstudies.com

Домен «oxfordislamicstudies.com», упомянутый примерно в 400 статьях, возвращает ошибку «NET::ERR_CERT_COMMON_NAME_INVALID».

Похоже, что по крайней мере в некоторых случаях текущий контент доступен на oxfordreference.com. Другими возможными местами для поиска могут быть oxcis.ac.eu или, возможно, ox.ac.uk. Я действительно понятия не имею, в какой степени архивные копии oxfordislamicstudies.com содержат какой-либо полезный контент. Фабрикатор ( обсуждение ) 19:05, 7 января 2024 г. (UTC) Ответить [ ответить ]

В случае http://www.oxfordislamicstudies.com/article/opr/t125/e2280?_hi=2&_pos=2 (нерабочая ссылка) архивная копия возвращает полезный контент, а ссылка oxfordreference.com предоставляет слишком мало контент, скорее всего, будет полезен. Фабрикатор ( обсуждение ) 19:27, 7 января 2024 г. (UTC) Ответить [ ответить ]
Архивной версии на https://fatcat.wiki/release/lookup?doi=10.1093/acref/9780195165203.001.0001 пока нет. Были ли это все только HTML-страницы или где-то был PDF-файл? Немо 20:42, 7 января 2024 г. (UTC) Ответить [ ответить ]
Сама книга находится в архиве (пример). Немо 20:43, 7 января 2024 г. (UTC) Ответить [ ответить ]
Согласно [14]: «Сайт продукта Oxford исламских исследований онлайн был закрыт. Содержимое, которое вы ранее приобрели на сайте Oxford исламских исследований онлайн, теперь перемещено в Oxford Reference, Oxford Handbooks Online или «Что нужно знать каждому». Это сайты с платным доступом и нет карта перенаправления. Ссылки Wayback, вероятно, будут лучше, стоит попробовать. -- Green C 05:23, 14 января 2024 г. (UTC) Ответить [ ответить ]

Fabrickator: В 317 статьях я добавил 413 новых URL-адресов архивов, 19 {{dead link}}и изменил 106 |url-status=liveна dead. -- Зеленый C 22:30, 15 января 2024 г. (UTC) Ответ [ ответ ]

сейчас Вредоносное ПО: myetymology.com

На сайте en.wiki [15] имеется не менее пятидесяти вариантов использования слова «www.myetymology (dot) com» как в простых URL-адресах, так и в шаблонах Cite. Похоже, что в этом домене используется какая-то хитрая схема вредоносного ПО: при посещении через браузер Chrome отображается страница с логотипом Chrome и текстом, в котором говорится о необходимости подтвердить, что вы человек, и вам следует нажать «Разрешить». Через браузер Firefox он открывает серую фиктивную страницу с белой областью-заставкой, похожей на диалоговое окно, с надписью «Прежде чем продолжить работу с myetymology.oom», болтает о безопасности и загружает надстройку Firefox» с помощью одной кнопки. с надписью "продолжить". Он тоже делает хитрые вещи: когда я выключился из окна Chrome, чтобы вызвать утилиту snip-it для его захвата, он изменил отображение так, что на нем отображался поиск "!ducky" (поисковая система). Я не использую).Домен определенно был узурпирован, очень вероятно опасен и должен быть удален из Википедии. -- Р.С. Шоу ( обсуждение ) 04:13, 10 января 2024 г. (UTC) Ответить [ ответить ]

Пользователь:R._S._Shaw : добавлен в очередь WP:JUDI для узурпации. Специальный:Diff/1193243552/1195955910Green C 22:35, 15 января 2024 г. (UTC) Ответить [ ответить ]

Изменение URL-адреса Lawfare

Веб-сайт был полностью обновлен, включая изменение URL-адреса с Lawfareblog.com на Lawfaremedia.org.

СТАРЫЙ: https://www.lawfareblog.com/
НОВИНКА: https://www.lawfaremedia.org/

Вальжан ( разговор ) ( ПИНГ меня ) 16:31, 10 января 2024 г. (UTC) Ответить [ ответить ]

Вальжан : Готово. Я сменил домен, а также проверил наличие перенаправлений и текущий статус каждого URL-адреса. Это было сложнее из-за того, что CloudFlare DDoS-защита блокировала бота, но это было решено. Изменено около 408 URL-адресов Special:Diff/1187555382/1196040749 , еще 18 перемещены URL-адреса архива и изменены |url-status= Special:Diff/1177313295/1196042453 . С уважением -- Green C 04:34, 16 января 2024 г. (UTC) Ответ [ ответ ]
Спасибо! -- Вальжан ( обсуждение ) ( ПИНГ мне ) 05:23, 16 января 2024 г. (UTC) Ответить [ ответить ]

Эстафета огня Зимних Олимпийских игр 2002 года не работает, ссылки на архив

Привет. Этот URL-адрес архива используется как на Зимних Олимпийских играх 2002 года , так и на эстафете огня Зимних Олимпийских игр 2002 года, но он не работает. Вместо этого он перенаправляется на Wayback Machine, и в URL-адресе появляется вопросительный знак. Глядя на старые архивные копии этой ссылки, ни одна из версий 2001 и 2002 годов не работает, несмотря на то, что они выделены синим цветом. Некоторые из архивных копий 2002 года перенаправляются на пустую страницу. Мне было интересно, почему это произошло. Спасибо! MrLinkinPark333 ( обсуждение ) 20:50, 16 января 2024 г. (UTC) Ответить [ ответить ]

Я сообщил об этом, но не могу гарантировать, что проблема будет решена. Искал в разных местах и ​​способах и не могу найти рабочую замену этому архиву. Это старый сайт (по меркам Интернета), который умер через несколько лет после создания. Спасибо за отчет. -- Зеленый C 22:01, 16 января 2024 г. (UTC) Ответ [ ответ ]
Не беспокойся! Это заставляет меня задаться вопросом, не перенаправляют ли какие-либо другие архивные URL-адреса, используемые в Википедии, на Wayback Machine и ставят ли в URL-адрес вопросительный знак. Это случилось со мной впервые. MrLinkinPark333 ( обсуждение ) 00:49, 17 января 2024 г. (UTC) Ответить [ ответить ]
Внутри самой Wayback Machine наблюдается гниение ссылок. Мой бот WaybackMedic был создан (и назван) именно для этой цели, но теперь проверка каждого URL-адреса архива занимает так много времени из-за объема, что запустить его таким образом больше невозможно. Когда мы начинали в 2015 году, на enwiki было около 600 тысяч URL-адресов архивов, сейчас их почти 12 миллионов, и каждый месяц прибавляется около 200 тысяч. -- Green C 01:35, 17 января 2024 г. (UTC) Ответить [ ответить ]
Ах. Я не знал о проблемах с Wayback Machine. Надеюсь, это ограниченная проблема. MrLinkinPark333 ( обсуждение ) 02:25, 17 января 2024 г. (UTC) Ответить [ ответить ]
Да, я считаю, что это очень маленькая доля. Конечно, мы не знаем того, чего не знаем, подобные случаи можно узнать только путем ручного обнаружения. Если бы это было много, мы бы услышали больше жалоб. Случаи, которые я могу обнаружить, составляют примерно 0,0005% ошибок. -- Green C 03:47, 17 января 2024 г. (UTC) Ответить [ ответить ]

Большая база данных мультфильмов

Согласно Википедии:Шаблоны для обсуждения/Журнал/2024, 16 января#Big Cartoon DataBase Шаблон:Bcdb и Шаблон:BCDB заголовок удаляются, однако существует множество других нешаблонных ссылок на этот веб-сайт, которые не работают (см., например, вторая ссылка на Тода Картера или внешняя ссылка на Knight-mare Hare ). Сообщаю здесь, так как не думаю, что с ними в настоящее время что-то делается (архивировано, помечено как мертвое или удалено) Гонным ( обсуждение ) 14:04, 23 января 2024 г. (UTC) Ответить [ ответить ]

Гонным , я вижу около 1000 экземпляров шаблонов и еще 1400 ссылок. Сайт был «исключен из Wayback Machine». Но первый, который я проверил, доступен на archive.today. Есть несколько вариантов:
  • Преобразуйте 1000 шаблонов в обычные квадратные ссылки, затем преобразуйте их плюс 1400 в archive.today, если таковой имеется, или добавьте значок, {{dead link}}если нет. Таким образом, если в будущем сайт когда-либо будет исключен из Wayback, эти архивы могут быть добавлены.
  • Ядерный вариант: полностью исключить все цитаты и ссылки на этот сайт.
  • Какая-нибудь другая комбинация, например, сбросить ядерную бомбу на 1000, но попытаться спасти 1400, и если какие-то из них не архивируются, то уничтожить их и т. д.
Оба варианта требуют некоторой работы, ядерный взрыв не является чистым, он полуавтоматический, каждый из них нужно проверять визуально, он ничего не искажает, но я делал это раньше, и количество не слишком велико. Преобразование и архивирование более автоматизированы. Мое предложение: если вы считаете, что сайт совершенно ненадежен и его следует удалить, даже если на нем есть архивы, используйте ядерный вариант, в противном случае первый вариант. -- Зеленый C 14:40, 23 января 2024 г. (UTC) Ответ [ ответ ]
У меня нет настоящего мнения, поскольку я не участвовал в этом обсуждении, но я назову здесь других, которые участвовали. @ Сноуманонахо @ TechnoSquirrel69 @ WikiPediaAid . Гонным ( обсуждение ) 14:47, 23 января 2024 (UTC) Ответить [ ответить ]
Этот сайт представляет собой вики... Я впечатлен, что ему удалось собрать 1400 цитирований. Я говорю «взорвать его ядерным оружием», потому что это, опять же, вики. Snowmanonahoe ( обсуждение · вклад · опечатки ) 15:57, 23 января 2024 г. (UTC) Ответить [ ответить ]
Спасибо за пинг, Гонным ! Ссылки, генерируемые шаблоном, уже удаляются ботом, поскольку TfD закрыт как delete , поэтому нам не нужно об этом беспокоиться. Я бы предпочел не удалять без разбора другие ссылки в цитатах, просто добавлю URL-адрес архива и, |url-status=deadесли применимо. TechnoSquirrel69 ( вздох ) 15:00, 23 января 2024 г. (UTC) Ответ [ ответ ]
Похоже, этот бот удаляет не только шаблон, но и всю ссылку на BCD. Звучит как ограничение бота, он может удалять только шаблоны без возможности конвертировать в квадратные ссылки. Это прискорбно, потому что TfD должен касаться удаления шаблонов, а не удаления цитат, что больше относится к области WP:RSN . Это распространенный сценарий со смесью шаблонов и ссылок, и в итоге мы сталкиваемся с этим несоответствием. Некоторые цитаты полностью удаляются из-за шаблона, другие сохраняются, потому что это квадратные ссылки, это случайно. В любом случае, это не имеет прямого отношения к BCD, просто наблюдение. Я могу попытаться заархивировать то, что осталось, без проблем. -- Зеленый C 15:25, 23 января 2024 г. (UTC) Ответ [ ответ ]
Я не думаю, что бот удаляет цитаты, а только ссылки, созданные шаблоном {{bcdb}}. Все ссылки на цитирование должны оставаться на месте. TechnoSquirrel69 ( вздох ) 15:45, 23 января 2024 г. (UTC) Ответ [ ответ ]
На данный момент я оставлю цитаты и буду считать ссылки мертвыми. Нет четкого консенсуса по поводу полного уничтожения цитат. -- Green C 01:47, 24 января 2024 г. (UTC) Ответить [ ответить ]
Спасибо, GreenC ! TechnoSquirrel69 ( вздох ) 23:06, 24 января 2024 г. (UTC) Ответ [ ответ ]
Я внес следующие изменения
  • Удалите существующие ссылки Wayback, поскольку они не работают.
  • Добавьте ссылки archive.today, если они доступны (1025).
  • Добавить {{dead link}}для остальных (697)
  • Обновите iabot.org, чтобы изменения могли распространяться на более чем 300 других языковых вики.
Если в будущем ограничение на Wayback будет снято, боты смогут конвертировать неработающие ссылки. -- Green C 02:59, 25 января 2024 г. (UTC) Ответить [ ответить ]

Близнецы, Аполлон, Миссия шаттла «Хронология тревожных звонков»

Эта веб-ссылка в формате PDF (https://history.nasa.gov/wakeup%20calls.pdf) используется в качестве вторичного источника для большого количества статей, посвященных миссиям «Джемини», «Аполлон» и особенно «Спейс Шаттл». Недавно он получил 404, но самая последняя архивная ссылка доступна здесь (https://web.archive.org/web/20231220093919/https://history.nasa.gov/wakeup%20calls.pdf). Было бы здорово, если бы вы добавили ссылку на этот архив в очередь. SpacePod9 ( обсуждение ) 00:54, 24 января 2024 г. (UTC) Ответить [ ответить ]

Я отправил задание IABot на обработку 56 страниц, на которых оно расположено. -- Green C 01:51, 24 января 2024 г. (UTC) Ответить [ ответить ]
Спасибо за помощь! SpacePod9 ( обсуждение ) 03:43, 24 января 2024 г. (UTC) Ответить [ ответить ]

Каноэ.ca

Похоже, что canoe.ca когда-то был новостным сайтом, на который ссылаются во многих статьях, но с тех пор его узурпировал другой сайт, посвященный азартным играм. К сожалению, новые владельцы также заблокировали Wayback Machine, и только некоторые из просмотренных мной страниц находятся в архиве.сегодня. Однако некоторые ссылки можно восстановить, изменив «canoe.ca» на «canoe.com» и затем перейдя в Wayback Machine. Боты могут в этом помочь? Спасибо! :Jay8g [ V • T • E ] 23:32, 27 января 2024 г. (UTC) Ответить [ ответить ]

Наверное, это немного сбивало с толку. Существует три основных способа архивирования существующих ссылок canoe.ca:
  • Archive.today может содержать прямой архив URL-адреса canoe.ca.
  • Wayback Machine может иметь архив той же страницы с заменой «canoe.ca» на «canoe.com».
  • Archive.today может иметь архив той же страницы с заменой «canoe.ca» на «canoe.com».
Насколько я могу судить, страницы canoe.ca и canoe.com были полностью идентичны, но все ссылки, которые я проверил, кажутся неработающими на обоих доменах. К сожалению, по данным Special:LinkSearch , таких ссылок более 10 000 , и мне не справиться с ними вручную. Есть также немало мертвых ссылок на сам canoe.com, но, по крайней мере, они не узурпированы и их можно найти в Wayback Machine в обычном режиме. :Jay8g [ V • T • E ] 23:45, 27 января 2024 г. (UTC) Ответить [ ответить ]
Примечания для canoe.ca, т.е. каноэ.com :
  • 6148 страниц
  • 391 страница со ссылками на archive.org
  • 339 страниц со ссылками WebCite
  • 1184 страницы со ссылками на archive.today
  • Более 100 поддоменов (www, jam, погода и т. д.). Полный список см. в IABot.
  • Ничего в шаблоне или модуле NS
Предложение для canoe.ca в пяти запусках WaybackMedic:
  1. Проход 1а (каноэ1): Удалить все ссылки Wayback  Готово - удалить 391 архив
  2. Шаг 1b (canoe3 и canoe4): удалить все ссылки WebCite (ошибки SSL и нестабильная работа).  Готово — удалить 329 архивов.
  3. Шаг 2 (каноэ2): попытка преобразования в archive.today. Иначе добавить  Готово - добавить 8,353 archive.today, 633 (всего, включая существующие), изменить 578 на мертвые{{dead link}} {{dead link}}|url-status=live
  4. Шаг 3a (canoe5): для canoe.ca с {{dead link}}: проверьте API, существует ли ссылка Wayback, если она была преобразована в canoe.com. Если да, измените исходную ссылку на canoe.com, установите статус «действующий» и удалите «  Готово» — 157. URL-адреса, преобразованные в canoe.com{{dead link}}
  5. Этап 3b (canoe6): проверьте ссылки canoe.com из этапа 3a на предмет гниения ссылок. Если да, преобразуйте их в ссылки Wayback или archive.today. Готово  : 294 URL-адреса Wayback добавлены к URL-адресам canoe.com в том же наборе статей, обработанных во время этапа Pass. 3a (превышение из-за ранее существовавших ссылок canoe.com, которые были неактивны)
  6. Шаг 3c (canoe7): Составьте список цитат с помощью  Done 406 цитат, перечисленных в Википедии: Ссылка rot/cases/canoe.ca{{dead link}}
  7. Шаг 4 (judi14a и judi14b): преобразуйте canoe.ca в узурпированную ссылку, следуя шагам WP:USURPURL . Это будет включать в себя полное удаление цитат, не имеющих URL-адреса архива  . Выполнено Отредактировано около 6000 страниц.
Предложение для canoe.com
  1. Шаг 5 (canoecom): Проверка неработающих ссылок и ошибок Soft-404 как обычно.  Выполнено Отредактировано 1132 статьи из 1953 проверенных. Добавлено 1820 URL-адресов архивов. Изменить 371 на мертвый|url-status=live
----
Пользователь:Jay8g согласно приведенному выше предложению. При каждом проходе бота включены разные настройки. Если все сделано в таком порядке, все должно работать. «Проход 3» может привести к большому количеству удаленных цитат, я сообщу вам об этом, прежде чем запускать этот тест. Для этого потребуется как минимум 4 запуска бота по 6 тысяч страниц каждый, плюс некоторые действия вручную, которые займут некоторое время. -- Green C 01:39, 28 января 2024 г. (UTC) Ответить [ ответить ]
Для меня все это звучит хорошо! Спасибо! :Jay8g [ V • T • E ] 04:01, 28 января 2024 г. (UTC) Ответить [ ответить ]
Я только что подумал об одной проблеме с проходом 4: поскольку canoe.ca был агрегатором новостей, некоторые цитаты, которые в настоящее время ссылаются на него, можно найти на других, несвязанных с ним веб-сайтах. Например, ссылка на Дуэйна Джонсона (первая ссылка, которая появляется у меня при поиске на 6148 страницах) указывает на http://www.canoe.ca/SlamWrestlingArchive/feb24_rocky.html на canoe.ca, но на ту же самую статью. можно найти по адресу https://slamwrestling.net/index.php/1998/02/24/a-piece-of-the-rock/ на собственном веб-сайте Slam Wrestling. Эта статья также доступна с помощью Wayback Machine на canoe.com, но если она там недоступна, лучше заменить ее URL-адресом slamwrestling.net, чем удалять. Конечно, это невозможно сделать без ручной работы, и все, что представляет собой простой URL-адрес, исчезло навсегда.
Мне будет интересно посмотреть, сколько ссылок на canoe.ca останется после шагов 1–4, и посмотреть, имеет ли смысл полностью удалить эти ссылки или попытаться сначала найти те же статьи, опубликованные в другом месте. Я не уверен, сталкивалась ли эта ситуация раньше с узурпированными URL-адресами, подобными этой, или это стандартная практика. :Jay8g [ V • T • E ] 04:18, 28 января 2024 г. (UTC) Ответить [ ответить ]
В качестве примера: не существует карты, по которой можно было бы определить, куда должна идти ссылка на canoe.ca. А поскольку canoe.ca теперь является узурпированным сайтом пороков, мы должны скрывать его от глаз. А если архива нет, удалите его. Давайте подождем и посмотрим, сколько их будет после прохода 3. Одним из решений является то, что вместо удаления всей цитаты, преобразование в {{citation}}которую не требует URL-адреса, преобразование |work=в Slam Wrestling и удаление URL-адреса canoe.ca. Такая работа трудоемка, поскольку существует так много вариантов шаблонов цитирования и комбинаций аргументов, которые люди используют, что это непоследовательно. А также квадратные и пустые ссылки, не использующие шаблоны. -- Зеленый C 16:54, 28 января 2024 г. (UTC) Ответ [ ответ ]
Да, автоматического способа это исправить не существует. Я также не уверен, сколько ссылок можно будет исправить вручную, поскольку некоторые из них невозможно будет легко найти в других доменах. Я согласен подождать, чтобы посмотреть, что останется после того, как бот попытается найти ссылки на архивы, чтобы посмотреть, стоит ли мне пытаться исправить остатки вручную. :Jay8g [ V • T • E ] 22:05, 28 января 2024 г. (UTC) Ответить [ ответить ]
Пользователь: Jay8g : Вот оставшиеся 406 цитат с {{dead link}}: Википедия: Ссылка rot/cases/canoe.ca .. всего на enwiki их более 11 000, поэтому уровень успешности архивирования составил около 96%, что очень хорошо. Что-то еще нужно сделать с 406. Варианты — это цитирование, которое является единственным выбором для квадратных ссылок. Преобразовать {{cite news}}и удалить |url=— этот вариант обычно используется, когда ссылку можно найти в автономном режиме, как микрофишу газеты. Конечно, есть ручная работа, где возможно все. Тем временем я начну обрабатывать остальные ссылки canoe.com, многие из них кажутся неработоспособными. -- Зеленый C 14:36, 30 января 2024 г. (UTC) Ответить [ ответить ]
Я выборочно проверил несколько из оставшихся 406 неработающих ссылок и не смог найти альтернативных ссылок ни для одной из них, поэтому я думаю, что нам следует удалить оставшиеся ссылки. Спасибо за вашу помощь — я впечатлен тем, сколько ссылок удалось исправить! :Jay8g [ V • T • E ] 21:50, 30 января 2024 г. (UTC) Ответить [ ответить ]
Пользователь: Jay8g звучит хорошо. Я буду работать над этим в течение следующих нескольких дней и опубликую, когда закончу. Спасибо, что обратили на это внимание. Я знал о Canoe, но не знал, что его узурпировали и исключили из Wayback, это новый сценарий (плюс особенность canoe.com). По сути, для этого требовались все функции, которые есть у моего бота, а некоторые еще никогда не делали так много проходов. Это был хороший опыт изучения того, что может делать бот и как. -- Green C 02:14, 31 января 2024 г. (UTC) Ответить [ ответить ]
Как уже отмечалось выше, это все делается окончательно. -- Green C 02:34, 5 февраля 2024 г. (UTC) Ответить [ ответить ]
Большая часть контента на canoe.ca взята из газет Sun Media , поэтому многие из этих статей, вероятно, можно найти в архивах канадских газет (веб-архивы, такие как https://web.archive.org/web/*;type=text/ torontosun.com/* или газетные архивы, такие как NewspaperARCHIVE.com). Похоже, что URL-адреса с «-cp» были статьями Canadian Press , и в некоторых из них The Canadian Press указаны в качестве автора, издателя, агентства и т. д., а URL-адреса с «-ap» были статьями Associated Press . Статьи этих агентств должны быть доступны в разных местах. Найти их – задача.
Все статьи о борьбе, вероятно, можно найти на Slam Wrestling, если кто-то захочет выполнить эту работу. Я не видел аналогичных партнерских сайтов для других видов спорта или категорий. -- Jahalive ( обсуждение ) 02:22, 2 февраля 2024 г. (UTC) Ответить [ ответить ]

Цитаты из абстрактной машины Уоррена

Некоторые цитаты в Warren Abstract Machine неверны, в том числе эта: http://wambook.sourceforge.net/ 185.151.251.58 ( обсуждение ) 08:54, 31 января 2024 г. (UTC) Ответить [ ответить ]

Я запустил IABot на странице, но может потребоваться несколько попыток, прежде чем бот решит, что ссылка не работает. - Green C 02:19, 2 февраля 2024 г. (UTC) Ответить [ ответить ]

bibliotecadigital.ciren.cl

Эта чилийская цифровая библиотека, похоже, переформатировала свои URL-адреса и используется в качестве источника во многих статьях. Вот список: похоже, что они по-прежнему размещают большинство, если не все, статей, но под разными URL-адресами. Джо-Джо Юмерус ( обсуждение ) 13:52, 31 января 2024 г. (UTC) Ответить [ ответить ]

Пользователь: Jo-Jo_Eumerus, есть ли пример перехода от старого к новому? Скорее всего, если не очевидно, как изменить, мы ничего не сможем сделать, кроме как считать старые ссылки мертвыми и добавить архивы. -- Green C 02:15, 2 февраля 2024 г. (UTC) Ответ [ ответ ]
Похоже, что они все еще имеют общие названия: https://bibliotecadigital.ciren.cl/server/api/core/bitstreams/72bd0a55-5f0d-4ea6-98c4-116797dce09e/content становится https://bibliotecadigital.ciren.cl/items /96666f36-9fc4-4833-8a95-0e85c6fd98ce Джо-Джо Юмерус ( обсуждение ) 11:13, 3 февраля 2024 г. (UTC) Ответить [ ответить ]

cnnphilippines.com

CNN Филиппины прекратила свою деятельность 31 января 2024 года. На данный момент https://cnnphilippines.com возвращает код 503. Нам понадобится IABot, чтобы прочесать примерно 2200 страниц (всего около 3000 ссылок), на которые он связан, и добавить архивы к этим цитатам. Соответствующее обсуждение на WT:TAMBAY#Archiving новостных статей CNN Philippines . Хлод  ( передать привет! ) 17:17, 31 января 2024 г. (UTC) Ответить [ ответить ]

Отправлено в IABot. -- Green C 02:12, 2 февраля 2024 г. (UTC) Ответ [ ответ ]
Я не знаю, почему, но IABot пропустил более 1000 ссылок, поэтому я повторно запустил его с помощью WaybackMedic и получил остальные. -- Green C 02:36, 5 февраля 2024 г. (UTC) Ответ [ ответ ]
Большое спасибо, @GreenC ! Хлод ( передать привет! ) 12:48, 5 февраля 2024 г. (UTC) Ответить [ ответить ]  

themessenger.com

themessenger.com закрылся [16], у нас около 186 использований на themessenger.com  . Все новостные статьи теперь ссылаются на пустую страницу (например, [17]) Hemiauchenia ( обсуждение ) 19:46, 1 февраля 2024 г. (UTC) Ответить [ ответить ]

Отправлено в IABot. -- Green C 02:17, 2 февраля 2024 г. (UTC) Ответить [ ответить ]

Wst.tv

Привет! С тяжелым сердцем World Snooker Tour изменил свой веб-сайт и изменил способ работы всех своих ссылок, и у него нет реального соглашения об именах для большинства ссылок с wst.tv.

Например: https://wst.tv/players/jimmy-white/ теперь находится по адресу https://www.wst.tv/players/6100064a-0ea4-4a0c-b8ee-0e2ddaa3def4.

Новостные статьи и другие материалы также переместились. Если есть умный способ исправить это, дайте мне знать, но я предполагаю, что нам придется заархивировать/пометить как мертвую оставшуюся часть. Ли Виленски ( обсуждениевклад ) 19:39, 2 февраля 2024 г. (UTC) Ответить [ ответить ]

Пользователь: Ли Виленски. Я не вижу способа перенести ссылки без информации о перенаправлении. Если у некоторых ссылок есть перенаправление, бот подберет его автоматически. В противном случае будет добавлен URL-адрес архива или файл . Кажется, 379 страниц. -- Green C 05:57, 3 февраля 2024 г. (UTC) Ответ [ ответ ]{{dead link}}
Все новостные статьи перемещены с https://wst.tv/murphy-takes- Season-opener/ на https://www.wst.tv/news/2023/july/21/murphy-takes- Season-opener. /
Это беспорядок, я, конечно, не вижу способа это исправить. Ли Виленски ( обсуждениевклад ) 09:04, 3 февраля 2024 г. (UTC) Ответить [ ответить ]
На удивление часто веб-сайты переходят на новую платформу и не оставляют перенаправлений. Если хотите, свяжитесь с ними и спросите, планируют ли они оставлять перенаправления, и упомяните Википедию в качестве примера. На данный момент я все еще могу добавлять архивы, и если в будущем они добавят перенаправления, бот сможет отменить архивы, снова сделать их живыми и перейти на новый перенаправленный URL-адрес. В любом случае, по сути, это переключение переключателя в боте. -- Зеленый C 14:12, 3 февраля 2024 г. (UTC) Ответ [ ответ ]
Что касается обращения в WST: по моему опыту, они не отвечают. Возможно, было бы лучше попытаться убедить поставщиков программного обеспечения обеспечить перенаправление. Судя по всему, в этом участвуют две компании. Один — https://urbanzoo.io/, а другой — https://www.imgarena.com/.  Алан  ( обсуждение ) 12:42, 4 февраля 2024 г. (UTC) Ответ [ ответ ]
Похоже, контент не был перенесен. Например, на старом сайте https://wst.tv/white-completes-epic-comeback/ выполните поиск на новом сайте: «White Completes Epic Comeback» на вкладке новостей. Поиск без результата. Аналогично Google: https://www.google.com/search?client=firefox-b-1-lm&q=%22White+Completes+Epic+Comeback%22+site%3Awst.tv .. выглядит как полный сброс настроек site и любые найденные совпадения, как и в случае с /players, могут быть случайностью. --- Green C 17:39, 4 февраля 2024 г. (UTC) Ответить [ ответить ]

Мне удалось построить предварительную карту страниц игроков, просматривая https://www.wst.tv/players/ без монитора и переформатировав HTML в эту таблицу, сделав наилучшее предположение по левому столбцу. Если бот обнаружит URL-адрес в левом столбце, он заменит его на правый столбец. -- Зеленый C 17:14, 4 февраля 2024 г. (UTC) Ответ [ ответ ]

Я думаю, что это гораздо сложнее. На старом сайте были страницы для гораздо большего количества игроков, чем сейчас включено в https://www.wst.tv/players, где есть только текущие игроки. Посмотрите https://web.archive.org/web/20221126125804/https://wst.tv/player_category_taxonomy/other-players/. Большинство из них полностью исчезли, и многие из них упоминаются в наших статьях.  Алан  ( обсуждение ) 10:12, 5 февраля 2024 г. (UTC) Ответить [ ответить ]
...например: если вы выполните поиск по запросу «Дэвис» в https://www.wst.tv/players, вы получите только Марка Дэвиса. На старом сайте входили Стив Дэвис, Джо Дэвис и Фред Дэвис, которые были важными игроками, очевидно, теперь забытыми WST.  Алан  ( обсуждение ) 10:27, 5 февраля 2024 г. (UTC) Ответить [ ответить ]
Хорошо, я этого боялся, похоже, таких игроков было не так много. Судя по всему, старый сайт и контент были полностью заброшены, а новый сайт имеет некоторые совпадения, но это случайность, и нельзя предполагать, что на странице содержится тот же фактический контент, даже если можно найти совпадение. Они не делали миграцию сайта. В этом случае в целях проверки цитирования правильным действием будет рассматривать все со старого сайта как неработающую ссылку и надеяться, что архив доступен. -- Зеленый C 14:40, 5 февраля 2024 г. (UTC) Ответ [ ответ ]
Это примерно то, чем мы занимаемся. Если вы посмотрите Список игроков в снукер, то увидите, что все ссылки имеют рабочие архивы.  Алан  ( обсуждение ) 15:14, 5 февраля 2024 г. (UTC) Ответ [ ответ ]
Хорошая работа! Мой бедный, бедный список наблюдения. Просто нужно решить, что мы можем сделать с остатком. Ли Виленски ( обсуждениевклад ) 08:07, 6 февраля 2024 г. (UTC) Ответить [ ответить ]
Пользователь:AlH42 : Не так уж и плохо, статьи, где бот добавил{{dead link}}
-- Зеленый C 14:48, 6 февраля 2024 г. (UTC) Ответ [ ответ ]
Спасибо. Я думаю, что нам еще многое предстоит сделать. А шаблон плеера WST - это проблема.  Алан  ( обсуждение ) 15:10, 6 февраля 2024 г. (UTC) Ответить [ ответить ]
Бот должен был обработать каждую ссылку на домен в основном пространстве. Возможно, он пропустил некоторые редкие случаи, когда возникают проблемы с анализом страницы. Шаблонное пространство я не делал. Возможно, в файловом пространстве они есть, я не проверял. В любом случае, если вы считаете, что вам нужна дополнительная помощь с ботами, дайте мне знать. -- Зеленый C 15:44, 6 февраля 2024 г. (UTC) Ответ [ ответ ]

Кеш Google

Судя по всему, кеш Google (webcache.googleusercontent.com) скоро будет отключен. С этими ссылками имеется более 5000 страниц, и многие из них, похоже, уже не работают. Вероятно, их следует заменить исходным URL-адресом и/или соответствующими ссылками на архивы, если таковые имеются, в зависимости от того, как они в настоящее время используются. :Jay8g [ V • T • E ] 00:59, 5 февраля 2024 г. (UTC) Ответить [ ответить ]

Я поработаю над этим. Делаю... - если вы видите, что этот запрос появился где-то еще, укажите его сюда. Ссылки беспорядочны, как и размещение в шаблонах, поэтому потребуется некоторая осторожность. -- Green C 01:29, 5 февраля 2024 г. (UTC) Ответ [ ответ ]
Будет ли на archive.org храниться информация? Если это так, мы должны попытаться получить все это, чтобы его можно было легко заменить регулярным выражением. Гердона ( поговори со мной? ) 15:29, 5 февраля 2024 г. (UTC) Ответить [ ответить ]

linguistlist.org

С этим сайтом связан параметр linglist в {{ Язык информационного поля }}. Snowmanonahoe ( обсуждение · вклад · опечатки ) 23:19, 5 февраля 2024 г. (UTC) Ответить [ ответить ]

Пользователь:Snowmanonahoe : Я вижу это только на двух страницах: https://en.wikipedia.org/wiki/Wikipedia:URLREQ/Special:LinkSearch?target=linguistlist.org%2Fmultitree --Сам сайт выглядит мертвым с 2008 или 2009 года. -- Зеленый C 00:49, 6 февраля 2024 г. (UTC) Ответить [ ответить ]
GreenC : попробуйте Special: LinkSearch/multitree.org/codes/ . Теперь все эти URL-адреса перенаправляют на linguistlist.org/multitree. Snowmanonahoe ( обсуждение · вклад · опечатки ) 00:58, 6 февраля 2024 г. (UTC) Ответить [ ответить ]
Пользователь: Snowmanonahoe : Хорошо. Там 75 страниц. Сравните результаты Archive.today с WaybackMachine. Я рекомендую первый проход с использованием Archive.today, а если второй проход недоступен, будет использоваться WaybackMachine. Звук в порядке? Кстати, весь сайт linguistlist.org выглядит так, будто требует проверки 421 страница. Они создали новый веб-сайт, но старые входящие ссылки не работают должным образом. Ссылки на новые сайты работают. -- Green C 02:30, 6 февраля 2024 г. (UTC) Ответить [ ответить ]
Я думаю, Квамикагами должен сначала взвесить это. Snowmanonahoe ( обсуждение · вклад · опечатки ) 03:08, 6 февраля 2024 г. (UTC) Ответить [ ответить ]
Я отказался от возможности вернуть работоспособность многодеревьевым ссылкам, когда они были практически отключены. Я не знал, что они снова встали.
Multitree вообще не является RS. Я бы избегал их использования, за исключением вымерших языков, где Linglist поддерживает описание кода ISO (как это делает Ethnologue для живых языков); для деревьев классификации различных авторов (например, в нашей австроазиатской статье); и, возможно, еще пара вещей, о которых я не думаю, но не в качестве общего примера.
Есть ли что-то конкретное, на что вы хотели бы, чтобы я высказал свое мнение? Я думаю, что нам нужно будет обновлять ссылки, когда мы их используем, поскольку я не могу придумать никакой причины, по которой мы хотели бы сохранить или ссылаться на старые версии их страниц. — квами ( разговор ) 03:30, 6 февраля 2024 г. (UTC) Ответ [ ответ ]
Я бы избегал их использования, за исключением [некоторых] .. Хорошо, моя работа — сохранять неработающие ссылки, добавляя URL-адрес архива. Это всего лишь около 75 ссылок. После добавления архивов вы можете удалить некоторые цитаты и оставить другие по своему усмотрению, чтобы вы могли видеть содержимое страницы. -- Зеленый C 14:54, 6 февраля 2024 г. (UTC) Ответ [ ответ ]
Это должно работать нормально. Вам не нужно оценивать качество рефа. — квами ( разговор ) 15:25, 6 февраля 2024 г. (UTC) Ответ [ ответ ]

hobbes.nmsu.edu

Репозиторий OS/2 будет отключен в апреле. Всего несколько страниц в enwiki. [18] -- Green C 15:32, 6 февраля 2024 г. (UTC) Ответ [ ответ ]