Страница для запроса запросов к базе данных
- WP:RAQ
- WP:КАРЬЕР
- WP:SQLREQ
- WP:ЗАПРОС
Это страница для запроса одноразовых запросов к базе данных по определенным критериям . Пользователи, которые заинтересованы и могут выполнять SQL- запросы по проектам, могут предоставить результаты с веб-сайта Quarry.
Вас также может заинтересовать следующее:
- Если вы заинтересованы в написании SQL-запросов или хотите помочь нам, посетите нашу страницу советов .
- Если вам нужно получить список названий статей, которые соответствуют определенным критериям, рассмотрите возможность использования PetScan (руководство пользователя) или поиска по умолчанию . Petscan может генерировать список статей в подкатегориях, статей, которые включают какой-либо шаблон и т. д.
- Если вам необходимо внести изменения в ряд статей на основе определенного запроса, вы можете разместить публикацию на странице запросов бота в зависимости от того, сколько изменений необходимо.
- Для долгосрочного обзора и проверки доступны отчеты базы данных .
Quarry не имеет доступа к содержимому страницы, поэтому запросы, требующие проверки викитекста, не могут быть решены с помощью Quarry. Однако кто-то может помочь, используя Quarry другим способом (например, проверив таблицу ссылок категорий, а не текст "Category:") или предложить альтернативный инструмент.
Для списка на Wikipedia:Список участников Википедии по количеству правок №1–1000 , можете ли вы отфильтровать все еще активные учетные записи (например, какие-либо правки за последний год?), а для оставшихся, скажите мне:
- сколько из них находятся в состоянии покоя, и
- как долго аккаунт был активен (например, если человек редактировал с 2010 по 2020 год, то укажите «10 лет»).
Я хочу написать предложения, которые говорят что-то вроде «10% наших самых активных редакторов больше не редактируют» и «Среди этих бывших редакторов большинство редактировали около 10 лет, прежде чем уйти или быть заблокированными». В конечном счете, я надеюсь использовать это как способ приблизительной оценки ставки замены для редакторов с большим объемом работы. Это будет неидеально, но это может дать мне очень общее представление. (Лучшие предложения приветствуются.) WhatamIdoing ( talk ) 07:19, 14 октября 2024 (UTC) [ ответить ]
- Единственная связанная страница пользователя из этого списка, которая не редактировала в 2024 году, — это Geo Swan . 6330 дней между первым и последним изменением, около 17 лет и четырех месяцев. — Cryptic 14:42, 14 октября 2024 (UTC) [ ответить ]
- Причина в том, что пользователи, которые не редактировали некоторое время, обычно отвязываются. Однако по какой-то загадочной причине Geo Swan все еще связан.И Geo Swan - плохой пример, так как они были забанены (из-за одного инцидента, который, по моему мнению, не заслуживал бана), а не решили прекратить редактирование. * Pppery * это началось... 16:31, 14 октября 2024 (UTC) [ ответить ]
- Ну, это неудобно, хотя я полагаю, что так проще выяснить, какие редакторы неактивны. 727 из 1000 аккаунтов все еще связаны; следовательно, 27% редакторов, которые внесли больше всего правок, неактивны. (Есть также 11 «заполнителей» и пара заблокированных аккаунтов, так что ±2%.)
- Похоже, что блокировки и запреты — нетривиальный способ для нас потерять редакторов, поэтому я бы склонился оставить их в списке. WhatamIdoing ( обсуждение ) 18:19, 14 октября 2024 (UTC) [ ответить ]
- Я обнаружил, почему эти имена пользователей отвязываются независимо, после пары итераций запроса, который занимает полтора часа. Очень раздражает. Если вы создадите подстраницу пользователя, ссылающуюся только на отвязанных пользователей (и на Geo Swan, я полагаю), я могу перезапустить ее против этого. — Cryptic 22:17, 14 октября 2024 (UTC) [ ответить ]
- Вот постоянная ссылка на весь список, разделенный по активности, со ссылками на все именованные учетные записи. В этой редакции есть только неактивные учетные записи. Я не уверен, каков предел источника, но я видел кого-то в списке «неактивных», кто сделал редактирование ровно 30 дней назад, и нескольких, кто сделал редактирование за последние пару месяцев. WhatamIdoing ( talk ) 19:02, 23 октября 2024 (UTC) [ ответить ]
- quarry:query/87412. — Cryptic 03:00, 25 октября 2024 (UTC) [ ответить ]
- И так около дюжины лет.
- Если это типично для срока службы — а это может быть и не так , в таком случае это почти наверняка заниженная оценка — нам, возможно, придется удвоить это. Ранее я подсчитал, что наш текущий уровень удержания дает нам примерно достаточно людей каждый год, чтобы заменить 4% людей, которые сделали 100 тыс. правок, или 25 лет для полного оборота. WhatamIdoing ( talk ) 21:39, 25 октября 2024 (UTC) [ ответить ]
Ищу запрос на карьер, который может оценить, сколько основных перенаправлений пространства в настоящее время не имеют добавленных к ним категорий перенаправления. Привет, чувак, я Джош ( обсуждение ) 15:12, 15 октября 2024 (UTC) [ ответить ]
- Вероятно, это займет много времени. Вам нужен список или просто номер? — Cryptic 17:15, 15 октября 2024 (UTC) [ ответить ]
- Я понимаю, что это, скорее всего, займет некоторое время, поэтому пока просто число. Если это не слишком большая работа, я думаю, что число по годам также может быть полезным. Это для использования в обсуждении относительно фильтра редактирования 1,298 . Привет, чувак, я Джош ( обсуждение ) 17:18, 15 октября 2024 (UTC) [ ответить ]
- Всего 6265917 (подсчет по году первого редактирования). Выборка 10000. — Cryptic 17:55, 15 октября 2024 (UTC) [ ответить ]
- Круто, спасибо большое! Привет, чувак, я Джош ( поговорю ) 17:56, 15 октября 2024 (UTC) [ ответить ]
Больше запросов на перенаправление
Как обсуждалось с Cryptic на его странице обсуждения, я перечисляю некоторые слова/коты для запросов, по которым нужно фильтровать.
Запрос 2: Перенаправления с этими словами в заголовке: Журнал, журнал, (Журнал), (журнал)
Запрос 3: Перенаправления на статьи в этих категориях: Академические издательства , Некоммерческие академические издательства , Издательства открытого доступа Никто ( обсуждение ) 06:46, 16 октября 2024 (UTC) [ ответить ]
- Журнал/журнал, в этих категориях. (Версия последнего, позволяющая сортировать по категории, но содержащая несколько строк для каждого перенаправления, по одной для каждой совпадающей категории, в которой находится цель.) — Cryptic 20:11, 16 октября 2024 (UTC) [ ответить ]
- @ Cryptic Возможно ли искать перенаправления на статьи в определенных WikiProjects? Например, WP :CH или WP:AJ . Никто ( talk ) 12:42, 25 октября 2024 (UTC) [ ответить ]
- Если их страницы обсуждения категоризированы или включают шаблон википроекта. — Cryptic 12:55, 25 октября 2024 (UTC) [ ответить ]
- Не могли бы вы сделать мне запрос на перенаправления типа Chateau Chillion , которые не имеют rcats и перенаправляют на статью с {{ WikiProject Switzerland }} на странице обсуждения? Спасибо Никто ( обсуждение ) 13:01, 25 октября 2024 (UTC) [ ответить ]
- quarry:query/87427 содержит первые десять тысяч. Всего их 23765 (из 52629 перенаправлений mainspace, нацеленных на такие страницы). — Cryptic 13:44, 25 октября 2024 (UTC) [ ответить ]
Есть ли способ запустить Q87329 на всех wiki-DB без ручной настройки базы данных каждый раз? Спасибо, TrangaBellam ( talk ) 19:25, 21 октября 2024 (UTC) [ ответить ]
- Ах, это, похоже, невозможно. TrangaBellam ( обсуждение ) 19:29, 21 октября 2024 (UTC) [ ответить ]
- Не через Quarry, но я мог бы сделать это через wikitech:PAWS. За исключением Meta, MediaWiki.org и testwiki, которые не являются контент-проектами, поэтому имеют много ложных срабатываний, это дает следующие результаты:
Единственное новое действие офиса, о котором мы еще не знали, найденное таким образом, — это автоматически подтвержденная защита zh:AddisWang. * Pppery * оно началось... 19:36, 21 октября 2024 (UTC) [ ответить ]
- Спасибо большое! К вашему сведению, @ Bri : : Действия ANI действительно кажутся очень редким случаем. TrangaBellam ( talk ) 19:41, 21 октября 2024 (UTC) [ ответить ]
Обычно архивные страницы в Википедии имеют формат "/Архив 1", "/Архив 2",... Часто при перемещении страниц обсуждения перемещающий не обновляет инструкции по архивированию для ботов. Это заставляет бота отправлять разделы в архивы с заголовками "Архивы/ 1", "Архивы/ 2", нарушая шаблон архивных страниц, а также последовательность. Например, последний архив перед перемещением может быть в "Архив 4". После перемещения новые разделы отправляются в "Архивы/ 1". Чтобы исправить их, мне понадобится этот запрос. Спасибо! — CX Zoom [он/им] ( давайте поговорим • { C • X }) 20:06, 2 ноября 2024 (UTC) [ ответить ]
- quarry:query/87612.
{1,3}
Излишне без чего-либо следующего за ним; я не предполагал неявного, $
поскольку неявное, ^
идущее с ним, предотвратило бы любые совпадения. Если вы пытаетесь отфильтровать заголовки вроде Talk:.30 carbine/Archives/2014/June , вам понадобится что-то вроде ($|\D)
after. — Cryptic 21:18, 2 ноября 2024 (UTC) [ ответить ]- Большое спасибо! — CX Zoom [он/его] ( давайте поговорим • { C • X }) 10:12, 3 ноября 2024 (UTC) [ ответить ]
Недавно, когда я делал это редактирование , мне пришло в голову, что нам следует иметь способ хотя бы полуавтоматического определения и маркировки статей с одним источником или без него. Я хотел бы иметь возможность сделать AWB-прогон вероятных таких статей.
Учитывая, что существует множество различных способов поиска источников, я хотел бы начать с консервативного запроса, который выводит список всех статей, не содержащих ни одной из следующих строк:
- <реф
- http://
- Примечания
- цитировать
- Ссылка
- Источники
- Цитата
- Библиография
- сфн
Я не знаю, как составить запрос RegEx с отрицанием (в Интернете, кажется, есть некоторые идеи, но мне трудно преобразовать это в формат Википедии), поэтому я был бы признателен за помощь. Может ли кто-нибудь помочь мне сгенерировать этот список? Привет, Sdkb talk 05:14, 14 ноября 2024 (UTC) [ ответить ]
- Нет доступа к тексту статьи. — Cryptic 06:19, 14 ноября 2024 (UTC) [ ответить ]
- этот поиск регулярных выражений — это начало. Он выдает 10000 результатов, а затем истекает время ожидания. * Pppery * он начался... 06:24, 14 ноября 2024 (UTC) [ ответить ]
- Вы захотите, по крайней мере, сделать это без учета регистра, привязать «ref» и, возможно, «cite» к границам слов, а также сопоставить «https://». Но все равно, WP:Request запрос — это не WP:Request поиск . — Cryptic 06:34, 14 ноября 2024 (UTC) [ ответить ]
- ...черт возьми, так оно и есть. Так быть не должно . — Cryptic 06:35, 14 ноября 2024 (UTC) [ ответить ]
- Базовый кластер ElasticSearch имеет реплику только для чтения на Toolforge, к которой можно делать запросы . Поэтому я бы сказал, что эта страница — подходящее место для таких запросов. – SD0001 ( обсуждение ) 07:41, 14 ноября 2024 (UTC) [ ответить ]
- Если кто-то придет сюда в поисках помощи с серединой Elasticsearch, он будет очень, очень разочарован. — Cryptic 08:13, 14 ноября 2024 (UTC) [ ответить ]
- Спасибо, @ Pppery ! После расширения запроса
-insource:/([Rr]ef|http|[Nn]otes|[Cc]ite|[Ss]ources|[Cc]itation|[Bb]ibliography|sfn|list of|lists of|link|further reading|Wiktionary redirect)/ -intitle:list -deepcategory:"Set index articles"
он начинает выдавать в основном полезные результаты. Ура, Sdkb talk 07:17, 14 ноября 2024 (UTC) [ ответить ]- Вы можете получить больше результатов до истечения времени ожидания, добавив больше фильтров без регулярных выражений. Например, добавление
-hastemplate:"Module:Citation/CS1"
дает 15 тыс. результатов вместо 2 тыс. – SD0001 ( обсуждение ) 07:39, 14 ноября 2024 (UTC) [ ответить ]
- В любом случае, эта страница может ответить на ваш первоначальный вопрос следующим образом: предоставить вам списки страниц с нулевым или нулевым или одним внешними ссылками, или которые не включают ни одного из набора шаблонов, или и то, и другое; и в качестве бонуса отфильтровать перенаправления (что, я почти уверен, делает поиск, нравится вам это или нет), устранить неоднозначности и — в некоторой степени — составить список страниц. — Cryptic 07:16, 14 ноября 2024 (UTC) [ ответить ]