Поиск по сайту
Материал из wiki
Содержание |
[править] Область поиска
В настоящий момент искать можно в 6 областях: в записях, видео, артах, столе заказов, новостях и комментариях.
При поиске по арту раздел с CG-паками пока не участвует, решение этого вопроса внесено в планы, но не в ближайшие. Область поиска задается галочками под поисковой строкой на главной странице сайта, или в списке, выезжающем при нажатии на "Показать опции поиска" на всех остальных страницах. Если после одного поискового запроса вы продолжите искать, повторять задание области не нужно - сайт воспроизведет ее по памяти.
В поиск попадают не только материалы, прошедшие на главную страницу своего раздела, но и то, что сейчас находится на очереди премодерации или вовсе убрано на барахолку, но у таких материалов при подсчете релевантности (что должно быть показано на первых страницах результатов, а что в конце) присутствует сильный занижающий коэффициент. То есть, скорее всего, вы их увидите только если возьметесь пролистать все, или если на главной странице раздела поиск не сможет выдать ничего прямо подходящего.
[править] Сортировка результатов
В настоящий момент есть три вида сортировки: по релевантности, по дате добавления и по дате добавления в обратном порядке (от старых к новым).
Релевантность это, если в двух словах, соответствие найденного поисковому запросу. То есть вот если взять поисковый запрос "Saya no Uta", самую высокую релевантность должна иметь запись с этой игрой, релевантность поменьше - артбук по ней или музыкальный альбом с ее саундтреками, совсем небольшую - другие игры от той же студии, и нулевую релевантность будут иметь совсем непричастные записи вроде игр по тохо. Точное определение этой самой релевантности представляет из себя целую науку, которую постоянно грызут поисковики вроде Гугла или Яндекса. Но, поскольку у нас тут не миллиард страниц рунета, а один относительно небольшой сайт, в нашем поиске используется сильно упрощенная формула для вычисления релевантности.
При сортировке по дате добавления из поиска исключаются материалы не с главной страницы раздела, т.е. то что находится на барахолке или в очереди премодерации.
По умолчанию идет сортировка по релевантности.
[править] Исключение: поиск только по разделу с артом
Если в качестве области поиска указывается только раздел с артом, без каких-либо других разделов, то сортировкой по умолчанию становится сортировка по дате. Помимо этого, внешний вид результатов поиска будет выглядеть как обычная страница раздела с артом.
Сделано это для того, чтобы было привычнее людям имевшим дело с danbooru/gelbooru/любым другим сайтом использующим booru-концепт. На таких сайтах целиком посвященных арту, поиск тоже всегда ищет только по картинкам и результаты поиска разумеется тоже выглядят, как страницы booru.
[править] Что учитывается при поиске
[править] По записям
Заголовок записи, текст, текст ссылок и адреса аплоадеров куда залиты материалы или ссылаются дополнительные ссылки. Названия категорий, тегов, языков, ники авторов сделавших эту запись на 4отаку. В большей степени чем остальной текст, учитываются заголовки, категории, языки и теги. Благодаря тому что учитываются ссылки, можно искать например так: http://4otaku.ru/search/p/rel/игры+megaupload/ , это может пригодится если у вашего провайдера проблема со многими аплоадерами, и лишь несколько работают нормально.
[править] По видео
В поиске участвуют заголовок, категории, теги, ники запостивших видео и описание.
Описание - это та опциональная штукость, которую никто не пишет, и которая выезжает при нажатии на ссылку под видео "Показать описание". Участие описания в поиске это как раз аргумент за то, чтобы его писать. Чем оно подробней, тем чаще ваше видео будут находить при поиске.
[править] По артам
В поиске участвуют только категории, теги, и ники запостивших. Немного, правда?
Именно по этому теги, поле которое можно увеличивать неограниченно, становится ключевым. Чем больше поставлено тегов - тем чаще вашу любовно добавленную картинку будут находить.
[править] По столу заказов
В поиске по столу заказов участвует название того что человек заказал, предоставленная им дополнительная информация и категория заказа.
Поиск по столу заказов может сперва показаться странной затеей, а добавление поиска по нему в область поиска по умолчанию чем-то совсем уже из ряда вон. Но тут стоит вспомнить, что у нас некоторые заказы по нахождению искомого не выкладываются на сайт, в соответствующий раздел, а ограничиваются ссылкой на найденное в комментариях. Соответственно, найдя заказ, посвященный тому что вы ищете, вы имеете неплохие шансы обнаружить там ссылку на ваше искомое. И такие заказы в результатах поиска имеют приоритет перед еще не выполненными заказами.
[править] По новостям
В поиске по новостям учитывается заголовок и текст новости.
Данный поиск пока особне не нужен, так как найти нужную новость несложно и пролистав 6 страничек архива новостей. Он сделан скорее "в рост", и потому что сделать его на основе поиска по записям совсем несложно.
[править] По комментариям
В поиске по комментаряим учитывается текст комментария. А там есть еще варианты?
Хочу обратить ваше внимание, что комментарии, несмотря на то что мат запрещен, могут содержать резкие и неприятные высказывания. Поэтому включая в область поиска комментарии, будьте готовы к тому что вам попадется и не слишком лицеприятное описание искомого.
[править] Поисковый бот
Как и некоторые другие службы 4отаку, сбором информации для поиска занимается бот. Он регулярно обходит все то, что может попасть в область поиска и обрабатывает текст и прочие заголовки/ссылки/теги по которым можно искать, подготавливая из них список слов для быстрой выборки. Он же приводит слова к единой морфологии, чтобы запись со словом "вокалоиды" нашлась по запросу "вокалоид". Готовые списки для поиска он сохраняет в отдельном месте.
Поскольку эта часть работы весьма требовательна к оперативной памяти (особенно русская морфология), часто бот обходит только недавно появившиеся записи. Записи, видео или арты которым больше месяца могут ждать свое обновление неделю или даже две. Поэтому не удивляйтесь, если вы отредактировали что-то, но оно не начало сразу находится по новым словам.
[править] Всплывающие подсказки
Во время набор поискового запроса, после получения каждого нового символа, сервер пытается вспомнить поисковые запросы которые начинались бы с того, что человек уже набрал. И если находит, то предлагает, в выпадающем под поисковым полем списке. Если вариантов больше 10, то сервер выбирает самые часто набираемые.
При этом сервер подбирает только те запросы, по которым что-то может найтись в той области, которую задал пользователь. Самые часто набираемые запросы тоже определяются с поправкой на область поиска.
В случае успешного поиска же, соответственно, сервер запоминает эту информацию, чтобы использовать для дальнейших подсказок. "Ага, и артбуки по вокалоидам у нас тоже есть, сказал сервер и записал в блокнотик".
Помимо подсказок какие успешные поисковые запросы начинались на набранный вами текст, есть еще один вариант подсказки. Если область поиска ограничивается одним разделом, и этот раздел - записи, видео или арт, то в случае если имя тега, категории или в случае записей еще и языка начинается с набранных вами букв, вы увидите в подсказках конструкию вроде "Тег: тохо". Если это именно то, что вы искали, правильнее всего воспользоваться тегом, чем лишний раз использовать поиск. Теги, категории и языки создаются для быстрой выборки, в то время как поиск медленней, но может найти более сложные случаи. Если ваш случай не сложный и уже предусмотрен, то зачем гонять медленный модуль сайта?