WikiSort.ru - www

ПОИСК ПО САЙТУ | о проекте

Вы находитесь на веб-сайте WikiSort.ru , предназначенном для облегчения поиска по страницам Википедии.

Постановка проблемы

С ростом объёма накопленной информации, становятся очевидны ограничения метода строгой каталогизации.

До какого-то момента эту проблему удавалось решать системой "меток" ("тэгов") , но развитие интернета показало, что количество "меток" растёт, а логичность и последовательность их присвоения - падает.

Это явление очень наглядно проявилось в системе "Категорий" в Википедии , число которых в российской Википедии превысило 350 тысяч (по состоянию на 2019-03-10).

Если посмотреть на категории по теме мультфильмов, то там обнаружатся категории мультфильмов по странам, годам, авторам и студиям выпустившим мультфильм. И это является логичной и последовательной каталожной классификацией.

Однако, кроме таких категорий, там есть категории "мультфильмы о ..." в которых собраны ссылки на мультфильмы о событиях, персонажах, объектах и т.п. И вот эти категории уже создаются и наполняются непоследовательно, так что возникают вопросы о том, зачем нужна та или иная категория и почему тот или иной мультфильм попал или не попал в конкретную категорию.

Такая ситуация является закономерным и неизбежным этапом развития информационного ресурса с большим объёмом накопленных данных.

Разрешением этих проблем является полнотекстовый поиск, когда для нахождения требуемого документа используются поиск по содержимому документа, однако и он имеет свои недостатки.

Дело в том, что поисковые машины стали уходить о прямого поиска "по словам" в сторону "поиска по смыслам". При этом, данные "смыслы" далеко не очевидны, а результаты поиска могут не только не включать часть документов содержащих ключевые слова, но и включать документы в которых нет ключевых слов заданных в поиске.

В результате, полнотекстовый поиск по всем документам Викпедии приводит к тому, что часть нужных документов не попадает в поисковую выдачу, а часть ненужных - попадает.

Решение

Для сглаживания остроты данных проблем был создан веб-сайт WikiSort.ru в котором Википедия будет рассортирована на тематические подсайты.

Например, если вы введёте в гугле поисковый запрос "site:ru.wikipedia.org углепластик автомобиль", то в поисковой выдаче окажутся не только страницы про использование углепластика в автомобильной промышленности, но и страница про "компьютерную игру Need_for_Speed:Carbon , телевизионный сериал "Видоизменённый углерод" и выбросы углекислого газа в атмосферу Земли.

Однако, если вы введёте в Гугл поисковый запрос "site:auto.wikisort.ru углепластик" , то указанные выше страницы не попадёт в реультаты поиска. (В настоящий момент сайт находится в процессе индексации, и результаты поиска будут неполными).

Другим примером правильного использования веб-сайта WikiSort.ru является запрос "site:fun-with-flags.wikisort.ru красный зелёный".

С помощью этого запроса вы сможете найти флаги содержащие конкретные цвета, даже в том случае, если эти флаги окажутся штандартом, вымпелом, знаменем или любым другим подобным символом. Данный поиск будет очень удобен для людей не разбирающихся в типах символов, не знающих значения слова вексиллология и никогда не слышавших про Шелдона Купера.

Ограничения

Как и у любого другого инструмента, веб-сайт WikiSort.ru имеет свои недостатки и ограничения.

Главным из них является то, что мнения и подходы к выделению страниц в тематические поддомены могут различаться.

Другой проблемой будет то, что документы вынесенные в один тематический поддомен не попадут в другой. Например, авиационные музеи будут в поддомене "Технические музеи", а не в "Cамолёты и вертолёты", а программы для программирования будут в поддомене "Программирование", а не в "Компьютерные программы".

Так-же, существует вопрос о том, насколько полно гугл проиндексирует страницы WikiSort.ru , но это уже не проблема, а, всего лишь, задача.

* * *

Вопросы, пожелания и претензии пишите сюда: Facebook / ВКонтакте

И помните, если Вы не нашли информации о событии, объекте, человеке или машине, то это не значит что их не существует.

Список тематических порталов

1



Текст в блоке "Читать" взят с сайта "Википедия" и доступен по лицензии Creative Commons Attribution-ShareAlike; в отдельных случаях могут действовать дополнительные условия.

Другой контент может иметь иную лицензию. Перед использованием материалов сайта WikiSort.ru внимательно изучите правила лицензирования конкретных элементов наполнения сайта.

2019-2024
WikiSort.ru - проект по пересортировке и дополнению контента Википедии