Skip to content

chetvertakov/SearchServer

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 
 
 

Repository files navigation

SearchServer

Обеспечивает поиск документов по ключевым словам и ранжирование результатов по статистической мере TF-IDF. Поддерживает функциональность минус-слов и стоп-слов. Создание и обработка очереди запросов. Возможность работы в многопоточном режиме.

Работа с классом поискового сервера

Создание экземпляра класса SearchServer. В конструктор передаётся строка с стоп-словами, разделенными пробелами. Вместо строки можно передавать произвольный контейнер (с последовательным доступом к элементам с возможностью использования в for-range цикле)

С помощью метода AddDocument добавляются документы для поиска. В метод передаётся id документа, статус, рейтинг, и сам документ в формате строки.

Метод FindTopDocuments возвращает вектор документов, согласно соответствию переданным ключевым словам. Результаты отсортированы по статистической мере TF-IDF. Возможна дополнительная фильтрация документов по id, статусу и рейтингу. Метод реализован как в однопоточной так и в многпоточной версии.

vector<string> stop_words{"и"s, "но"s, "или"s};
// создаём экземпляр поискового сервера со списком стоп слов
SearchServer server(stop_words);
// добавляем документы в сервер
server.AddDocument(0, "белый кот и пушистый хвост"sv);
server.AddDocument(1, "черный пёс но желтый хвост"sv);
server.AddDocument(3, "черный жираф или белый дракон"sv);
cout << "Кол-во документов : "sv << server.GetDocumentCount() << endl;

// ищем документы с ключевыми словами
auto result = server.FindTopDocuments("черный дракон"sv);
cout << "Документы с ключевыми словами \"черный дракон\" : "sv << endl;
for (auto &doc : result) {
    cout << doc << endl;
}

// добавляем копию другого документа
server.AddDocument(4, "черный жираф или белый дракон"sv);
result = server.FindTopDocuments("черный дракон"sv);
cout << "Документы с ключевыми словами \"черный дракон\" : "sv << endl;
for (auto &doc : result) {
    cout << doc << endl;
}
// проверяем сервер на копии и удаляем их
RemoveDuplicates(server);
result = server.FindTopDocuments("черный дракон"sv);
cout << "Документы с ключевыми словами \"черный дракон\" после удаления копий : "sv << endl;
for (auto &doc : result) {
    cout << doc << endl;
}

Класс RequestQueue реализует хранение истории запросов к поисковому серверу. При этом общее кол-во хранимых запросов не превышает заданного значения. При добавлении новых запросов - они замещают самые старые запросы в очереди.

SearchServer search_server("and in at"s);
RequestQueue request_queue(search_server);

search_server.AddDocument(1, "curly cat curly tail"s, DocumentStatus::ACTUAL, {7, 2, 7});
search_server.AddDocument(2, "curly dog and fancy collar"s, DocumentStatus::ACTUAL, {1, 2, 3});
search_server.AddDocument(3, "big cat fancy collar "s, DocumentStatus::ACTUAL, {1, 2, 8});
search_server.AddDocument(4, "big dog sparrow Eugene"s, DocumentStatus::ACTUAL, {1, 3, 2});
search_server.AddDocument(5, "big dog sparrow Vasiliy"s, DocumentStatus::ACTUAL, {1, 1, 1});

// 1439 запросов с нулевым результатом
for (int i = 0; i < 1439; ++i) {
    request_queue.AddFindRequest("empty request"s);
}
// все еще 1439 запросов с нулевым результатом
request_queue.AddFindRequest("curly dog"s);
// новые сутки, первый запрос удален, 1438 запросов с нулевым результатом
request_queue.AddFindRequest("big collar"s);
// первый запрос удален, 1437 запросов с нулевым результатом
request_queue.AddFindRequest("sparrow"s);
cout << "Total empty requests: "s << request_queue.GetNoResultRequests() << endl;

Класс Paginator обеспечивает выдачу документов постранично.

vector<string> stop_words{"и"s, "но"s, "или"s};
// создаём экземпляр поискового сервера со списком стоп слов
SearchServer server(stop_words);
// добавляем документы в сервер
server.AddDocument(0, "первый документ"sv);
server.AddDocument(1, "второй документ"sv);
server.AddDocument(2, "третий документ"sv);
server.AddDocument(3, "четвертый документ"sv);
server.AddDocument(4, "пятый документ"sv);
        
const auto search_results = server.FindTopDocuments("документ");

// разбиваем результат поиска на страницы
size_t page_size = 2;
const auto pages = Paginate(search_results, page_size);
for (auto page : pages) {
    cout << page << endl;
    cout << "Page break"s << endl;
}

Методы ProcessQueries и ProcessQueriesJoined обеспечивают параллельное исполнение нескольких запросов к поисковой системе.

SearchServer search_server("and with"s);

int id = 0;
for (const string& text : {
        "funny pet and nasty rat"s,
        "funny pet with curly hair"s,
        "funny pet and not very nasty rat"s,
        "pet with rat and rat and rat"s,
        "nasty rat with curly hair"s,}) {
            search_server.AddDocument(++id, text, DocumentStatus::ACTUAL, {1, 2});
        }

const vector<string> queries = {
    "nasty rat -not"s,
    "not very funny nasty pet"s,
    "curly hair"s
};

id = 0;
for (const auto& documents : ProcessQueries(search_server, queries)) {
    cout << documents.size() << " documents for query ["s << queries[static_cast<size_t>(id++)] << "]"s << endl;
}

cout << endl << endl;
for (const Document& document : ProcessQueriesJoined(search_server, queries)) {
    cout << "Document "s << document.id << " matched with relevance "s << document.relevance << endl;
}

Сборка с помощью CMake

  1. Создайте папку для сборки программы
  2. Откройте консоль в данной папке и введите в консоли : cmake <путь к файлу CMakeLists.txt>
  3. Чтобы отключить сборку тестов добавьте к предыдущей команде ключ : -DTESTING = OFF
  4. Введите команду : cmake --build .
  5. После сборки в папке сборки появится папка Release с исполняемым файлом SearchServer.exe и, возможно, другими исполняемыми файлами, в зависимости от опции сборки тестов.
  6. Для запуска тестов введите в консоли : ctest После этого результаты работы тестов отобразятся в консоли.

Системные требования

Компилятор С++ с поддержкой стандарта C++17 или новее.
Для сборки многопоточных версий методов необходим Intel TBB.

About

Поисковый сервер. Индексирует и реализует поиск документов по ключевым словам.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published