Skip to content

polisgo2020/Akhmedov_Abdulla

Folders and files

NameName
Last commit message
Last commit date

Latest commit

abf03ac · Apr 11, 2020

History

50 Commits
Apr 10, 2020
Apr 10, 2020
Apr 10, 2020
Apr 6, 2020
Apr 5, 2020
Apr 6, 2020
Apr 6, 2020
Mar 8, 2020
Mar 23, 2020

Repository files navigation

Akhmedov Abdulla GoLang homeworks

Примеры запуска из директории build

  • go run build.go ../inputFiles
  • go run build.go -sw=../stopWords.txt ../inputFiles
  • go run build.go -s ../inputFiles/t0.txt
  • go run build.go -s -sw=../stopWords.txt ../inputFiles/t0.txt

Алгоритм поиска фразы

На этапе формирования обратного индекса берется основа слова, исключаются шумовые слова, запоминается позиция каждого слова в файле.

Из пришедшей поисковой фразы убираются шумовые слова, от каждого слова берется основа. Далее, если из поисковой фразы осталось только одно слово, то тот файл лучше, в котором это слово встречается чаще. Иначе с помощью поиска в глубину ищем кратчайщий путь между словами из поисковой фразы (причем неважно в какой последовательности они стоят в файле) и делим эту величину на количество слов, принимавших участие в этом пути. Таким образом, наилучшим файлом будет тот, у которого это отношение меньше, то есть слова находятся кучнее.

Примеры запуска из директории search

  • go run search.go ../stopWords.txt ../hm1/outputJSON.txt aspect association
  • go run search.go ../stopWords.txt ../hm1/outputJSON.txt Gaidai
  • go run search.go ../stopWords.txt ../hm1/outputJSON.txt Gaidai generation

Alt text

About

search-Eretic431 created by GitHub Classroom

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages