Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://elar.urfu.ru/handle/10995/117275
Полная запись метаданных
Поле DCЗначениеЯзык
dc.contributor.authorПепелышев, Д. И.ru
dc.date.accessioned2022-10-07T07:33:26Z-
dc.date.available2022-10-07T07:33:26Z-
dc.date.issued2022-
dc.identifier.citationПепелышев Д. И. ПОИСК КЛЮЧЕВЫХ СЛОВ В НОВОСТЯХ НА ОСНОВЕ АЛГОРИТМА TF-IDF НА ПРИМЕРЕ NTAGIL.ORG / Д. И. Пепелышев. — Текст : электронный // Молодежь и наука : материалы международной научно-практической конференции старшеклассников, студентов и аспирантов (27 мая 2022 г.) : в 2 томах. — Нижний Тагил : НТИ (филиал) УрФУ, 2022. — Том 2. — С. 144-146.ru
dc.identifier.isbn978-5-9544-0131-8
dc.identifier.isbn978-5-9544-0133-2 (т. 2)
dc.identifier.urihttp://elar.urfu.ru/handle/10995/117275-
dc.description.abstractДанная статья посвящена применению алгоритма TF-IDF, предназначенного для расчета важности слова в определенном документе, для поиска ключевых слов в новостях на сайте ntagil.org. Работа посвящена решению выявленной проблемы, а именно: отсутствию ключевых слов в тексте новостей на сайте города Нижний Тагил. Наличие данной проблемы усложняет поиск и чтение новостей на сайте, т. к. невозможно определить главную мысль статьи, не прочитав ее полностью. Для выполнения проекта был подробно изучен принцип работы представленного алгоритма, а также проведены тестовые исследования отдельно взятых статей на поиск ключевых слов. В результате работы алгоритма для каждой статьи был получен список ключевых слов, отражающих главную мысль каждой отдельно взятой новостной статьи, а также метрика tf.idf, отражающая инверсию частоты, с которой некоторое слово встречается в документе рассматриваемых новостей. Автоматический поиск ключевых слов в новостях значительно сократит время поиска данных слов, позволит гораздо быстрее определить тему и выделить главные мысли в каждой отдельной новости и обеспечит корректное индексирование новостей в поисковых системах.ru
dc.format.mimetypeapplication/pdfen
dc.language.isoruen
dc.publisherНижнетагильский технологический институт (филиал) Уральского федерального университетаru
dc.relation.ispartofМолодежь и наука. — Том 2. — Нижний Тагил, 2022ru
dc.rightsinfo:eu-repo/semantics/restrictedAccessen
dc.subjectНОВОСТЬru
dc.subjectОБРАБОТКА ЕСТЕСТВЕННОГО ЯЗЫКАru
dc.subjectКЛЮЧЕВЫЕ СЛОВАru
dc.subjectМАШИННАЯ ОБРАБОТКАru
dc.subjectTF-IDFen
dc.titleПОИСК КЛЮЧЕВЫХ СЛОВ В НОВОСТЯХ НА ОСНОВЕ АЛГОРИТМА TF-IDF НА ПРИМЕРЕ NTAGIL.ORGru
dc.typeArticleen
dc.typeinfo:eu-repo/semantics/articleen
dc.typeinfo:eu-repo/semantics/publishedVersionen
dc.conference.nameМеждународная научно-практическая конференция старшеклассников, студентов и аспирантов «Молодежь и наука»ru
dc.conference.date27.05.2022-
local.description.firstpage144
local.description.lastpage146
Располагается в коллекциях:Конференции, семинары

Файлы этого ресурса:
Файл Описание РазмерФормат 
978-5-9544-0133-2_2022_042.pdf196,12 kBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.