Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
http://elar.urfu.ru/handle/10995/117275
Полная запись метаданных
Поле DC | Значение | Язык |
---|---|---|
dc.contributor.author | Пепелышев, Д. И. | ru |
dc.date.accessioned | 2022-10-07T07:33:26Z | - |
dc.date.available | 2022-10-07T07:33:26Z | - |
dc.date.issued | 2022 | - |
dc.identifier.citation | Пепелышев Д. И. ПОИСК КЛЮЧЕВЫХ СЛОВ В НОВОСТЯХ НА ОСНОВЕ АЛГОРИТМА TF-IDF НА ПРИМЕРЕ NTAGIL.ORG / Д. И. Пепелышев. — Текст : электронный // Молодежь и наука : материалы международной научно-практической конференции старшеклассников, студентов и аспирантов (27 мая 2022 г.) : в 2 томах. — Нижний Тагил : НТИ (филиал) УрФУ, 2022. — Том 2. — С. 144-146. | ru |
dc.identifier.isbn | 978-5-9544-0131-8 | |
dc.identifier.isbn | 978-5-9544-0133-2 (т. 2) | |
dc.identifier.uri | http://elar.urfu.ru/handle/10995/117275 | - |
dc.description.abstract | Данная статья посвящена применению алгоритма TF-IDF, предназначенного для расчета важности слова в определенном документе, для поиска ключевых слов в новостях на сайте ntagil.org. Работа посвящена решению выявленной проблемы, а именно: отсутствию ключевых слов в тексте новостей на сайте города Нижний Тагил. Наличие данной проблемы усложняет поиск и чтение новостей на сайте, т. к. невозможно определить главную мысль статьи, не прочитав ее полностью. Для выполнения проекта был подробно изучен принцип работы представленного алгоритма, а также проведены тестовые исследования отдельно взятых статей на поиск ключевых слов. В результате работы алгоритма для каждой статьи был получен список ключевых слов, отражающих главную мысль каждой отдельно взятой новостной статьи, а также метрика tf.idf, отражающая инверсию частоты, с которой некоторое слово встречается в документе рассматриваемых новостей. Автоматический поиск ключевых слов в новостях значительно сократит время поиска данных слов, позволит гораздо быстрее определить тему и выделить главные мысли в каждой отдельной новости и обеспечит корректное индексирование новостей в поисковых системах. | ru |
dc.format.mimetype | application/pdf | en |
dc.language.iso | ru | en |
dc.publisher | Нижнетагильский технологический институт (филиал) Уральского федерального университета | ru |
dc.relation.ispartof | Молодежь и наука. — Том 2. — Нижний Тагил, 2022 | ru |
dc.rights | info:eu-repo/semantics/restrictedAccess | en |
dc.subject | НОВОСТЬ | ru |
dc.subject | ОБРАБОТКА ЕСТЕСТВЕННОГО ЯЗЫКА | ru |
dc.subject | КЛЮЧЕВЫЕ СЛОВА | ru |
dc.subject | МАШИННАЯ ОБРАБОТКА | ru |
dc.subject | TF-IDF | en |
dc.title | ПОИСК КЛЮЧЕВЫХ СЛОВ В НОВОСТЯХ НА ОСНОВЕ АЛГОРИТМА TF-IDF НА ПРИМЕРЕ NTAGIL.ORG | ru |
dc.type | Article | en |
dc.type | info:eu-repo/semantics/article | en |
dc.type | info:eu-repo/semantics/publishedVersion | en |
dc.conference.name | Международная научно-практическая конференция старшеклассников, студентов и аспирантов «Молодежь и наука» | ru |
dc.conference.date | 27.05.2022 | - |
local.description.firstpage | 144 | |
local.description.lastpage | 146 | |
Располагается в коллекциях: | Конференции, семинары |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
978-5-9544-0133-2_2022_042.pdf | 196,12 kB | Adobe PDF | Просмотреть/Открыть |
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.