Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://elar.urfu.ru/handle/10995/79694
Полная запись метаданных
Поле DCЗначениеЯзык
dc.contributor.authorКолмогорова, А. В.ru
dc.contributor.authorКалинин, А. А.ru
dc.contributor.authorМаликова, А. В.ru
dc.contributor.authorKolmogorova, A. V.en
dc.contributor.authorKalinin, A. A.en
dc.contributor.authorMalikova, A. V.en
dc.date.accessioned2020-02-06T12:02:21Z-
dc.date.available2020-02-06T12:02:21Z-
dc.date.issued2019-
dc.identifier.citationКолмогорова А. В. Кто и о чем говорит в «радостных» и «грустных» текстах: в поисках дискриминантных черт текстов разных эмоциональных тональностей / А. В. Колмогорова, А. А. Калинин, А. В. Маликова // Известия Уральского федерального университета. Сер. 2, Гуманитарные науки. — 2019. — Т. 21, № 4 (193). — С. 219-234.ru
dc.identifier.issn2587-6929online
dc.identifier.issn2227-2283print
dc.identifier.urihttp://elar.urfu.ru/handle/10995/79694-
dc.descriptionПоступила в редакцию 13.05.2019. Принята к печати 01.12.2019.ru
dc.descriptionSubmitted on 13 May, 2019. Accepted on 01 December, 2019.en
dc.description.abstractСтатья посвящена рассмотрению специфики лексической сочетаемости и синтаксической комбинаторики глагольной лексемы говорить в русскоязычных интернет-текстах, принадлежащих различным эмоциональным классам. Целью публикации является обоснование валидности использования выявленных специфических характеристик сочетаемости и комбинаторики лексемы в качестве дискриминантных черт для автоматического определения 8 эмоциональных тональностей в интернет-текстах на русском языке. В качестве материала исследования выступает коллекция текстов, отобранных из паблика «Подслушано» в социальной сети «ВКонтакте». Используя восьмичастную классификацию эмоций, предложенную Г. Лёвхеймом, авторы соотносят каждый из текстов выборки объемом более 1 млн токенов с определенной эмоцией посредством опоры на соответствующие хештеги и эмоциональную разметку текстов, осуществленную 36 асессорами, носителями русского языка от 19 до 45 лет. Применение метода TF-IDF взвешивания, а также учет значений относительной частотности лексем в 8 сформированных эмоциональных подкорпусах текстов показали, что статус лексемы говорить неравноценен в разных подкорпусах: в 4 из них она имеет высокие относительную частотность и показатели статистической специфичности, а в оставшихся 4 подкорпусах — нет. С помощью использования инструментов корпусной лингвистики доказано, что значимыми для автоматической атрибуции текстов к тому или иному эмоциональному классу оказываются следующие особенности лексической сочетаемости и синтаксической комбинаторики глагола говорить: высокий процент субъектных синтаксических связей; частотность конкретных лексем (например, врач для класса СТРАХ / УЖАС) и суммарная частотность лексем одной конкретной лексико-семантической группы в позиции субъекта при глаголе; частотность отдельной коллокации (например, когда люди говорят для класса ЗЛОСТЬ / ГНЕВ); частотность отдельных синтаксем (например, «с собой / себе lemma [говорить]» — для класса ГРУСТЬ / ТОСКА); частотность конкурирующих синтаксем «lemma [говорить], что» и «lemma [говорить]: (прямая речь)», маркирующая склонность автора текста фокусироваться на содержании говоримого в форме прямой или косвенной речи. Будучи применены в качестве параметров, подаваемых на вход компьютерному классификатору текстов, данные дискриминантные черты оказали влияние на точность атрибуции текстов к тому или иному эмоциональному классу.ru
dc.description.abstractThis article focuses on the peculiarities of lexical and syntactical combinability of the Russian verb говорить (“to speak”) in Russian Internet texts of different emotion classes. The article aims to substantiate and validate the use of the established specific characteristics of the combinability of the lexeme as discriminant features serving to automatically detect eight emotional tonalities in Internet texts in Russian. The authors refer to a collection of texts found in the Подслушано (The Overhead) public page in the vk.com social network. Using the eight classes classification of emotions proposed by Lövheim, the researchers correlate each of the texts in their selection whose total volume is over a million tokens with a particular emotion by referring to the corresponding hashtags and the emotion mapping of the texts carried out by 36 assessors, Russian native speakers of 19–45 years old. The statistical analysis including term-frequency-inverse document frequency measure (TF-IDF) and analysis of lexeme frequency in eight sub-corpora proves that the Russian verb говорить does not have the same relevance in all sub-corpora, i.e. in four of them, it demonstrates a high relative frequency and a significant statistical specificity, but in the remaining four others it does not. Referring to the tools of corpus linguistics, the authors prove that to automatically attribute texts to a certain emotion class, it is essential to take into account the following peculiarities of lexical and syntactic combinability of the verb говорить: a high percentage of subjective syntactic connections, the frequency of particular lexemes (e.g. врач for the classes СТРАХ / УЖАС), and the total frequency of the lexemes belonging to one particular lexico-semantic group functioning as subject of the verbs; the frequency of separate collocations (e.g. когда люди говорят for the ЗЛОСТЬ / ГНЕВ class); the frequency of separate syntaxemes (e.g. “с собой / себе lemma [говорить]” for the ГРУСТЬ / ТОСКА class); the frequency of competing syntaxemes in the specific lexemes and collocations in the position of its subject, the frequency of the syntaxemes “lemma [говорить], что” и “lemma [говорить]: (direct speech)”, marking the author’s proneness to focus on the content of what is being said in the form of direct and reported speech. After having been applied as parameters to run the classifier, the discriminate features increased the accuracy of classification for some emotion classes of texts.en
dc.description.sponsorshipРабота выполнена при поддержке Российского фонда фундаментальных исследований (проект № 19-012-00205 «Разработка классификатора русскоязычных интернет-текстов по критерию их тональности на основе модели эмоций «Куб Лёвхейма»).ru
dc.description.sponsorshipThe research is supported by the Russian Foundation for Basic Research, project 19-012-00205 “Design of Sentiment Classifier for Internet Texts in Russian with Reference to Lövheim’s Cube of Emotion Model”.en
dc.format.mimetypeapplication/pdfen
dc.language.isoruen
dc.publisherУральский федеральный университетru
dc.relation.ispartofИзвестия Уральского федерального университета. Сер. 2, Гуманитарные науки. 2019. Т. 21. № 4 (193)ru
dc.rightsCreative Commons Attribution Licenseen
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/-
dc.subjectСЕНТИМЕНТ-АНАЛИЗru
dc.subjectЭМОЦИОНАЛЬНАЯ ТОНАЛЬНОСТЬru
dc.subjectИНТЕРНЕТ-ТЕКСТЫru
dc.subjectМАШИННОЕ ОБУЧЕНИЕru
dc.subjectЛЕКСИЧЕСКАЯ СОЧЕТАЕМОСТЬru
dc.subjectСИНТАКСИЧЕСКАЯ КОМБИНАТОРИКАru
dc.subjectДИСКРИМИНАНТНАЯ ЧЕРТА КЛАССА ТЕКСТОВru
dc.subjectSENTIMENT ANALYSISen
dc.subjectEMOTIONAL TONALITYen
dc.subjectINTERNET TEXTSen
dc.subjectMACHINE LEARNINGen
dc.subjectLEXICAL COMBINATORICSen
dc.subjectSYNTACTICAL COMBINATIONSen
dc.subjectTEXT CLASS FEATUREen
dc.titleКто и о чем говорит в «радостных» и «грустных» текстах: в поисках дискриминантных черт текстов разных эмоциональных тональностейru
dc.title.alternativeWho and about What Speaks in “Cheerful” and “Sad” Texts: In Search of Discrimination Features in Texts of Different Emotional Tonalitiesen
dc.typeArticleen
dc.typeinfo:eu-repo/semantics/articleen
dc.typeinfo:eu-repo/semantics/publishedVersionen
dc.identifier.rsihttps://www.elibrary.ru/item.asp?id=42480772-
dc.identifier.doi10.15826/izv2.2019.21.4.078-
local.description.firstpage219-
local.description.lastpage234-
local.issue4 (193)-
local.volume21-
dc.identifier.wosWOS:000512292500015-
Располагается в коллекциях:Известия Уральского федерального университета. Серия 2. Гуманитарные науки

Файлы этого ресурса:
Файл Описание РазмерФормат 
iurg-2019-193-15.pdf347,9 kBAdobe PDFПросмотреть/Открыть


Лицензия на ресурс: Лицензия Creative Commons Creative Commons