ارائه الگوریتمی جهت فازی کردن وردنت و کاربرد آن در تحلیل احساسات

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشگاه علم و صنعت

2 دانشگاه علم و صنعت تهران

3 دانشگاه علم و صنعت ایران

4 دانشگاه فردوسی مشهد

5 دانشگاه کالیاری

6 دانشگاه بولونیا

چکیده

پایگاه‌های داده واژگانی شبه وردنت (WLD) کلمات انگلیسی را در مجموعه‌ای از مترادف‌ها به نام هم‌نشیم گروه‌بندی می‌کنند. اگرچه WLDهای استاندارد در بسیاری از برنامه‌های کاربردی موفق متن‌کاوی مورداستفاده قرار می‌گیرند، اما این محدودیت را دارند که حس کلمه به‌عنوان نمایش‌دهنده معنای مرتبط با هم‌نشیمهای متناظر آنها به یک‌میزان در نظر گرفته می‌شود که به‌طورکلی درست نیست. به‌منظور غلبه بر این محدودیت، چندین نسخه فازی از هم‌نشیم ارائه شده است. یکی از ویژگی‌های مشترک این مطالعات این است که هدف آن‌ها تولید نسخه‌های فازی شده از WLDهای موجود نیست، بلکه ساخت WLDهای جدید را از ابتدا انجام می‌دهند. در این مطالعه، ما الگوریتمی را برای ساخت نسخه‌های فازی WLD از هر زبان، باتوجه‌به مجموعه‌ای از اسناد و یک سیستم ابهام‌زدایی حس کلمه (WSD) برای آن زبان ارائه می‌کنیم. سپس، با استفاده از پیکره OANC و UKB WSD به‌عنوان ورودی‌های الگوریتم، نسخه فازی شده WordNet انگلیسی را ساخته و به‌صورت آنلاین منتشر می‌کنیم. ما همچنین یک اثبات عملی برای اعتبار نتایج آن پیشنهاد می‌کنیم.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

An Algorithm for Fuzzification of WordNets and its Application in Sentiment Analysis

نویسندگان [English]

  • Yousef Alizadeh-Q 1
  • ‌‌Behrouz Minaei Bidgoli 2
  • Sayyed Ali Hossayni 3
  • Mohammad-R Akbarzadeh-T 4
  • Diego Reforgiato Recupero 5
  • Aldo Gangemi 6
1 Iran University of Science and Technology
2 Iran University of Science and Technology
3 Iran University of Science and Technology
4 Ferdowsi University of Mashhad
5 University of Cagliari
6 University of Bologna
چکیده [English]

WordNet-like Lexical Databases (WLDs) group English words into sets of synonyms called “synsets.” Synsets are utilized for several applications in the field of text mining. However, they were also open to criticism because although, in theory, not all the members (i.e. word senses) of a synset represent the meaning of that synset with the same degree, in practice, in WLDs they are considered as members of the synset identically. Correspondingly, the fuzzy version of synonym sets, called fuzzy-synsets were proposed. But, to the best or our knowledge. In this study, we present an algorithm for constructing fuzzy version of WLDs of any language, given a corpus of documents and a word-sense-disambiguation system of that language. A theoretical proof is also proposed for the validity of results of the proposed algorithm. Then, inputting the open-American-online-corpus (OANC) and UKB word-sense-disambiguation to the algorithm, we construct and publish online the fuzzified version English WordNet (FWN), and apply them in a Sentiment Analysis problem.

کلیدواژه‌ها [English]

  • Fuzzy WordNet
  • Possibility Theory
  • Sentiment Analysis
  • Uncertainty Handling
CAPTCHA Image