تعداد نشریات | 23 |
تعداد شمارهها | 396 |
تعداد مقالات | 3,128 |
تعداد مشاهده مقاله | 2,855,352 |
تعداد دریافت فایل اصل مقاله | 1,997,259 |
تشخیص خودکار جنسیت نویسنده متن با استفاده از مدل پارسبرت و ویژگیهای زبانی | ||
مطالعات زبانها و گویشهای غرب ایران | ||
مقالات آماده انتشار، پذیرفته شده، انتشار آنلاین از تاریخ 13 مرداد 1404 | ||
نوع مقاله: مقاله پژوهشی | ||
شناسه دیجیتال (DOI): 10.22126/jlw.2025.11743.1814 | ||
نویسندگان | ||
سیده ساره صادقی* 1؛ محمد بحرانی2 | ||
1دکترا، گروه زبانشناسی همگانی، دانشکده ادبیات و علوم انسانی، دانشگاه بوعلیسینا، همدان، ایران | ||
2گروه رایانه، دانشکده آمار، ریاضی و رایانه، دانشگاه علامه طباطبایی، تهران، ایران. | ||
چکیده | ||
جملاتی که افراد به هنگام نوشتار استفاده میکنند اطلاعات ارزشمندی را دارد که میتواند برای شناسایی جنسیت نویسنده بهکاربرده شود. در این میان استفاده از الگوریتمهای یادگیری عمیق در پردازش متون زبان طبیعی به شناسایی الگوهای مخفی موجود در دادهها کمک میکنند. در این پژوهش سعی شده است تا با استفاده از تنظیم دقیق پارامترهای مدل پارسبرت سامانهای برای زبان فارسی طراحی گردد که به شناسایی جنسیت نویسنده متن بپردازد. بدین منظور با انتخاب ویژگیهای زبانی در مورد تفاوت جنسیت افراد در متن، ابتدا یک پیکرۀ برچسب خورده با برچسبهای جنسیتی به تعداد 5000 سند تهیهشد. سپس سامانهای بر اساس ویژگیهای زبانی و تعبیهسازی بردار طراحی گردید. در ادامه نیز سامانه طراحی شده مورد ارزیابی اعتبارسنجی متقابل 10-تایی قرارگرفت . نتایج بهدستآمده نشان میدهد که معیار-اف در سامانه طراحیشده، معادل با 5/76 درصد است . این روش همچنین در مقایسه با روشهای دستهبندهای متداول یادگیری ماشین و همچنین در مقایسه با مدل LSTM نتایج بهتری را نشان میدهد. نتایج بهدستآمده از مقایسه عملکرد سامانه بر روی پیکره تهیهشده و پیکرههای موجود پیشین نشان از بهبود عملکرد سامانه دارد. بدین ترتیب استفاده از روشهای نوین همچون مدل پارسبرت و استفاده از دادگان مناسب، از دستاوردهای مهم این پژوهش است. | ||
کلیدواژهها | ||
شناسایی خودکار جنسیت؛ پیکره برچسبخورده جنسیتی؛ مدل پارسبرت؛ یادگیری عمیق؛ تفاوت گفتار جنسیت | ||
آمار تعداد مشاهده مقاله: 0 |