رزومه من
تجربیات شغلی
مدرس زبان
اکنونآموزش دوره های زبان و توسعه محتواهای آموزشی
مترجم و محقق آزاد
اکنونترجمه و تحقیق در حوزه زبانشناسی و پردازش زبان طبیعی
مدرس زبان
آموزش دوره های زبان و توسعه محتواهای آموزشی
فرهنگنویس
مشارکت در تدوین فرهنگ جامع زبان فارسی.
کپیرایتر
تولید محتوای تبلیغاتی.
تحصیلات
دکترای زبانشناسی
دکترارساله
مواجهه با گونه طبیعی فارسی: پیکرهسازی، حاشیهنویسی، کدگذاری، و پردازش گونه نوشتاری دیجیتال فارسی
تحول ارتباطات از عصر پسانوشتاری به عصر ارتباط-از-راه-دور گونه نوشتاری دیجیتال را پدید آورده که بخش اعظمی از ارتباطات روزمره را به خود اختصاص داده است. این گونه، برخلاف گونه نوشتاری که دستور تجویزی نقش کانونی در آن ایفا میکرد، فاقد مرکزیت است. این ویژگی، گونه نوشتاری دیجیتال را به گونهای سرکش در پژوهشهای زبانی تبدیل کرده که رویکردهای پیشین را به چالش میکشد. در این رساله ما رویکردی متفاوت را در مواجهه با این گونه زبانی پیشنهاد کردیم و این رویکرد را در بازخوانی، بازنگری، و ارائه راهکارهایی در پیکرهسازی، پیشپردازش، کدگذاری، و تگزنی پیکرهای از این گونه زبانی به کار گرفتیم. هدف ما سادهسازی تکالیف پردازشی پایه، در عین حفظ تنوعات زبانی و نگارشی پیکره بود. این رویکرد با حفظ تنوعات در مرحله پیشپردازش، تکلیف تمایز هویت واژگان را بین فرایندهای پردازشی دیگر توزیع میکند. در این مسیر، ابتدا پیکرهای با عنوان «۱۴۰۰» از یک-میلیون توییت تصادفی از توییتهای سال ۱۴۰۰ را استخراج کردیم. سپس یک-میلیون توکن از این پیکره را، به عنوان یک ریزپیکره و با هدف پیشپردازش، تگزنی، و لمایابی جدا کردیم. در نرمالسازی و توکنیابی از دو راهکار حذف عناصری که تنوعات قراردادی تولید میکنند (م: نیمفاصله)، و تقطیع عناصری که اجزاءشان دارای هویت دستوریاند (م: ترکیبات منقطع)، برای سادهسازی این دو فرایند بهره بردیم. برای تگزنی پیکره چارچوبی جدید و منعطف، با عنوان تگفریم، برای کدگذاری تگها ارائه کردیم که علاوه بر امکان بازنمایی اطلاعات زبانی و پیرازبانی، قادر به بازنمایی ساختار درونی واژگان است. از این چارچوب برای ارائه یک تگفریم استاندارد برای فارسی استفاده کردیم که شامل بازنگری در برخی از مفاهیم دستوری (م: ضمیر، مصدر، قید)، و افزودن مقولات و لایههایی میشد که هویت زبانی، ساختار واژگانی (م: واژهبستها)، و ویژگیهای پیرازبانی (م: واژههای تابو) توکنها را بازنمایی میکند. در لمایابی هم از اعرابگذاری برای متمایز کردن هویت همنویسهها استفاده شد. در تگزنی پیکره از ۲۵ مقوله زبانی با ۸۲ ویژگی زبانی، و در سه لایه زبانی، درون-واژگانی، و پیرازبانی، بهره بردیم. تحلیل آماری و مقایسه پیکره با پیکرههای دیگر، بسامد بالای توکنهای تکبسامدی و افعال را نشان میدهد که ویژگی اول تنوعات پیکره، و ویژگی دوم اشتراکات سیاق پیکره با سیاق محاورهای را بازنمایی میکند. تدوین این پیکره و راهکارهایی که در این پژوهش ارائه شد، بستری را فراهم میکند که تدوین و پردازش پیکرههای مشابه را تسهیل کرده و زمینه مطالعات زبانشناختی و غیرزبانشناختی بر روی این گونه و گونههای مشابه زبانی را فراهم میکند.
کارشناسی ارشد زبانشناسی
کارشناسی ارشدرساله
تصریف زمان دستوری افعال زبان فارسی و شیوه پردازش آن: رویکردی زبان-روانشناختی
در این پژوهش وضعیت صورتهای پیچیده تصریفی را در ذهن سخنگویان زبان فارسی، با تمرکز بر روی تصریف زمان دستوری افعال ساده زبان فارسی، در بینشانترین حالت آن (: حال اخباری و گذشته ساده)، مورد بررسی قراردادیم. دستیابی به چنین هدفی مستلزم بازنگری در برخی از مفاهیم در این حوزه بود. به همین منظور سه پرسش مطرحکردیم که دو پرسش نخست، ناظر بر چنین بازنگریای بود و پرسش سوم به شیوه پردازش واحدهای پیچیده صرفیِ حاصل از تصریف زمان دستوری اختصاصداشت: 1. چه تقسیمبندیای را براساس مفهوم رگولاریتی میتوان از افعال زبان فارسی ارائهکرد؟ 2. چه مدلی را میتوان از فرایند تصریف زمان دستوری در افعال زبان فارسی ارائهکرد که بازنمایی مناسبی از عملکرد ذهنی این فرایند باشد؟ 3. تمایز میان افعال رگولار و غیررگولار ریشه در کدام مکانیسمهای ذهنی دارد؟ برای دستیابی به دادههایی که بتوان با استناد به آنها این سه پرسش را مورد سنجش قرارداد، دو آزمایش تجربی طراحیکردیم که در آن خطاهای کاربران زبان در تصریف زمان دستوری در مواجهه با افعال واقعی و ناواژهها جمعآوریمیشد. نتایج بهدستآمده نشانداد که براساس مفهوم رگولاریتی افعال زبان فارسی را میتوان به سه دسته افعال رگولار، غیررگولار، و آلترناتیو تقسیمکرد: افعال آلترناتیو طبقه بازی از افعال هستند که پایه آنها از بیش از دو هجا تشکیلشده، به توالی واجی -ɑn ختممیشود، در فهرست افعال غیررگولار حضورندارند و میتوانند با دو وند -d و -id به گذشته صرفشوند؛ افعال غیررگولار فهرستی از افعال را تشکیلمیدهند که هیچ رابطه نظاممندی میان ریشه و بنِ گذشته آنها وجودندارد؛ و افعال رگولار شامل تمام افعال بالفعل و بالقوه زبان فارسی میشود که در دو دسته پیشین جای نداشته و از الگوی «ریشه + -id» در تصریف گذشته خود بهرهمیبرند. نتایج بهدستآمده در رابطه با پرسش دوم نشانمیداد که صورت حال افعال رگولار و غیررگولار، و همینطور صورت گذشته اکثر افعال رگولار از ریشه مشتقمیشوند؛ درمقابل صورت گذشته افعال غیررگولار و افعالِ رگولارِ بسیار پربسامد، با بازیابی بنِ گذشته این افعال از حافظه و سپس افزودن شناسه تولیدمیشوند. نتایج بهدستآمده در رابطه با پرسش سوم، که به سنجش ادعای نظریه مکانیسم دوگانه اختصاص داشت، در تائید آرای این نظریه، نشانمیداد که افعال رگولار با مکانیسم قاعده و افعال غیررگولار با مکانیسم حافظه تولیدمیشوند.
کارشناسی زبانشناسی
کارشناسیآثار
مقالات پژوهشی
مدخلهای دانشنامهای
دانشنامه زبان و ادب فارسی (جلد ۶)
لغتنامهها
فرهنگ جامع زبان فارسی (جلد دوم)
پروژهها
آزمایشگاه پیکره (CorpusLab)
فعالآزمایشگاه پیکره (CorpusLab) پروژهای است با هدف ارائه پیکرههای فارسی و ابزارهای تحلیل پیکره برای مطالعات زبانشناختی و غیرزبانشناختی
به زودی ...
۱۴۰۰
پیکره ۱۴۰۰ پروژهای است که در آن پیکرهای حاوی یک میلیون توییت از توییتهای سال ۱۴۰۰ را تهیه میکنیم. بخشی از این پیکره به صورت دستی نرمالسازی، تگزنی، و لمایابی خواهد شد.
مطالعه زبان-روانشناختی تصریف افعال
در این پروژه چگونگی تولید و درک افعال منظم و نامنظم و مکانیسمهای روانشناختی دخیل در پردازش آنها، و چگونگی سازماندهی آنها در مغز را بررسی میکنیم. تمرکز ما در این پروژه بر روی تصریف گذشته افعال است.
سی پی وی آی (تصریفگر جامع افعال فارسی)
سی پی وی آی (Comprehensive Persian Verb Inflector) یک نرمافزار تصریف افعال فارسی است که در تصریف افعال از نظریه مکانیسم دوگانه (نظریه واژگان و قواعد) بهره میگیرد.
واجآرایی، واجآماری، و هجابندی واژگان فارسی
در این پروژه واجآرایی، واجآماری، و هجابندی ۵۵۰۰۰ واژه فارسی را مطالعه میکنیم.
فلکسیکون ارتقایافته
فلکسیکون ارتقایافته نسخه تصحیحشده و ارتقایافته از پیکره فلکسیکون است. واجنگاری آیپیای، هجابندی، افزودن چاکنای آغازین به واژههای آغازشده با مصوت، و اصلاح خطاهای تایپی/نگارشی ازجمله فرایندهایی است که در این نسخه اعمال شده است.
گواهیها
برای دیدن فهرست کامل بر روی هر موضوع کلیک کنید