منو

رزومه من

تجربیات شغلی

مدرس زبان

اکنون
۱۴۰۴ - امروز

آموزش دوره های زبان و توسعه محتواهای آموزشی

آموزش محتوای آموزشی

مترجم و محقق آزاد

اکنون
۱۳۹۴ - امروز

ترجمه و تحقیق در حوزه زبانشناسی و پردازش زبان طبیعی

ترجمه تحقیق زبانشناسی

مدرس زبان

شهریور ۱۴۰۴ - آبان ۱۴۰۴

آموزش دوره های زبان و توسعه محتواهای آموزشی

آموزش محتوای آموزشی

فرهنگ‌نویس

۱۳۹۲ - ۱۳۹۴

مشارکت در تدوین فرهنگ جامع زبان فارسی.

فرهنگ نویس لغتنامه

کپی‌رایتر

۱۳۸۵ - ۱۳۸۸

تولید محتوای تبلیغاتی.

نویسندگی تولید محتوا

تحصیلات

دکترای زبانشناسی

دکترا
دانشگاه تربیت مدرس
شهریور ۱۳۹۸ - اردیبهشت ۱۴۰۴
رساله

مواجهه با گونه طبیعی فارسی: پیکره‌سازی، حاشیه‌نویسی، کدگذاری، و پردازش گونه نوشتاری دیجیتال فارسی

تحول ارتباطات از عصر پسانوشتاری به عصر ارتباط-از-راه-دور گونه نوشتاری دیجیتال را پدید آورده که بخش اعظمی از ارتباطات روزمره را به خود اختصاص داده است. این گونه، برخلاف گونه نوشتاری که دستور تجویزی نقش کانونی در آن ایفا می‌کرد، فاقد مرکزیت است. این ویژگی، گونه نوشتاری دیجیتال را به گونه‌ای سرکش در پژوهش‌های زبانی تبدیل کرده که رویکردهای پیشین را به چالش می‌کشد. در این رساله ما رویکردی متفاوت را در مواجهه با این گونه زبانی پیشنهاد کردیم و این رویکرد را در بازخوانی، بازنگری، و ارائه راهکارهایی در پیکره‌سازی، پیش‌پردازش، کدگذاری، و تگزنی پیکره‌ای از این گونه زبانی به کار گرفتیم. هدف ما ساده‌سازی تکالیف پردازشی پایه، در عین حفظ تنوعات زبانی و نگارشی پیکره بود. این رویکرد با حفظ تنوعات در مرحله پیش‌پردازش، تکلیف تمایز هویت واژگان را بین فرایندهای پردازشی دیگر توزیع می‌کند. در این مسیر، ابتدا پیکره‌ای با عنوان «۱۴۰۰» از یک-میلیون توییت تصادفی از توییت‌های سال ۱۴۰۰ را استخراج کردیم. سپس یک-میلیون توکن از این پیکره را، به عنوان یک ریزپیکره و با هدف پیش‌پردازش، تگزنی، و لمایابی جدا کردیم. در نرمال‌سازی و توکن‌یابی از دو راهکار حذف عناصری که تنوعات قراردادی تولید می‌کنند (م: نیم‌فاصله)، و تقطیع عناصری که اجزاءشان دارای هویت دستوری‌اند (م: ترکیبات منقطع)، برای ساده‌سازی این دو فرایند بهره بردیم. برای تگزنی پیکره چارچوبی جدید و منعطف، با عنوان تگفریم، برای کدگذاری تگ‌ها ارائه کردیم که علاوه بر امکان بازنمایی اطلاعات زبانی و پیرازبانی، قادر به بازنمایی ساختار درونی واژگان است. از این چارچوب برای ارائه یک تگفریم استاندارد برای فارسی استفاده کردیم که شامل بازنگری در برخی از مفاهیم دستوری (م: ضمیر، مصدر، قید)، و افزودن مقولات و لایه‌هایی می‌شد که هویت زبانی، ساختار واژگانی (م: واژه‌بست‌ها)، و ویژگی‌های پیرازبانی (م: واژه‌های تابو) توکن‌ها را بازنمایی می‌کند. در لمایابی هم از اعراب‌گذاری برای متمایز کردن هویت هم‌نویسه‌ها استفاده شد. در تگزنی پیکره از ۲۵ مقوله زبانی با ۸۲ ویژگی زبانی، و در سه لایه زبانی، درون-واژگانی، و پیرازبانی، بهره بردیم. تحلیل آماری و مقایسه پیکره با پیکره‌های دیگر، بسامد بالای توکن‌های تک‌بسامدی و افعال را نشان می‌دهد که ویژگی اول تنوعات پیکره، و ویژگی دوم اشتراکات سیاق پیکره با سیاق محاوره‌ای را بازنمایی می‌کند. تدوین این پیکره و راهکارهایی که در این پژوهش ارائه شد، بستری را فراهم می‌کند که تدوین و پردازش پیکره‌های مشابه را تسهیل کرده و زمینه مطالعات زبانشناختی و غیرزبانشناختی بر روی این گونه و گونه‌های مشابه زبانی را فراهم می‌کند.

کارشناسی ارشد زبانشناسی

کارشناسی ارشد
دانشگاه تربیت مدرس
شهریور ۱۳۹۲ - تیر ۱۳۹۵
رساله

تصریف زمان دستوری افعال زبان فارسی و شیوه پردازش آن: رویکردی زبان-روانشناختی

در این پژوهش وضعیت صورت‌های پیچیده تصریفی را در ذهن سخنگویان زبان فارسی، با تمرکز بر روی تصریف زمان دستوری افعال ساده زبان فارسی، در بی‌نشان‌ترین حالت آن (: حال اخباری و گذشته ساده)، مورد بررسی قراردادیم. دستیابی به چنین هدفی مستلزم بازنگری در برخی از مفاهیم در این حوزه بود. به همین منظور سه پرسش مطرح‌کردیم که دو پرسش نخست، ناظر بر چنین بازنگری‌ای بود و پرسش سوم به شیوه پردازش واحدهای پیچیده صرفیِ حاصل از تصریف زمان دستوری اختصاص‌داشت: 1. چه تقسیم‌بندی‌‌ای را براساس مفهوم رگولاریتی می‌توان از افعال زبان فارسی ارائه‌کرد؟ 2. چه مدلی را می‌توان از فرایند تصریف زمان دستوری در افعال زبان فارسی ارائه‌کرد که بازنمایی مناسبی از عملکرد ذهنی این فرایند باشد؟ 3. تمایز میان افعال رگولار و غیررگولار ریشه در کدام مکانیسم‌های ذهنی دارد؟ برای دستیابی به داده‌هایی که بتوان با استناد به آنها این سه پرسش را مورد سنجش قرارداد، دو آزمایش تجربی طراحی‌کردیم که در آن خطاهای کاربران زبان در تصریف زمان دستوری در مواجهه با افعال واقعی و ناواژه‌ها جمع‌آوری‌می‌شد. نتایج به‌دست‌آمده نشان‌داد که براساس مفهوم رگولاریتی افعال زبان فارسی را می‌توان به سه دسته افعال رگولار، غیررگولار، و آلترناتیو تقسیم‌کرد: افعال آلترناتیو طبقه بازی از افعال هستند که پایه آنها از بیش از دو هجا تشکیل‌شده، به توالی واجی -ɑn ختم‌می‌شود، در فهرست افعال غیررگولار حضورندارند و می‌توانند با دو وند -d و -id به گذشته صرف‌شوند؛ افعال غیررگولار فهرستی از افعال را تشکیل‌می‌دهند که هیچ رابطه نظام‌مندی میان ریشه و بنِ گذشته آنها وجودندارد؛ و افعال رگولار شامل تمام افعال بالفعل و بالقوه زبان فارسی می‌شود که در دو دسته پیشین جای نداشته و از الگوی «ریشه + -id» در تصریف گذشته خود بهره‌می‌برند. نتایج به‌دست‌آمده در رابطه با پرسش دوم نشان‌می‌داد که صورت حال افعال رگولار و غیررگولار، و همینطور صورت گذشته اکثر افعال رگولار از ریشه مشتق‌می‌شوند؛ درمقابل صورت گذشته افعال غیررگولار و افعالِ رگولارِ بسیار پربسامد، با بازیابی بنِ گذشته این افعال از حافظه و سپس افزودن شناسه تولید‌می‌شوند. نتایج به‌دست‌آمده در رابطه با پرسش سوم، که به سنجش ادعای نظریه مکانیسم دوگانه اختصاص داشت، در تائید آرای این نظریه، نشان‌می‌داد که افعال رگولار با مکانیسم قاعده و افعال غیررگولار با مکانیسم حافظه تولید‌می‌شوند.

کارشناسی زبانشناسی

کارشناسی
دانشگاه شیراز
شهریور ۱۳۸۸ - خرداد ۱۳۹۲

آثار

مدخل‌های دانشنامه‌ای

۱۳۹۷
دانشنامه زبان و ادب فارسی (جلد ۶)

وفا زواره‌ای

نشر فرهنگستان زبان و ادب فارسی

لغتنامه‌ها

۱۳۹۶
فرهنگ جامع زبان فارسی (جلد دوم)

نشر فرهنگستان زبان و ادب فارسی

پروژه‌ها

آزمایشگاه پیکره (CorpusLab)

فعال

آزمایشگاه پیکره (CorpusLab) پروژه‌ای است با هدف ارائه پیکره‌های فارسی و ابزارهای تحلیل پیکره برای مطالعات زبانشناختی و غیرزبانشناختی

پیکره پردازش زبان های طبیعی فارسی

۱۴۰۰

پیکره ۱۴۰۰ پروژه‌ای است که در آن پیکره‌ای حاوی یک میلیون توییت از توییت‌های سال ۱۴۰۰ را تهیه می‌کنیم. بخشی از این پیکره به صورت دستی نرمال‌سازی، تگزنی، و لما‌یابی خواهد شد.

پیکره پردازش زبان های طبیعی فارسی

مطالعه زبان-روانشناختی تصریف افعال

در این پروژه چگونگی تولید و درک افعال منظم و نامنظم و مکانیسم‌های روانشناختی دخیل در پردازش آنها، و چگونگی سازماندهی آنها در مغز را بررسی می‌کنیم. تمرکز ما در این پروژه بر روی تصریف گذشته افعال است.

روانشناسی زبان ساختواژه

سی پی وی آی (تصریف‌گر جامع افعال فارسی)

سی پی وی آی (Comprehensive Persian Verb Inflector) یک نرم‌افزار تصریف افعال فارسی است که در تصریف افعال از نظریه مکانیسم دوگانه (نظریه واژگان و قواعد) بهره می‌گیرد.

پایتون ابزارهای پردازشی

واج‌آرایی، واج‌آماری، و هجابندی واژگان فارسی

در این پروژه واج‌آرایی، واج‌آماری، و هجابندی ۵۵۰۰۰ واژه فارسی را مطالعه می‌کنیم.

واجشناسی واج‌آرایی

فلکسیکون ارتقایافته

فلکسیکون ارتقایافته نسخه تصحیح‌شده و ارتقایافته از پیکره فلکسیکون است. واج‌نگاری آی‌پی‌ای، هجابندی، افزودن چاکنای آغازین به واژه‌های آغازشده با مصوت، و اصلاح خطاهای تایپی/نگارشی ازجمله فرایندهایی است که در این نسخه اعمال شده است.

پیکره واژگان

گواهی‌ها

برای دیدن فهرست کامل بر روی هر موضوع کلیک کنید

Introduction to TensorFlow for AI, ML, and Deep Learning
DeepLearning.AI
Natural Language Processing in TensorFlow
DeepLearning.AI
NLP with Classification and Vector Spaces
DeepLearning.AI
Fine Tune BERT for Text Classification
Coursera
Introduction to NLP in Python
Coursera
Transfer Learning for NLP with TensorFlow Hub
Coursera
Named Entity Recognition using LSTMs with Keras
Coursera
Fake News Detection with Machine Learning
Coursera
Convolutions for Text Classification with Keras
Coursera
Tweet Emotion Recognition with TensorFlow
Coursera
NLP: Twitter Sentiment Analysis
Coursera
Basic Sentiment Analysis with TensorFlow
Coursera
The Data Scientist's Toolbox
Johns Hopkins University

Introduction to Git and GitHub
Google
Crash Course on Python
Google
Troubleshooting and Debugging Techniques
Google
Using Python to Interact with the Operating System
Google
Python for Everybody (Specialization)
University of Michigan
Python 3 Programming (Specialization)
University of Michigan
Introduction to HTML5
University of Michigan
Introduction to CSS3
University of Michigan
Introduction to Bash Shell Scripting
Coursera
Automation Scripts Using Bash
Coursera

Basic Statistics
University of Amsterdam
Quantitative Methods
University of Amsterdam
Data Science Math Skills
Duke University

The Bilingual Brain
University of Houston
Fundamental Neuroscience for Neuroimaging
Johns Hopkins University
Introduction to Psychology
University of Toronto
Big Data and Language 1
KAIST
Philosophy of Cognitive Sciences
University of Edinburgh