ارائه شبکه پیچیده بدون مقیاس با الگوی ترکیب لایه ای زبان فارسی(مقاله علمی وزارت علوم)
منبع:
علوم و فنون مدیریت اطلاعات دوره ۹ پاییز ۱۴۰۲ شماره ۳ (پیاپی ۳۲)
215 - 240
حوزههای تخصصی:
هدف: پژوهش حاضر روشی را برای بررسی الگوهای ترکیب و ساختار توپولوژیکی زبان فارسی پیشنهاد کرده، و روش بهبودیافته متن فارسی را در قالب گراف شبکه همزمان در چارچوب نظریه شبکه پیچیده بررسی می کند.
روش: یک مدل تهی با اندازه مشابه، با توجه به گراف تصادفی اردوش- رینی، برای مقایسه با شبکه فارسی تولید می شود. مقایسه براساس طول مسیر متوسط، ضریب خوشه بندی و سلسله مراتب هر دو شبکه است. از تجزیه و تحلیل این ویژگی های کلیدی، مشاهده می شود که گراف شبکه فارسی با شبکه تصادفی متفاوت است. طول مسیر متوسط کوچک تر و ضریب خوشه بندی بالا نیز تأثیر مدل جهانی کوچک را در زبان فارسی تأیید می کند.
یافته ها: برای اولین بار، متن فارسی با موفقیت به شبکه پیچیده تبدیل شد. یک مجموعه باز و بدون حاشیه بیش از دو میلیون کلمه، با استفاده از رویکرد جنگل تصادفی ساخته شده است.
نتیجه گیری: شبکه حاصل طراحی شده، با مدل کیسه بایگرام شامل 3256 گره و 79705 لبه می باشد. علاوه بر این، برخلاف شبکه تصادفی که تنها یک جامعه وجود دارد، 12 اجتماع در شبکه فارسی شناسایی شده است. واقعیت های آماری نشان می دهد که شبکه فارسی یک شبکه بدون مقیاس با الگوی ترکیب لایه ای است.