تعبیه گراف دانش به منظور بهبود سامانه های پرسش و پاسخ فارسی(مقاله علمی وزارت علوم)
منبع:
زبان و زبان شناسی دوره ۱۹ پاییز و زمستان ۱۴۰۳ شماره ۴۰
131-152
حوزههای تخصصی:
با ذخیره داده ها در گراف های دانش می توان علاوه بر روابط صریح، روابطی ضمنی را نیز حدس و بازیابی کرد. این ویژگی به سامانه های پرسش و پاسخ این امکان را می دهد که فراتر از آنچه از سه گانه های گراف دیده اند به چالش کشیده شوند. تعبیه گراف دانش یا نمایش گره ها و یال های گراف در قالب بردار های عددی، به همین منظور صورت می پذیرد. در این مقاله مسئله پاسخ به پرسش های فارسی با استفاده از تعبیه گراف دانش فارسی بررسی شده است. مدل های مختلفی برای تعبیه گراف دانش آموزش داده شده اند تا هویت پیدا و نهان گره ها را در قالب بردار بازنمایی کند. از سوی دیگر با استفاده از مدل های زبانی، پرسش های فارسی به گونه ای تعبیه می شوند که نمایانگر یال ضمنی و یا عینی بین هر پرسش و پاسخ مربوطه باشد. با این رویکرد می توان به پرسش هایی پاسخ داد که مستقیماً سه گانه مربوطه در گراف آورده نشده است و همچنین پا را فراتر گذاشته و به پرسش های پیچیده تر که نیازمند طی چندین یال است نیز، پاسخ مناسب داد. نتایج حاصل از مدل پیشنهادی مبتنی بر تعبیه گراف دانش فارسی فارس-ویکی-کی جی برای پاسخ گویی به پرسش های فارسی، نشان دهنده دقت ۸۵ درصد بر روی مجموعه داده پرسش و پاسخ ساده و پیچیده به زبان فارسی می باشد.با ذخیره داده ها در گراف های دانش می توان علاوه بر روابط صریح، روابطی ضمنی را نیز حدس و بازیابی کرد. این ویژگی به سامانه های پرسش و پاسخ این امکان را می دهد که فراتر از آنچه از سه گانه های گراف دیده اند به چالش کشیده شوند. تعبیه گراف دانش یا نمایش گره ها و یال های گراف در قالب بردار های عددی، به همین منظور صورت می پذیرد. در این مقاله مسئله پاسخ به پرسش های فارسی با استفاده از تعبیه گراف دانش فارسی بررسی شده است. مدل های مختلفی برای تعبیه گراف دانش آموزش داده شده اند تا هویت پیدا و نهان گره ها را در قالب بردار بازنمایی کند. از سوی دیگر با استفاده از مدل های زبانی، پرسش های فارسی به گونه ای تعبیه می شوند که نمایانگر یال ضمنی و یا عینی بین هر پرسش و پاسخ مربوطه باشد. با این رویکرد می توان به پرسش هایی پاسخ داد که مستقیماً سه گانه مربوطه در گراف آورده نشده است و همچنین پا را فراتر گذاشته و به پرسش های پیچیده تر که نیازمند طی چندین یال است نیز، پاسخ مناسب داد. نتایج حاصل از مدل پیشنهادی مبتنی بر تعبیه گراف دانش فارسی فارس-ویکی-کی جی برای پاسخ گویی به پرسش های فارسی، نشان دهنده دقت ۸۵ درصد بر روی مجموعه داده پرسش و پاسخ ساده و پیچیده به زبان فارسی می باشد.