Journal of Information Technology Management د ناوری اطلاعات
دانشكدة مديريت دانشگاه تهران دورة 8، شمارة 1 بهـار 1395 ص. 26- 1

كاربرد قواعد كشفي و الگوريتم ژنتيك در ساخت مدل ARMA
براي پيش بيني سري زماني
محمدرضا اصغري اسكوئي1، محمد قاسم زاده2
چكيده: براي پيش بيني سري زماني ابتدا بايد مدل مناسبي از آن ساخته شـود . تعيـين ابعـاد وتخمين پارامترهاي مناسب براي مـدلARMA سـري زمـاني، چالشـي اسـت كـه عـلاوه بـرروش هاي متداول آماري، از طريق محاسبات هوشمند نيز به آن توجه شده است. در ايـن مقالـهاستفاده از الگوريتم ژنتيك براي تخمين پارامترهاي مدل ARMA و قواعد كشفي براي تعيـينابعاد مدل ارائه مي شود. قواعد كشفي بر اساس ويژگي هـاي سـري زمـاني اسـتخراج مـيشـوند .
داده ها به روش پنجرة لغزان در پيش بيني بهكار ميروند. مدل بر اساس معيار اطلاعاتي بيـزين وپيش بيني بر اساس دو معيار مجذور متوسط مربعات خطـا و متوسـط قـدر مطلـق درصـد خطـا ارزيابي مي شود. روش ارائه شده روي هشت سري زماني با ويژگي هاي مختلـف بـهكـار رفتـه ونتايج آن با نتايج روش آماري مقايسه شده است. نتايج بهدسـت آمـده نشـان مـيدهـد در تمـامموارد، روش ارائه شده همسان يا بهتر از روش كلاسيك عمل مي كند.

واژه هاي كليدي: الگوريتم ژنتيك، پنجرة لغزان، پيش بيني سري زماني، تخمـين مـدلARMA، قواعد كشفي.

استاديار رايانه، دانشكدة علوم رياضي و رايانه، دانشگاه علامه طباطبائي، تهران، ايران
دانشجوي كارشناسي ارشد علوم رايانه ـ گرايش سيستم هاي هوشمند، دانشكدة علـوم رياضـي و رايانـه، دانشـگاهعلامه طباطبائي، تهران، ايران

تاريخ دريافت مقاله: 09/06/1394 تاريخ پذيرش نهايي مقاله: 14/10/1394 نويسندة مسئول مقاله: محمد قاسم زاده
E-mail: Ghasemzade.mohammad@aut.ac.ir
مقدمه
شناخت ماهيت تغييرات در سري هاي زماني متنوعي چون بازارهاي مالي، اقتصاد، توليد، كنترل و منابع طبيعي براي صاحبان بنگاه هاي اقتصادي، سرمايه گذاران، مشتريان، مسئولان و حتي مـردمعادي ، اهميت ويژه اي دارد و توجه بسياري از پژوهشگران را به خود جلـب كـرده اسـت. تحليـلدرست از روند تغييرات و امكان پيشبيني آن در برنامه ريزي و تصميم سازي اهميت بسيار زيادي دارد (اسكويي، 1394). ضرورت هاي پژوهشي اين مقاله به سـازمان هـا، سـرمايه گـذاران و تمـامكساني اختصاص دارد كه درصدد برنامه ريزي براي آينده اند. در حقيقت پيش بيني دقيق، كليد حـلمشكلات مردم و سازمان هاي تصميم گيرنده است. امـروزه در بسـياري از رشـته هـا، حـوزه هـايعلمي، مديريتي و اقتصادي، علوم تجربي و غيره، استفاده از داده هاي به دست آمده و تحليـل آنهـادر تصميم گيريها اهميت بسياري دارد؛ زيرا در صورت موفقيت پيش بيني و برنامهريزي، ميتوان سبب كاهش هزينه، افزايش دقت و آمادگي بيشتر در تصميمگيري شد.
تغييرات و پيش بيني سري هاي زماني از طريق دو رويكرد متفاوت بنيادين ( توصـيفي) و فنـي(تكنيكال)، مطالعه و مدلسازي مي شود. رويكرد بنيادين مبتني بر مفاهيم و نظريه هاي مطرح در علم آن سري زماني است. در اين رويكرد پس از مطالعة رابطـة متغيرهـاي مختلـف و اسـتخراجمدل رياضي، سري زماني پيش بيني مي شود. رويكرد فني بدون توجه عميق به ماهيت معيارهـاي سري زماني و فقط با مطالعة روند تغييرات در دوره هاي گذشته، به پيش بيني تغييرات آتي مبادرت مي كند (اسكويي، 1394).
در اين مقاله بهمنظور مدلسازي و پيشبيني سريهاي زماني، رويكـرد فنـي انتخـاب شـده است و در واقع هدف، پيش بينـي رفتـار سيسـتم اسـت، نـه روش كـار آن. الگـوريتم ژنتيـك بـارمزگذاري حقيقي براي تخمين ضرايب ARMA بهكار مي رود و مدلها با بهره منـدي از قواعـد كشفي ساخته شده و با به كارگيري معيار اطلاعات بيـزي كنتـرل مـي شـوند و بـهكمـك جريمـةپيچيدگي مدل، از بيش برازش جلوگيري مي شود. اهداف ايـن پـژوهش ابتـدا مـدل سـازي بـراي سريهاي زماني و سپس بهينه سازي پارامترهاي مدل و درنهايـت پـيش بينـي بـا بهـره منـدي از بهترين مدل ساخته شده اسـت. در نهايـت، خطـاي پـيش بينـي روش مطـرح شـده در مقالـه بـا روشهاي كلاسيك مقايسه خواهد شد.
پيشينة پژوهش
بهطوركلي، روش هاي پيش بيني سري هاي زماني را ميتوان به دو دسته تقسيم كـرد: روشهـايكلاسيك و روش هاي هوشمند. مدلهاي كلاسيك به مدل هاي آماري اي گفته مـي شـود كـه ازابتداي تحليل هاي سري زماني به آنها پرداخته شـده اسـت . روش هـاي هوشـمند نيـز بـه كمـك سامانه هاي محاسباتي و محاسبات هوشمند در دهه هاي اخيـر تحقيـق شـده و توسـعه يافتـه انـد .
مدل هاي كلاسيك سري زماني خود به دو بخش تقسيم مي شوند: مدل هاي ايسـتا و مـدل هـايغير ايستا. مدلهاي ايستا نيز به انواع مدل هاي خودگردان1 يا AR، ميانگين متحرك2 يـاMA و ميانگين متحرك خودگردان3 يا ARMA دسته بندي مي شوند و مدل غير ايستا با عنوان ميـانگينمتحرك خودگردان يكپارچه4 يا ARIMA شناخته مي شود.
مدل هاي تصادفي ARMA توصيف كنندة رفتار سيستم خطي تحت تـأثير اغتشـاش پنهـانگاوسي قرار دارند. اين مدل ها قابليت مدلسازي شهودي و پيش بيني مؤثري را فراهم مـي كننـد، اما متأسفانه الگوريتمي با كارايي زياد براي محاسبة پارامترهاي مـاكزيمم كننـدة احتمـال مـرزيداده هاي ARMA وجود ندارد. درنتيجه تخمين گرهاي محلي اكتشافي5 به صورت تئوري ارائـه و بررسي شده اند. البته هيچ يك از اين تخمين گرها تضميني براي يافتن پارامترهاي بهينة سراسري ايجاد نمي كنند (وايت و ون، 2015). مينيمم هاي چندگانه معمـولاً در رويـة تـابع خطـاي هـدفمدل هاي سري هاي زماني وجود دارند. جوابهاي روش هاي كلاسيك در نقاط بهينة محلـي بـهدام مي افتند و مدل ضعيفي توليد مي كنند (چاو مينگ و هانگ تيزر، 1995).
مباحث محاسبات هوشمند پژوهش در عمليات سـبب ارائـة روش هـاي كمـي تـر عـددي درپيش بيني سري هاي زماني شده است كه جايگزين روش هاي كلاسيك مي شوند. در دو دهة اخير پيش بيني سري هاي زماني غيرخطي ظهور پيدا كردند كه در اين ميان مي تـوان بـه شـبكه هـايعصبي مصنوعي به عنوان يكي از روشهاي مشهور اشاره كرد. شبكه هاي عصـبي نيـز در مـوارد متعددي چون طبقه بندي و خوشه بندي و تشخيص الگـو بـه كـار گرفتـه شـده اسـت. قاسـمي و اصغري زاده در سال 1393 در مطالعه اي به كمك شبكة عصبي، خوشه بندي شركت هاي مختلـفرا با توجه به شاخصهاي مالي بررسي كردند. همچنين وثـوق، تقـويفـرد و البـرزي (1393) در مقالهاي با توجه به قابليت زياد شبكة عصبي در بازشناسي الگو، توانستهاند با دقت نسـبتاً زيـاديتراكنش هاي سالم و متقلبانة بانكي را از هم تشخيص دهند. شـبكههـاي عصـبي مصـنوعي نيـزبراي پيش بيني هايي همچون جريان رودخانه بهكار گرفته شـدهانـد . از ايـن روش بـراي تخمـين پارامترهـاي ARMA اسـتفاده مـ يشـود. چنـووت و همكـارانش در سـال 2000 نشـان دادنـد
ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
Autoregressive
Moving average
Autoregressive – Moving average
Autoregressive integrated Moving average
Heuristic
درصورتي كه تعداد نقاط داده ها كمتـر از 100 باشـد، شـبكه هـاي عصـبي مصـنوعي نمـي تواننـدمرتبه هاي مدل ARMA را به صورت دقيق تخمين بزنند (محمدي و اسلامي، 2006).
دربارة استفاده از هوش محاسباتي در كنار روشهاي كلاسيك، براي مدل سازي و پيش بينـيسري هاي زماني مطالعات فراواني شده است. ازجمله ميتوان به استفاده از شبكة عصـب ي پيشـرو(اسكويي، 1383)، شبكة عصبي بازگشتي (كانر، مارتين و اطلس، 1994)، سيستم اسـتنتاج فـازي
(گريوز و پدريكز، 2009)، سيستم خبره (حمزاپبي، آكاي و كوتاي، 2009)، سيستم تركيبي فازي ـ عصبي (ژانگ، 2008؛ اسكار و پاتريكا، 2002)، بردار حائل (گستل و همكاران، 2001؛ ساپانكويچ و سانكار، 2009)، سيستم آشوب گونه (ژانگ، چونگ و لو، 2008) و الگوريتم هاي تكاملي (كورتز، روچا و نوس، 2004) اشاره كرد. همچنين شعبانالهي، رشيدي و صادقي در سال 1394 با استفاده از الگوريتم ژنتيك و الگوريتم جانسون در سيستم خبره، رفتار مصرف انرژي كاركنـان را تحليـلكردند. كريمي (1394) نيز در مطالعه اي، سيستم خبرة فازي را براي حوزة تبـادلات الكترونيكـي دولت و كسب و كارها به كار برد. البته در مواردي كه پيش بيني خطي نياز باشد، همچنان ميتـواناز روشهـاي قـديمي بهـره گرفـت (ماكريـداكيس و ويلورايـت، 1998). روش هـاي كلاسـيك پيشبيني، محدوديت هاي محاسباتي بسياري دارند و پارامترهاي آن به كمك روشهـاي عـددي،مانند روش حداقل مربعات، بهينه سازي ميشوند كه نتايج آن به مينيمم هاي محلي ختم مي شـود (كورتز و همكاران، 2004).
الگوريتم هاي هوش مصنوعي شامل روش هايي چون شـبكه هـاي عصـبي مصـنوعي، روشفازي، الگوريتم ژنتيك و تحليل پوششي داده1 ميشوند. در حالـت كلـي، مطالعـة الگـوريتمهـايتكاملي ژنتيك، پتانسيل هاي هوش مصنوعي را تقويت كرده است. هولند در سال 1975 الگوريتم ژنتيك را پايه گذاري كرد. مفهوم كلي اين روش بر پاية شبيه سازي تكامل طبيعي يـك جمعيـتاستوار است. جواب مسئله بايد براي بقا تلاش كنـد و تناسـب آن در هـر نسـل بهبـود مـييابـد(اسماعيل و ينگ، 2011). الگوريتم ژنتيك و تركيب اين الگوريتم با ساير روش هاي هوشـمند در سالهاي اخير كاربردهاي متعدد و متفاوتي داشته است. از اين الگوريتم مي تـوان بـراي انتخـابويژگي هاي خاصي (رتبه بندي اعتباري) از پيش پردازش دادهها يا حل مسائل بهينه سازي تركيبـياستفاده كرد (تقوي فرد، حسيني و خانبابايي، 1393؛ بهشتي نيا و فرازمند، 1394).
سال هاي اخير الگوريتم ژنتيك براي تخمين ساختار و پارامترهاي مدل ARMA ارائه شـد و در سال 2009 ماجهي، روت، ميشرا و پانـدا مـدلPSO-ARMA را بـراي پـيش بينـي فـروش
ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
1. Data envelopment analysis
پ يشنهاد دادند. به تازگي چند روش تكاملي ماننـد بهينـه سـازي ازدحـام ذرات، تكامـل تفاضـلي1، بهينه سازي باكتريايي2 و بهينه سازي گروهي گربه اي3 به خوبي در زمينه هاي مختلفي به كار گرفته شده اند (روت و ماجهي، 2013). الگوريتم هاي تكاملي، روش هاي انطباق و بهينه سازي بـر مبنـاينظرية تكامل طبيعي داروين هستند. درواقع اين الگوريتم ها به شكل دسته اي از روش ها بـر پايـةاصول مشابهي هستند كه اغلب براي بهينهسازي پارامترها كاربرد دارنـد . در ايـن روش هـا نقـاطموجود در فضاي جست وجو به صورت اعضاي منفـردي در محيطـي مصـنوعي مـدل مـي شـوند .
برخلاف بيشتر روش هاي بهينه سازي، دسـته اي از نقـاط راه حـل هـا بـه عنـوان جمعيـت شـناختهمي شوند و در هر تكرار تغيير مي كنند. شانس انتخاب شدن به عنوان والدين نسل بعد، بـه تناسـبيا كيفيت اعضا در معيار ارزش گذاري كه معمولاً تبديلي ساده از تابع هدف اسـت، بسـتگي دارد.
نقاط جديد راه حل هاي جديد جست وجو، با اسـتفاده از انتخـاب و دو عملگـر پايـة ژنتيـك يعنـيتلفيق4 و جهش5 مقداريابي مي شوند. مزيت عمدة الگوريتم هاي ژنتيك اين است كه بـه دانسـتنويژگي هاي مسئلة بهينه سازي مد نظر نياز ندارند. آنها به ويژگي مشخصـي از تـابع هـدف ماننـدتحدب6، قابليت تمايز يـا همـواري، وابسـته نيسـتند، البتـه بـه جـز الگـوريتم هـايي كـه توانـاييجست وجوي كل فضاي پارامتري و دنبـال كـردن هـر تغييـر در سيسـتم بهينـه سـازي را دارنـد.
الگوريتمهاي تكاملي در بيشتر موارد پاسخهاي مناسـب در زمـان قابـل قبـولي ارائـه مـيدهنـد .
درحاليكه روشهـاي قطعـي7 معمـولاً در مينـيممهـاي محلـي بـه دام مـي افتنـد (بلجيـانيس ، ليكوتاناسيس و دميريس، 2001).
الگوريتم هاي تكـاملي گزينـة مناسـبي بـراي تخمـين پارامترنـد؛ زيـرا ايـن الگـوريتمهـا بـاجست وجوي چندنقطهاي سراسري بهسرعت مناطق باكيفيـت را مشـخص مـي كننـد. اسـتفاده از الگوريتمهاي تكاملي در پيشبيني سري هـاي زمـاني مزيـت هـايي چـون ارائـة مـدل صـريح وجست وجوي انطباقيافتة تكاملي دارند كـه از بـه دام افتـادن در مينـيمم هـاي محلـي نـامطلوبجلوگيري ميكنند. در گذشته الگوريتمهاي تكاملي به صورت رمزهاي باينري براي بهينـه سـازيپارامترهاي روشهاي پيش بيني كلاسيك مانند روش هـاي هالـت ـ وينتـرز 8 (آگاپـ اي و آگاپـاي ، 1997) يا ARMA (هانگ و يانگ، 1995) استفاده مي شدند، اما بعدها بر استفاده از ژنهايي بـا
ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
Differential Evolution (DE)
Bacterial Foraging Optimization (BFO)
Cat Swarm Optimization (CSO)
Crossover
Mutation
Convexity
Deterministic
Holt-Winters
مقادير حقيقي متمركز شدند (ميچاله ويسـز، 1996؛ رولـف و اسـپريو ، 1996؛ كـورتز و همكـاران،2001)؛ زيرا اين نمايش مستقيم، قابليت مقياس بندي بيشتري دارد و امكان تعريـف عملگرهـايژنتيكي قوي تري را نيز فراهم ميكند (كورتز و همكاران، 2004). شكل 1 نشان دهندة نمونه اي از روية الگوريتم تكاملي است.

شكل
1
.
تكاملي

الگوريتم

شماي

اوليه

جمعيت

ارزيابي
)
خطا

مربعات

ميانگين

مجذور
(

والدين

انتخاب

ژنتيك

بازتركيب

حسابي

تلفيق

گاوسي

جهش

جديد

جمعيت

شكل

1

.

تكاملي

الگوريتم

شماي



قیمت: تومان


پاسخ دهید