Journal of Information Technology Management University of Tehran
ISSN: 2008-5893 Faculty of Management
EISSN: 2423-5059
Vol. 9, No. 1; PP. 1 – 20
Spring 2017

An Intelligent System for Fraud Detection in Coin
Futures Market’s Transactions of Iran Mercantile
Exchange Based on Bayesian Network
Amir-Reza Abtahi 1, Fatemeh Elahi 2, Reza Yousefi-Zenouz3
Abstract: In order to gain more illicit profit, some traders in the stock market try to make a targeted impact on prices by placing fake orders and false advertising. Due to the high customer population, it is not possible to discover these frauds using traditional methods. The present study seeks to provide a system for preventing the frauds in future market-trading coins based on Bayesian classifier model for Iran Mercantile Exchange. The proposed model has polynomial time complexity and high accuracy because of considering important dependencies among different features of data. The primary labeling of data has been done by Kmeans clustering. The test of model shows 94.55 percent similarity between model’s output and labeled data. Using this system can helps to identify the fraudulent from nonfraudulent traders.

Key words: Bayesian network, Fraud detection, Futures contract, Induction behavior, Mercantile exchange.

Assistant Prof., Dep. of IT., Faculty of Management, Kharazmi University, Tehran, Iran
MSc. Student in Decision Sciences and Knowledge Engineering, Faculty of Management Kharazmi University, Tehran, Iran
Assistant Prof., Dep. of IT., Faculty of Management, Kharazmi University, Tehran, Iran

Submitted: 14 / June / 2016
Accepted: 25 / February / 2017
Corresponding Author: Amir-Reza Abtahi
Email: abtahi@khu.ac.ir

Journal of Information Technology Management د ناوری اطلاعات
دانشكدة مديريت دانشگاه تهران دورة 9، شمارة 1 بهار 1396
صص. 20- 1

طراحي نوعي سيستم هوشمند براي كشف تقلب حاصل از حركت
القايي در معاملات بازار قراردادهاي آتي سكة بورس كالاي ايران مبتني بر شبكة بيزي
سيد امير رضا ابطحي 1، فاطمه الهي2، رضا يوسفي زنوز 3
چكيده: در بازار سهام، برخي سوداگران به منظور كسب منفعت بيشتر سعي مي كنند به وسيلة سفارش هاي صوري، سبب تأثير هدفمند بر نوسان قيمت ها شوند و از وضعيت پيش آمده در قيمت ها سوءاستفاده كنند كه به اين عمل، حركت القايي گفته مي شود. به دليل جمعيت آماري زياد مشتريان، امكان نظارت چشمي يا نظارت سيستمي از طريق روش هاي سنتي براي كشف حركت القايي وجود ندارد. پژوهش حاضر بهدنبال ارائة سيستمي براي پيشگيري از وقوع حركت القايي در معاملات بازار قراردادهاي آتي سكة بورس كالاي ايران مبتني بر مدل سازي طبقه بند بيزي است. سيستم ارائه شده ضمن برخورداري از پيچيدگي زمانيِ چند جمله اي، به دليل لحاظ كردن و ابستگيهاي مهم ميان ويژگيهاي مختلف داده، دقت زيادي دارد. برچسب گذاري اولية داده ها با استفاده از خوشه بندي كا ـ ميانگين انجام گرفته است و آزمون مدل، تشابه 55/94 درصدي را ميان نتيجة روش بيزي پيشنهادي و دادههاي برچسب گذاريشده نشان ميدهد. استفاده از سيستم نوين ارائه شده به شناسايي افراد فريبكار در معاملات بازار از افراد سالم كمك به سزايي مي كند.

واژه هاي كليدي: رفتار القايي، سيستم هوشمند، شبكة بيزي، قرارداد آتي، كشف تقلب.

استاديار گروه مديريت فناوري اطلاعات، دانشكدة مديريت دانشگاه خوارزمي، تهران، ايران
دانشجوي كارشناسي ارشد مهندسي دانش و علوم تصميم، دانشكدة مديريت، دانشگاه خوارزمي، تهران، ايران
استاديار گروه مديريت فناوري اطلاعات، دانشكدة مديريت دانشگاه خوارزمي، تهران، ايران

تاريخ دريافت مقاله: 25/03/1395
تاريخ پذيرش نهايي مقاله: 07/12/1395 نويسندة مسئول مقاله: سيد امير رضا ابطحي E-mail: abtahi@khu.ac.ir
مقدمه
بحث فريبكاري به منظور منافع فردي در بازارهاي سرمايه، همواره مطرح است و شـدت و ضـعفآن در بازارهاي مختلف با توجه به بهره مند ي آنها از قوانين مناسـب ضـد دسـتكاري و ابزارهـاينظارتي، تفاوت دارد (مديريت مطالعات اقتصادي و برنامه ريزي و آموزش شـركت بـورس كـالايايران، 1391 )؛ اين موضوع در بازار قراردادهاي آتي نيز مشاهده مي شود. اگر بازار بـورس كـاراييلازم در انجام كاركردهاي خود را نداشته نباشد، اخـتلالات عمـده اي در سـطوح اقتصـاد ملـي وفراملي ايجاد خواهد كرد. در اين ميان، افرادي بدون رعايت اخلاق در معـاملات، جريـان واقعـيعرضه و تقاضا را منحرف مي كنند و با فريب ديگران زمينة كسب سود خود را فـراهم مـي آورنـد .
مقابله با اين اعمال، به شناسايي و پيشگيري كارشناسان نظارت بر بازار بورس نياز دارد.
آمار معاملات قراردادهاي آتي در ايران، نشان مي دهد حجم و ارزش اين معاملات هـر سـال نسبت به سال قبل افزايش بسيار چشمگيري را تجربه كرده اسـت . نـاظران نيـز بـراي بررسـي ، افزون بر روش هايي چون بايگاني و كنترل اسناد مربوط به قراردادها، نظارت بر اخبار منتشر شـده و سيستم نظارت، از برنامه هاي نرم افزاري نيز استفاده مي كننـد (مـديريت مطالعـات اقتصـادي وبرنامه ريزي و آموزش شركت بورس كالاي ايـران، 1391). نـاظران پـس از آگـاهي از معـاملاتمشكوك، براي اطمينان، سابقة داد و ستدها را بررسي مي كنند. در حال حاضر نرم افزارهـايي كـه براي اين كار استفاده مي شوند، با ضعف هايي مانند ناديده انگاشتن وابستگي بين متغير ها و روابـط عليّ بين ويژگي هاي تراكنش هاي روزانه و استدلال هاي احتمالي مواجـه انـد . البتـه بـا توجـه بـه سـرعت رو بـه رشـد بـازار بـورس، فريبكـاري در رفتـار معـاملاتي متنـوع اسـت و بـا توجـه بـه تخصصي بودن بحث، در اين پژوهش صرفاً به حركت القايي در معاملات قراردادهاي آتـي سـكهدر بورس كالاي ايران پرداخته مي شود. از آنجا كه پراكندگي دادههاي بورس متنـوع و همچنـين
توزيع دادههاي مثبت و منفي بين مجموعة دادهها نامتوازن است، بايد به دنبال آن بود تا راهكـار مناسبي براي كشف الگوهاي پنهان و ضمني پيدا كرد. انجام اين كـار در بسـتر كشـف دانـش ازروي داده ها امكان پذير است. پس از مطالعه در زمينة رفتار القايي، مدلي ارائه شد كه شرايط زيـررا محقق ساخته است:
روابط بين متغيرها و ميزان تأثير هر يك از آنها را بر يكديگر مشخص ميكند؛
توانايي استدلال ها و استنباط هاي احتمالي را دارد؛
مي تواند پس از آموزش و يادگيري، به عنوان تصميم گيرنده اي مطمئن افراد مشكوك را از سالم تفكيك كند.
بنابراين، پژوهش حاضر در پي پاسخ به اين سؤال است كه چگونه مي توان سيستمي طراحـيكرد كه به كمك آن از وقوع تقلب در رفتارهاي القاييِ معاملات بورس كالا جلوگيري كرد؟ پيشينة نظري پژوهش
طبقه بندي عبارت است از تخصيص ركوردها يا هر مجموعه اي از اشيا به مجموعـ ة مشخصـي ازطبقهها (دسته ها) (ميتشل، 1997: 198). همان گونه كه گفته شد، در اين مقاله به دنبـال طراحـيسيستمي براي شناسايي احتمال وقوع رفتارهاي القايي و طبقه بندي مشتريان روزانة بورس به دو دستة افراد سالم و متخلفّ هستيم. قبل از پرداختن بـه روش اجـراي پـژوهش ، ابتـدا لازم اسـتدربارة مفاهيم كليدي تحقيق همچـون، شـبكه هـاي بيـزي، خوشـه بنـدي و قـرارداد آتـي شـرحمختصري بيان شود.
شبكه هاي بيزي
شبكة بيزي، نوعي ساختار گرافيكي (GMs)1 است كه امكان بيان و استدلال دربارة حوزه اي غير قطعي را ميسر ميكند. اساس روش يادشده بر اين اصل استوار است كه براي هر كميت، يك توزيع احتمال وجود دارد و با مشاهدة دادة جديد و استدلال دربارة توزيع احتمال آن، مي توان تصميمات بهينه اي اتخاذ كرد (ميتشل، 1997). از نظر گرافيكي، اين شبكه ها گراف هاي جهت دار بدون دور هستند، مجموعة متناهي (, … , X 1 ) نشان دهندة رأسهاي گراف است و در واقع همان متغيرهاي فضاي مس ئلهاند. ساختار شبكة بيزي بايد رابطة كيفي بين متغيرها را به درستي نشان دهد. به دليل برقراري حالت ماركوف در شبكه هاي بيزي، توزيع احتمال توأم اين شبكهها به صورت زير محاسبه ميشود:
رابطة 1) (|Π)= (,…,)
در رابطة 1، Π نشـان دهنـدة گـرههـاي والـدگرة در شـبكه اسـت (هكـرمن، گيگـر وچيكرينگ، 1995).
در شبكه هاي بيزي مفهومي با عنوان يادگيري وجود دارد. يادگيري، فرايند ها و تكنيك هـاييرا دربرمي گيرد كه يك شبكه با استفاده از آنها، به صورت خودكار ميتواند ايجاد شـود و عملكـرد
ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
1. Graphical Models
خود را بهبود بخشد. در شبكه هاي بيزي يادگيري به دو صورت كلي ساختاري و پارامتري انجـاممي پذيرد:
يادگيري ساختاري: اين شيوة يادگيري به دنبال پيدا كردن ساختار بهينه براي شبكة بيزي مد نظر، از نظر موقعيت گره ها و روابط كيفي آنها با يكديگر توسط يال هاي جهت دار است. ايـنكار در دو مرحلة كلي جست وجو در فضاي نمونة مدل هاي علّي و جست وجـو بـراي يـاف تن معيارهاي قابل قبول براي ارزشيابي شبكه ها انجام مي پذيرد.
يادگيري پارامتري: در اين شيوه، از نمونهها براي برآورد پارامترها (توزيع احتمـال شـرطي)1 استفاده مي شود (نيلسن و جنسن، 2009: 57). به طور كلي، دادهها را مي تـوان بـه دو دسـته داده هاي كامل2 و دادهه اي ناكامل3 دسته بندي كرد و بـراي هر يـك بـه بـرآورد پـارامتر هـاپرداخت (جدول 1)
جدول 1. انواع داده ها و ساختار هاي شبكه
ساختار نا معلوم ساختار معلوم مدل
بهينه سازي روي ساختار4 برآورد پارامترهاي آماري داده هاي كامل
روش هاي تركيبي5 بهينه سازي پارامتر ها داده هاي ناكامل
با توجه به مسئلة بررسي شده، بـراي يـادگيري پـارامتري شـبكه بـا حالـت سـاختار معلـوم وداده هاي كامل مواجهايم.
استنتاج در شبكههاي بيزي
در اغلب سيستمهاي هوشمند نياز است كه براساس تعدادي از مشاهدات، احتمـال وقـوع رويـدادبرآورد شود. در سيستم هاي دستهبندي، احتمال عضويت يك شيء در هر يك از دستهها، براساس ويژگيهاي شيء مد نظر مشخص مي شود. به فرايند پاسخ به اين درخواستهـا، اسـتنتاج6 گفتـه ميشود، هر فرايند استنتاج به داده هاي قلمرويي7 نياز دارد كه قصـد كنتـرل عـدم قطعيـت آن را
ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
Conditional Probabilities Distribution (CPD)
Complete Data
Incomplete Data
Optimization over structure
Combined
Inference
Domain
داريم. استنتاج در شبكه هـاي بيـزي بـه دو نـوع اسـتنتاج در سـاختار و اسـتنتاج در پارامترهـاي احتمالاتي دسته بندي ميشود (نيلسن و جنسن، 2009: 120).
الگوي طبقه بندي بيزي ساده
يكي از روش هاي بسيار كاربردي در يادگيري بيزي، روش يادگيرندة سادة بيزي است كه عمومـاً روش طبقه بندي سادة بيزي ناميده ميشود.
طبقه بندي سادة بيزي براي مسائلي كاربرد دارد كه هر نمونة x در آن توسـط مجموعـه اي از مقادير صفات و تابع هدف () از مجموعهاي ماننـد انتخـاب مـي شـود. روش بيـزي بـرايطبقه بندي نمونة جديد، محتمل ترين طبقه يا مقدار هدف را بـا داشـتن مقـادير صـفات >,…,2,1< كه توصيف كنندة نمونة جديد اسـت ، شناسـايي مـي كنـد (بـاربر، 2010:
.(102
= arg|,, … , (2 رابطة
خوشه بندي كا – ميانگين1
در سال 1975 هارتيگان براي اولين بـار الگـوريتم كـا ــ ميـانگين را ارائـه داد و در سـال 1979 به كمك ونگ تغييراتي در آن ايجاد كرد و اكنون متداول ترين ابزار خوشه بنـدي اسـتفاده شـده در كاربردهاي صنعتي و علمي است. در اين روش، خوشه ها با مراكزشان كه معمولاً ميـانگين نقـاط درون يك خوشه است، بيان مي شوند. در اين روش فاصلة هر نقطه تا مركز آن خوشه، به عنـوان تابع هدف در نظر گرفته مي شود. فاصله مي تواند تعاريف مختلف و گسترده اي را شامل شود. هـر نقطه به خوشه اي تعلق دارد كه به مركز جرم آن نزديك تر است. در اين روش تعداد خوشه ها (K) بايد مشخص باشد. كليت الگوريتم به صورت زير است:
انتخاب K نقطه به عنوان مراكز اولي ة خوشه ها؛
تخصيص هر نقطه به خوشه اي كه به مركز آن خوشه نزديك تر است؛
محاسبة مجدد مراكز خوشه ها تا جايي كه تكرار مراحل يادشده، تغييري در خوشه هـا و مراكز آنها ايجاد نكند.

ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
1. K-Means
قرارداد آتي
قراردادي است كه مي توان به عنوان شرط ضمن عقـد لازم معاملـة سـ لف آورد و بـه موجـب آن، عرضه كنندة كالا (فروشنده) هنگام معاملة سلف به مقدار وجه دريافتي، تعهد مي كنـد كـه مقـدارمعيني از همان كالا با مشخصات منطبق بر استاندارد بورس را در زمان معين و با قيمت مشخص به طرف قرارداد تحويل دهد و خريدار نيز تعهد خريد مي دهد. هر طرفي كه از انجام تعهد تخلـفكند، بايد مبلغ معيني به طرف ديگر بپردازد (شركت بورس كالاي ايران، 1386).
پيشينة تجربي
مطالعات مختلفي در زمينة پيش بيني دستكاري قيمت، معاملات كلاه برداري1 و لايه بندي2 انجـامشده است. برخي از اين مطالعات به شرح زير است:
مادا و فردوسي (2006) براي تشخيص رفتار نامعمول معـاملاتي، الگـوريتم تشـخيص تقلـب بدون ناظر براي دادههاي سري زماني را ارائه كردند و با اعمال روش بـدون نـاظر تحليـل گـروههمسان، عملكرد زيادي را از روش پيشنهادي خود گزارش كردند .
فرانك، هوزر و اسكرودر (2008) با هدف تحليل رفتار معاملاتي نامنظم در بازار سهام، روشي را طراحي و اجرا كردند كه در آن سه گـام اصـلي تشـكيل گـراف نمـايش دهنـدة تجـارت بـين سرمايه گذاران و تاجران، تشكيل ماتريس همجواري هرميتـي و تحليـل نهـايي بـر اسـاس روش تحليل سيستم ويژه3 وجود داشت. مزيت مهم اين پـژوهش ، تشـخيص نـوع خاصـي از تقلـب در معاملات با دقت زياد است.
چن و همكارانش در مقاله اي با عنـوان »تشـخيص داده هـاي پـرت مجـاور«، الگـوريتمي رابر مبناي تركيب روش هاي محاسبات گرانول و الگوريتم تشخيص داده هاي پرت، پيشنهاد كردنـد . اين الگوريتم عملكرد بهتري نسبت به روشهاي نزديك ترين همسايه كا ـ ام4، الگوريتم تشخيص دادههاي پرت مبتني بر فاصله5 و شبكه هاي عصبي تكرار شونده،6 براي مجموعه داده هاي مختلط داشت (چن، ميائو و ژانگ، 2010).
فلاح شمس و كردلوئي (1390) پژوهشي با عنوان »آزمون مدل هاي لاجيت و شبكة عصـبي مصنوعي براي پيش بيني دستكاري قيمت در بورس اوراق بهادار تهران« انجام دادند. آنها در اين
ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
Spoof Trading
Layering
Eigen System
K- Nearest Neighbor
Distance Based Outlier Detection
Replicator Neural Network
پژوهش به بسط و توسعة روش هاي مبتني بر ساختار هاي شبكه اي و اقتصادسنجي پرداختند و به تشخيص قيمت هاي دستكاري شده در بورس اوراق بهادار تهران دست يافتند.
در تحقيقي با عنوان »طراحي الگوي پـيش بينـي دسـتكاري قيمـت در بـورس اوراق بهـادار تهران« فلاح شمس، كردلوئي و رشنو (1391) به طبقه بندي و تفكيك گروه ها به منظور پيش بيني دستكاري قيمت ها در بورس اوراق بهادار پرداختند. روش پيشنهادي آنها بر مبناي تحليل داده هاي غير خطي با استفاده از روش آماري تجزيه و تحليل مؤلفه هاي اصلي1 و طراحي مدلي با استفاده از مدل ماشين بردار پشتيبان در انجام پيش بيني بوده است .
صفري، حشمتي پور، مهرابـي و نصـابي (1391) در پژوهشـي بـه ارائـة مـدلي بـا اسـتفاده ازروش هاي تركيبي نگاشت عليّ و شبكههاي بيزي براي تعيين عوامل مؤثر بر به اشـتراك گـذارياطلاعات در زنجيرة تأمين شركت ايران خودرو پرداختند .
كيم و سان (2012) با استفاده از روش هاي يادگيري بدون ناظر ـ تحليل گروه همسان2، براي تشخيص الگوهاي مشكوك دستكاري قيمت سهام از سيستم هاي خبره بهره بردند. پژوهشـگرانتوانستند به بهبود كارايي تحليل گروه همسان از طريق بهكارگيري اوزان و به هنگـام آوري آ نهـا و تشخيص محلي3 معاملة غير معمول انجام گرفته از طريق الگوهاي ياد گرفته به جاي مقايسه با كـل جمعيت دست يابند .
وثوق، تقوي فرد و البرزي (1393) در مدلي بر مبناي شبكة عصبي مصنوعي، تراكنش ها را بـهانواع سالم و متقلب طبقه بندي كردند كه عملكرد آنها روايي و پايايي زيادي داشت.
پانيامورتي و توپان (2013) پژوهشي را به منظور نظارت و بررسـي بـازار سـهام و مـروري بـربرنامه هاي كاربردي اجرا كردند. آنان پياده سازي شبكة عصبي كه تعيين و به روز رسـاني اوزان آنمبتني بر الگوريتم ژنتيك بود را براي روش پژوهش انتخاب كردند. محققان توانستند به نظـارت
بر بازار بورس و طبقهبندي شواهد از نوع تراكنشي براي تشخيص فعاليتهاي بالقوة فريبكارانه با استفاده از مدل هيبريدي دست يابند .
لي، اوم و پارك (2013) در مقالـهاي بـا عنـوان »دسـتكاري مبتنـي بـر زيـر سـاختار: رفتـاراستراتژيك و معاملهگ ران فريبكار« به تعيين الگوهاي عام و خاص معامله گران فريبكار با استفاده از روش هاي تحليلي و مبتني بر زير ساختار پرداختند.
ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
Principal Component Analysis
Peer Group Analysis
Local
گل محمدي، داياز و زايان (2014) دستكاري بازار سهام را با استفاده از الگوريتمهاي يادگيري با ناظري مانند ماشين هاي بردار پشتيبان تشخيص دادند. آنها تراكنشهاي مشكوك به دسـتكاريدر بازار و عملكرد بهتر شبكة بيـزي سـاده نسـبت بـه سـاير روش هـا را در مقايسـة چنـد روش تشخيصي با يكديگر گزارش كردند.
اولزوسكي روشي طراحي كرد كه در آن ماتريس بهدست آمده از فعاليت هاي حسـاب كـاربري كه چند بعدي است، بـه يـك بـردار تبـديل مـي شـود؛ سـپس از نگاشـت خودسـازمانده1 بـراي تصويرسازي استفاده مي كند و بعد از تصويرسازي با الگوريتم كلاسبندي مبتنـي بـر مقـدار حـدآستانه2، مورد مشكوك و كشف تقلب را تشخيص مي دهد. روش ارائه شده به دليـل تركيـب روش تصويرسازي دادهها از طريقي مثل نگاشت خودسازمان ده با الگوريتم كلاسهبندي، به نتايج بهتر و رضايت بخشي نسبت به ساير روشها دست يافته است (اولزوسكي، 2014).
يكي از روشهاي كشف تقلب متكي بر پايگاه دانش مستخرج از دانش خبرگـان ، اسـتفاده از سيستمهاي خبرة فازي است؛ تقويفرد و جعفري (1394) در پـژوهش خـود از ايـن مـدل بـراي كشف تقلب در بيمة بدنة خودرو استفاده كردند .
تقوا، منصوري، فيضي (1395) در پژوهشي بـا رويكـرد پـردازش مـوازي و راه حـل نگاشـتكاهش، از نوعي شبكة عصبي مدل كوهنن براي كشف ناهنجاري در تراكنش هـاي كـارت هـايبانكي استفاده كردند .
يائو، ژاي، كائو و دينگ (2015) چارچوبي براي پيش بيني دستكاري قيمـت ارائـه كردنـد. در اين چارچوب بهكمك مدلهاي ايستا و پويا، به تعيين الگوهاي غيرمعمول تراكنش هاي معاملاتي بر مبناي روابط بين تراكنش ها و بدون داشتن هيچ فرض اوليه، پرداخته ميشود.
مدل مفهومي
فرايند تعيين مشتريان سالم يا متخلف بازار در هر روز، بسيار پيچيده و حسـاس اسـت. بنـابراين ، براي مشخص كردن قانوني يا غيرقـانوني بـودن عمليـات مشـتريان، عـلاوه بـر اجـراي سيسـتمپيشنهادي و تعيين خروجي آن، تأييد نهايي كارشناسان بازار ضروري است. وضعيت خاص بازار و تجربة كارشناسان در تعيين نتيجة دقيق تر كمك بسزايي ميكند.
هر روزي كه سفارش و معامله اي صورت مي گيرد، به صورت لحظه اي در سيستم ثبت ميشود و در بازه هاي زماني ثابت، كوتاه مدت و متوالي، احتمال متخلـف بـودن هـر يـك از مشـتريان درسيستم طراحي شده، براساس چارچوب بيزي تعيين ميشود. با وجود آنكه طبقه بند بيزي بر اسـاس
ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
Self-Organizing Map
Threshold Type
پارامترهاي بسياري تصميم گيري مي كند، براي اطمينان از نتيجة به دسـت آمـده ، مـوارد متعـدديهمچون تاريخچة فعاليت هاي اقتصادي فرد در بورس كالا ضروري به نظـر مـيرسـد . مـي تـوان روزانه حد آستانه اي را براساس سياست هاي مختلف اتخاذ كرد تا در هر يك از بازه هـاي زمـاني، چنانچه به تشخيص سيستم، ميزان تخلف فرد حداقل برابر با مقـدار حـد آسـتانه باشـد، متخلـفشناخته شده و پيگيري هاي بيشتر به بخش هاي ويژه واگذار شود.
همانطور كه از مطالعة آثار پژوهشي پيشين نمايان است، روش هاي گوناگوني در حل مسائل با موضوع مشابه، ارائه شده است. با بررسي ويژگي هاي مثبت و كاستيهاي پژوهش هاي پيشين، در پژوهش حاضر نوعي سيستم هوشمند مبتني بر طبقه بند شبكة بيزي طراحي و پياده سازي شده است. خصوصيات اين روش هوشمند و نوآوريهاي اين پژوهش عبارت اند از:
قابليت تركيب با تكنيك هاي آمار بيزي در ارائة دانش؛
تعيين روابط عليّ بين متغيرهاي فضاي مسئله؛
قابليت استنتاج و تصميم سازي در فضاهاي غير قطعي با استفاده از احتمالات؛
قابليت بهروزرساني همة بخش ها (ساختاري و پارامتري) مبتني بر المان يادگيري؛
قابل استفاده بودن براي دادههاي ناقص؛
قابليت كاربرد در حوزه هاي متغيري كمي (گسسته و پيوسته) و كيفي؛
بيان نتايج طبقه بندي به صورت احتمالي و پرهيز از خطاي تصميم گيري.
روش شناسي پژوهش
اين پژوهش از نظر گرد آوري اطلاعات و مدارك، كتابخانـه اي اسـت كـه بـه صـورت توصـيفي ـ تحليلي بررسي شده است و با توجه به هدف پژوهش (بررسي و استفاده از عملكرد تكنيـك هـاي شبكة بيزي براي پيشگيري از وقوع حركت القايي در معاملات بازار قرارداد هاي آتي سكة بـورسكالاي ايران)، تحقيق جاري، پژوهش توسعه اي ـ كاربردي بـه شـمار مـي رود. در ادامـه ، مراحـل اجراي پژوهش شرح داده مي شود.
برچسب گذاري اولية داده ها
براي برچسبگذاري دادهها، از روش خوشهبندي كا ـ ميانگين براي شناسايي تراكنشهاي سـالميا متخلف مشتريان استفاده شده است. پس از تعيين تراكنش سالم يا متخلف و برچسـب گـذاريروي آنها، مقادير به دست آمده به صورت متغير جديد به مجموعة داده ها اضافه مي شـود. شـكل 1 الگوريتم استفادهشده براي برچسبگذاري را نمايش مي دهد.
Algorithm: K means clustering
Minimize distance between every data point and the correspondent centroid, by this function:
J=∑∑∥xj-ci

2
K

choose randomly k of our points as partition centers.
-3 For m=1 to number of centers do
For n=1 to number of data do
Distance [m, n]

compute the distance between every data point[n] on the set with center[m]
End For
End For
4-Assign each point to the nearest cluster center.
For i=1 to number of centers do
Update the cluster center positions by using the following formula:
ci=


||
End For
If the cluster centers change, Then repeat the process from 3 Else finish the process of k means clustering algorithm and get the partition’s members and centroids.
شكل 1. الگوريتم برچسبگذاري اولية داده ها
آماده سازي داده ها (گسسته سازي)
پس از برچسبگذاري دادهها، در گام بعد از طبقه بندي بيزي سـاد ة درخـت افـزوده1 بهـره بـرده ميشود. اين طبقه بند شكل توسعهيافتة بيزي ساده است كه اجازه مي دهد ويژگـي هـا بـه صـورتدرخت با هم ارتباط داشته باشند. براي استفاده از اين الگوريتم، ابتدا بايـد گسسـته سـازي داده هـاصورت گيرد. براي گسستهسازي دادهها از تابع گسستهساز2 در نرمافزار R استفاده شده است كـهاز توزيع خي دو كمك مي گيرد. الگوريتم خيدو به صورت خودكار مقادير حـد آسـتانه اي را تعيـينمي كند و به طور صحيح و دقيق مجموعة داده هاي عددي را گسستهسازي مـي كنـد . پارامترهـايتابع عبارت اند از مجموعة دادهها، آلفا و دلتا كه بهترتيب داده ها، سطح معناداري و حداكثر ميـزانناسازگاري در مجموعة داده را نشان مي دهند.
الگوريتم خيدو بر مبناي توزيع خيدو رفتار ميكند. ابتدا براي همة ويژگي هـاي عـددي كـه گسسته سازي شده اند، با يك سطح معنادار بالا آغاز مي گردد و تمام متغيرها بر اسـاس مقدار شـان ذخيره مي شوند. در مرحلة نخست، مقدار خي دو براي هر زوج بازة مجاور محاسبه ميشود. گفتني است كه قبل از انجام گسستهسازي، هر متغير را به عنوان يك بازه در نظر ميگيرد كه فقط همان متغير به آن بازه تعلق دارد. در پياده سازي مرحلة دو، بازههاي مجاور با كمتـرين مقـدار خـي دو را
ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
1 .Tree Augmented Naïve Bayesian (TAN)
2. Discretization
ادغام مي كند و فرايند ادغام ادامه مي يابد تا اينكه مقدار خي دو همة زوج بازه هاي مجاور، بزرگ تر از سطح معناداري اي شود كه ابتدا مشخص شده است. اين فرايند با سطح معنادار كاهش يافته اي ادامه مي يابد تا با افزايش تدريجي ميزان ناسازگاري به يك مقدار مطابق با شرط حـداكثري دلتـابرسد (ليو و سشنو، 1995). شكل 2 الگوريتم استفاده شده براي گسستهسـازي داده هـا را در ايـنپژوهش نمايش مي دهد.

Algorithm: Discretization
Chi2 Function (att – attribute) Phase 1:

.5
While (InConCheck (data) < ) do /Function InConCheck() returns an inconsistency rate found in the discretized data/
For each numeric att do
Sort (att, data)
Chi-sq-init (att, data)
While (Merge (data)) do/Function Merge () returns true or false depending on whether the concerned attribute is merged or not/
Chi-sq-calculation (att, data)
End While End For
0 ←



قیمت: تومان


پاسخ دهید