Journal of Information Technology Management University of Tehran
ISSN: 2008-5893 Faculty of Management
EISSN: 2423-5059
Vol. 9, No. 1; PP. 39 – 60
Spring 2017

Textual Data Mining Applications in the Service Chain Knowledge Management of e-Government
Jalal Rezaeenour 1, Mohammadreza Sheikhbahaei 2
Abstract: Systems related to knowledge management can improve quality and efficiency of knowledge used for decision making process. Approximately 80 percent of corporate information are in textual data formats. That is why text mining is useful and important in service chain knowledge management. For example, one of the most important applications of text mining is in managing on-line source of digital documents and the analysis of internal documents. This research is based on text-based documents and textual information and interviews processed by Grounded theory. In this research clustering techniques were applied at first step. In the second step, Apriori association rules techniques for discovering and extracting the most useful association rules were applied. In other words, integration of datamining techniques was emphasized to improve the accuracy and precision of classification. Using decision tree technique for classification may result in reducing classification precision. But, the proposed method showed a significant improvement in classification precision.

Key words: e-Government, Knowledge management, Service Chain, Textual datamining.

Associate Prof., Faculty of Engineering & Technology, University of Qom, Qom, Iran
M.Sc. in Information Technology Engineering, Faculty of Engineering & Technology, University of Qom, Qom, Iran

Submitted: 10 / March / 2015
Accepted: 25/ February / 2017
Corresponding Author: Jalal Rezaeenour
Email: j.rezaee@qom.ac.ir

Journal of Information Technology Management د ناوری اطلاعات
دانشكدة مديريت دانشگاه تهران دورة 9، شمارة 1 بهار 1396
صص. 60- 39

كاربردهاي داده كاوي متني در حوزة مديريت دانش
زنجيرة خدمات دولت الكترونيكي
جلال رضائي نور1، محمدرضا شيخ بهايي2
چكيـده: سيسـتم هـاي مـديريت دانـش، كيفيـت و بـازدهي دانـش اسـتفاده شـده در فراينـد تصميم گيري را بهبود مي بخشند. حدود 80 درصد اطلاعـات سـازمانهـا در فرمـت هـاي متنـيهستند؛ به همين علت متنكاوي آن هم در حوزة مديريت دانش زنجيرة خدمات، بسيار مفيـد وبا اهميت است. بهطور مثال، يكي از كاربردهاي مهم متن كاوي به منظور مديريت منابع روي خط اسناد ديجيتال و تجزيه و تحليل اسناد درون سازماني به كار برده مـيشـود . پـژوهش حاضـر بـ ه اسناد و مدارك مبتني بر متن اختصاص دارد كه براساس ارسال نظرها، فرم هاي اطلاعات متني و پرسشنامههاي مبتني بر روش تئوري زمينه اي تدوين شده اسـت . در نخسـتين گـام تحقيـق، تكنيك هاي خوشهبندي به اجرا درآمد و در گام دوم، تكنيك قوانين انجمني Apriori به منظـوركشف و استخراج مفيدترين قوانين انجمني اعمال شد. به بياني، بر يكپارچهسـازي تكنيـك هـايداده كاوي متني براي بهبود دقت رده بندي تأ كيد شده است. در كلاسه بندي مستندات با استفاده از تكنيك درخت تصميم به كلاس هاي مربوط به آن، دقـت كلاسـهبنـدي كـاهش يافـت، امـااستفاده از روش ارائه شده در اين تحقيق، بهبود شايان توجهي در دقت رده بندي ايجاد كرد.

واژه هاي كليدي: داده كاوي متني، دولت الكترونيكي، زنجيرة خدمات، مديريت دانش.

دانشيار گروه مهندسي صنايع، دانشكدة فني و مهندسي، دانشگاه قم، قم، ايران
كارشناس ارشد مهندسي فناوري اطلاعات، دانشكدة فني و مهندسي، دانشگاه قم، قم، ايران

تاريخ دريافت مقاله: 19/12/1393 تاريخ پذيرش نهايي مقاله: 07/12/1395 نويسندة مسئول مقاله: جلال رضايي نور E-mail: j.rezaee@qom.ac.ir
مقدمه
بر اساس گزارش سال 2010 سازمان ملل، دولت الكترونيك از اواخر دهة نود ميلادي ظهور كرد؛ اما از سال 1996 در تحقيقات دانشگاهي مشاهده شد. به رغم اقدامات صورت گرفته در سالهـاياخير، وضعيت توسعة دولت الكترونيك در ايران در حد مطلوبي قرار نـدارد (ثقفـي ، علـي احمـدي ، قاضينوري و حورعلي، 1394). پياده سازي موفق دولت الكترونيك، كار ساده و آساني نيست و بـاموانع دانش افزاري مواجه است (زارعي، ثقفي و زرين، 1392).
در دنياي امروز و در اقتصاد ديجيتالي و به خصوص در حوزه هاي خدمات دولـت الكترونيكـي ، اطلاعات زيادي در فرمت متن وجود دارند كه مي توان به راحتي آنها را در كـلاس هـاي از پـيشتعريف شده طبقه بندي و رده بندي كرد كه البته حدود 80 درصد از اطلاعات در دسترس به عنـواناسناد متني در دسترس است. اين اطلاعات اغلب در بيشتر داده هاي توصيفي ماننـد گـزارش هـا، اطلاعات بهدست آمـده از مشـتريان، سـاخت مسـتندات كيفيـت، تحقيقـات ميـداني و تجزيـه و تحليل هاي تئوري زمينه اي1، يادداشت ها و غيره هستند. بـراي بهبـود عملكـرد و ارائـة خـدماتبا كيفيت تر در آينده و ارائة راه حل، بايد اطلاعات موجود را به فرمتهاي قابل استفاده تبديل كرد.
تصميم گيرندگان و كاركنان دانشي سازمان و به خصوص مديران دانشي، تصـميمات كسـب و كـارخويش را از طريق كشف الگوهاي دانش به كار مي گيرند كه سبب كاهش هزينـه هـاي سـربار ازخدمات، بهبود كيفيت و مديريت بهتر مي شود. همزمـان بـا رشـد فزاينـدة تحـولات اقتصـادي ـ اجتماعي، تأثير دانش و مديريت تجرب ههاي سازماني بـهويـژه سـازمانهـا و ارگـان هـاي دولتـيبه شدت احساس ميشود (رضائي نور، لساني، زكي زاده و مجيد، 1393). مـديريت دانـش ، توانـايي سازمان ها براي يـادگيري از محـيط خـود و مشـاركتدادن دانـش در فراينـدهاي كسـب و كـار و تصميمگيري را افزايش مي دهد (جعفري، رضائي نور و اخوان، 2009).
روش هاي متنكاوي مزايايي دارد كه سبب مديريت بهتر منابع دانش و فعاليت هاي مـديريتدانش ميشود. متن كاوي در كشف دانـش مفيـد بـراي كمـك بـه پـردازش اطلاعـات و بهبـودبهره وري كاركنان دانشي سازمان استفاده مـي شـود. نتيجـة مـتن كـاوي ، افـزايش ارزش افـزودة كسب و كار به منظور تسهيل فرايند تصميم گيري و كاهش هزينه، نسـبت بـه سـاير تكنيـكهـايپردازش متن است. در اصل براي به دستآوردن مزايـاي رقـابتيتـر و بهـره بـرداري از اطلاعـاتچندگانه، روشهاي كشف دانش در نظر گرفته ميشود.
هدف از پژوهش حاضر، به كارگيري داده كاوي متني در حوزة مديريت دانش زنجيرة خـدماتدولت الكترونيكي است و اين تحقيق به دنبال بهبود زمينـه هـاي مختلـف كسـب و كـار از طريـق
ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
1. Grounded Theory
شناسايي دانش مفيد از تجربه هاي قبلـي و مسـتندات موجـود و تجزيـه و تحليـلهـاي تئـوري زمينه اي است. به طـور مثـال، اگـر نيازهـاي مشـتريان را بتـوان شناسـايي و طبقـه بنـدي كـر د، تصميم گيري هاي بهتر در آينده سبب بهبود سطح رضايت مشتريان خواهد شد. طبقه بنـدي مـتن رويكرد مهمي براي دست يافتن به داده هاي متني يا اطلاعـات در فراينـد كلـي كشـف دانـش ازپايگاه دادههاي متني است. متن كاوي نويد بخش ترين بخش اقتصاد مبتنـي بـر دانـش ديجيتـالاست كه بيشتر براي طبقه بندي اسناد متني به دسته هاي تعريف شده يا مجموعه اي از كـلاسهـ ا بر اساس محتوا استفاده مي شود. فيلتر كردن ايميل ها، مديريت اسناد و مدارك، شناسايي نيازهـايمشتري، بررسي مستندات به دست آمده از تحقيقات ميـداني و نتـايج تئـوري زمينـه اي و غيـره ازكاربردهاي ديگر اين حوزة دانش است (رضائي نور و نظريدوسـت، 2012). بنـابراين ، اسـتف اده از اين فناوري به منظور دسترسي به اطلاعات و مديريت آنها براي بهرهبرداري بهتر در برنامـه هـا وتصميم گيري هاي آينده مفيد است. داده هاي تحقيق شامل مجموعه داده هاي كـاربردي در حـوزة زنجيرة خدمات دولت الكترونيك مربوط به سال 1393 است كـه از طريـق تحقيقـات ميـداني و تجزيه و تحليل تئوري زمينه اي جمع آوري شده اند و در اين تحقيق اسناد متني بررسي مي شـوند. ادامة اين نوشتار بدين ترتيب ارائه مي شود: در بخش دوم پيشينه اي از روشهاي ردهبندي متن و گزارش هاي كاري اخير در حيطة راه حل هاي مديريت دانش ز نجيـرة خـدمات در حـوزة خـدمات دولـ ت الكترونيكـي مـرور مـي شـود. بخـش سـوم، بـه بحـث و تبـادل نظـر دربـارة معمـاري و متدولوژيهاي ارائهشده و نيز روشهاي مختلف گنجانده شده در اين روش ها اختصـاص دارد. در بخش چهارم، پياده سازي روشهاي ارائهشده بر اساس دادههاي واقعي در محدودة مديريت دانش زنجيرة خدمات در حوزة خدمات دولت الكترونيكي در قالب داده هاي بـه دسـت آمـده از تحقيقـاتميداني تجزيه و تحليل مي شود و بخش پنجم نيز به جمع بندي و نتيجه گيري ميپردازد.
پيشينة پژوهش
روش هاي طبقه بندي متن اولين بار در سال 1950 براي طبقه بندي اسناد مطرح شد كه به صـورتخودكار صورت مي پذيرفت. در سال 1960 مقاله اي در زمينة طبقه بندي خودكار متن منتشر شـد . شناسايي اطلاعات مفيد از پايگاه دادههاي متني از طريق تكنيك هاي مختلف دادهكاوي و بهطور گسترده در حوزة نرم افزار هاي مختلف استفاده شد؛ اما برنامه هاي كاربردي در زمينه هاي خـدماتي كه پايگاه داده هاي اطلاعاتي در حوزه هاي خدماتي دولت الكترونيكي را براي كشف اطلاعـات وتبديل آن به منابع دانش مفيد گزارش دهد، بسيار اندك بود.
تكنولوژي دادهكاوي انعطافپذيري لازم را براي بهره برداري اطلاعات از فرمت هاي داده هاي مختلف يا پايگاه داده هاي رابط هاي، انبار داده، معاملاتي و…، فراهم مي كند. پايگاه داده هاي متني ميتواند اطلاعات را در قالب مقاله ها، گزارشها، صفحه هاي وب، پيامهاي حـاوي يادداشـت و…
كه در انواع بدون ساختار، نيمهساختار يافته و ساختار يافته هستند، نگهـداري كنـد. مـتنكـاوي رامي توان استخراج متن از داده هاي متني و كشف دانش از پايگاه داده متني تعريـف كـرد . فراينـداستخراج متن به شدت بر روش هاي داده كاوي براي كشف دانش مفيد متكي است با اين تفاوت كـهدر متنكاوي، داده ها بدون ساختار هستند و چالش هاي بيشتري نسـبت بـه داده هـاي سـاختار يافتـه دارند. استخراج متن استاندارد شامل مراحل آماده سازي، پردازش و تجزيه و تحليـل مـتن مـي شـود (هان و كمبر، 2000). فرايند استخراج متن بهعنوان روشهاي تعاملي و تكرار شونده مطابق شكل
1 است.

تكنيك

دانش

بازيابي

و

مديريت

هاي
ر
و
مص
ارت
چ

و

گراف

سازي

متني

اطلاعات

منبع

آماده

متن

سازي

توقف

كلمات

از

استفاده

ريشه

اطلاعات

بازيابي

و

يابي

آماده

متن

سازي

توقف

كلمات

از

استفاده

ريشه

اطلاعات

بازيابي

و

يابي

تكنيك

دانش

بازيابي

و

مديريت



قیمت: تومان


پاسخ دهید