راه حل ساده ترین مسائل پیچیده با استفاده از درخت تصمیم
- مجموعه: آیا می دانید ؟
استفاده از درخت تصمیم برای افزایش بهره وری در تصمیم گیری
درخت تصمیم (به انگلیسی : Decision Tree) یک مفهوم و روش تصمیم گیری است که برای گرفتن تصمیم های پیچیده و تقسیم کردن یک مساله به بخش های کوچکتر مورد استفاده می گیرد تا بتوانید به شکلی بهتر آن ها را در ذهن سازماندهی کنید و به شکل بهترین مشکلات را حل کنید.
در ادامه مقاله بیشتر درباره مفهوم درخت تصمیم گیری و نحوه استفاده از آن صحبت میکنیم.
درخت تصمیم چیست؟
به طور کلی می توان گفت که درخت تصمیم نقشه ای از نتایج احتمالی یک سری از انتخاب ها و گزینه های مرتبط با هم است به طوری که به فرد یا سازمان اجازه میدهد تا اقدامات احتمالی را از نظر هزینه و مزایا بسنجد.
از درخت تصمیم گیری میتوانید برای پیشبرد اهداف و برنامه های شخصی یا برای ترسیم الگوریتمی براساس ریاضی که بهترین گزینه را پیش بینی می کند ، استفاده کرد.
یک درخت تصمیم گیری به صورت کلی با یک گره یا نود Node اولیه شروع می شود و بعد از این گره پیامدهای احتمالی به صورت شاخه هایی از آن منشعب می شوند و هر کدام از آن ها به گره های دیگری می رسند که آنها هم به نوبه خود شاخه هایی از احتمالات دیگر را ایجاد می کنند و این ساختار شاخه شاخه سرانجام به نموداری شبیه یک درخت تبدیل می شود.
اصطلاحات پر کاربرد در درخت تصمیم گیری عبارتند از:
گره ریشه Root Node: پایه درخت تصمیم
تقسیم Splitting: فرایند تقسیم یک گره به چند زیر گره
گره تصمیم Decision Node: زمانی که یک زیرگره به زیرگره های بیشتر تقسیم می شود.
گره برگ Leaf Node : زمانی که یک زیر گره به زیر گره های بیشتر تقسیم نمی شود و نشان دهنده خروجی احتمالی است.
هرس Pruning : فرآیند حذف زیر گره های اضافی
شاخه Branch : زیر مجموعه ای از درخت تصمیم که از چندین گره تشکیل شده است.
درخت تصمیم شباهت زیادی به درخت معمولی دارد. در ابتدای درخت ، گره ریشه قرار گرفته است و مجموعه ای از گره های تصمیم از آن منشعب می شوند که نشان دهنده تصمیماتی هستند که باید گرفته شود.
از گره های تصمیم به گره های برگ می رسیم که نشان دهنده نتایج آن تصمیم ها هستند.
درست مانند رشد برگ روی شاخه درخت ، گره های برگ هم از گره های تصمیم ایجاد می شوند برای همین به زیر مجموعه های درخت تصمیم ، شاخه گفته می شود.
درخت تصمیم گیری معمولا سه نوع گره مختلف دارد که عبارتند از :
گره های تصادفی : گره های تصادفی به شکل دایره نشان داده می شوند و نمایانگر احتمال وقوع یکسری نتایج خاص هستند.
گره های تصمیم گیری : توسط مربع نشان داده می شوند و تصمیماتی که میتوان گرفت را نشان میدهند.
گره های پایانی : نمایانگر پیامد نهایی یک مسیر تصمیم گیری هستند که با مثلث نمایش داده می شوند.
برای این که درخت تصمیم گیری فهم آسان تری داشته باشند میتوانید آن را با سمبول ها یا علایم فلوچارت رسم نمایید.
روش ترسیم درخت تصمیم
برای ترسیم درخت ترسیم در ابتدا وسیله و ابزار مورد نظرتان را انتخاب کنید. (قلم و کاغذ ، وایت برد یا نرم افزار کامپیوتری)
1 – کار را با تصمیم اصلی شروع کنید ، برای این منظور از یک مستطیل کوچک استفاده کنید و سپس به ازای هر راه حل یا اقدام احتمالی ، خطی به سمت بیرون از مستطیل بکشید و معنی هر خط را مشخص کنید.
2 – برای رسم گره های تصادفی و تصمیم گیری برای شاخ و برگ دادن به درخت ، از روش زیر استفاده کنید :
اگر تصمیم اصلی دیگری دارید ، مستطیل دیگری رسم کنید.
اگر پیامدی قطعی نیست ، یک دایره به منظور نشان داده گره تصادفی بکشید.
اگر مشکل حل شده ، فعلا آن را خالی بگذارید.
از هر گره تصمیم گیری ، راه های احتمالی را منشعب کنید به طوری که برای هر کدام از گره های تصادفی ، خطوطی رسم شود و به وسیله آن ها پیامدهای احتمالی مشخص شود.
در صورتی که قصد دارید گزینه های پیش روی خود را به صورت عددی و درصدی آنالیز نمایید ، احتمال وقوع هر کدام از پیامدها را یادداشت کنید.
3 – به بسط و گسترش درخت ادامه دهید تا هر خط به نقطه پایانی برسد. تا جایی که انتخاب دیگری وجود نداشته باشد و پیامدهای احتمالی دیگری نتوانید در نظر بگیرید.
برای هر پیشامد احتمالی یک عدد یا درصد مشخص تعیین کنید .
برای نشان دادن نقطه پایانی از مثلث استفاده کنید.
حالا با داشتن این درخت تصمیم گیری که کامل شده است میتوانید تصمیماتی که با آنها روبرو هستید را تجزیه و تحلیل نمایید.
انواع درخت تصمیم
درخت تصمیم به دو نوع کلی درخت تصمیم با متغیر گسسته و درخت تصمیم با متغیر پیوسته تقسیم یم شود که بر اساس نوع متغیر خروجی مورد استفاده ایجاد شده اند.
درخت تصمیم با متغیر گسسته : در این درخت تصمیم گیری جواب به یک طبقه بندی خاص نزدیک است. مثلا سکه شیر است یا خط ؟ حیوان خزنده است یا پستاندار؟ در این نوع درخت تصمیم ، داده ها بر اساس تصمیمتی که در گره های درخت گرفته شده اند در یک طبقه بندی خاص قرار می گیرند.
درخت تصمیم با متغیر پیوسته : در این نوع درخت تصمیم ، یک جواب بله یا خیر مشخص وجود ندارد. به این نوع درخت ، درخت رگرسیونی هم گفته می شود زیرا متغیرهای خروجی یا تصمیمات گرفته شده به تصمیمات قبلی بستگی دارد. در این نوع درخت تصمیم میتواند خروجی را بر اساس چندین متغیر پیش بینی کرد و با انتخاب الگوریتم صحیح میتوان همزمان از روابط خطی و غیر خطی استفاده نمود.
کاربرد درخت تصمیم
درخت تصمیم زمانی استفاده می شود که بتوان ویژگی ها را براساس معیارهای مشخص ، مرتب نمود و به طبقه بندی نهایی رسید و خروجی های احتمالی مجموعه ای از انتخاب های مربوط به هم را ترسیم نمود. برخی از کاربردهای درخت تصمیم عبارتند از :
موتورهای توصیه گر : مشتریانی که محصولات دسته بندی خاصی را خریداری میکنند ممکن است تمایل به خرید محصولات مشابه با خریدهای قبلی خود داشته باشند. در این موارد موتورهای توصیه گر محصولاتی به مشتری پیشنهاد می دهند. مثلا به خریدار چوب اسکی ، پیشنهاد یک جفت دستکش گرم میدهند یا بعد از تمام کردن یک فیلم ف فیلم دیگری را به شما معرفی میکند.
حوزه درمان : در سال 2009 مطالعه ای در استرالیا روی 6000 نفر در طول 4 سال برای ابتلا به اختلال جدی افسردگی انجام شد ، در نهایت محققین داده هایی از جمله استعمال دخانیات ، مصرف الکل ، وضعیت شغلی و سایر متغیرهای دخیل در زندگی افراد را استخراج کرده و درخت تصمیمی طراحی کردند که قادر به پیش بینی خطر ابتلا به اختلال جدی افسردگی بود.
ماشین لرنینگ و دیتا ماینینگ : از درخت تصمیم می توان برای ایجاد مدل های پیش بینی خودکار استفاده نمود. این مدل ها در زمینه یادگیری ماشینی ، استخراج داده و آمار مورد استفاده قرار می گیرند.
این روش به نام یادگیری درخت تصمیم Decision Tree Learning شناخته می شود و با بررسی مشاهدات درباره یک آیتم، مقدارش را پیش بینی می کند.
به طور کلی در این درخت تصمیم، گره ها نشان دهنده دیتا هستند نه تصمیمات.
این نوع درخت ها به عنوان درخت طبقه بندی Classification Tree هم شناخته می شوند و هر شاخه دربرگیرنده مجموعه ای از ویژگی ها و قواین طبقه بندی دیتا است که مرتبط با یک دسته خاص می باشد که در انتهای هر شاخه قرار گرفته است.
این دست قوانین که به عنوان قوانین تصمیم گیری شناخته می شوند به صورت جملات شرطی قابل بیان هستند.
مثلا اگر شرایط 1 و 2 و 3 محقق شوند ، با قطعیت میتوان گفت که X نتیجه ای مانند Y خواهد داشت.
داده های بیشتر به مدل کمک میکند تا دقیق تر پیش بینی کند و از این اطلاعات بعدا میتوان به عنوان ورودی در یک مدل تصمیم گیری بزرگتر استفاده کرد.
مزایا و معایب استفاده از درخت تصمیم
درخت های تصمیم بین متخصصین صنایع ، مدیران و دولوپرها بسیار محبوب هستند چرا که :
درک آنها آسان است.
به دیتای خیلی دقیق و پیچیده نیاز ندارند.
هر زمانی در صورت لزوم میتوان گزینه های جدیدی به آنها اضافه کرد.
در انتخاب بهترین گزینه از میان گزینه های مختلف کارآمد هستند.
با سایر ابزارهای تصمیم گیری به خوبی سازگاری دارند.
با تمام این مزایا گاهی اوقات درخت تصمیم بسیار پیچیده می شود و در این گونه موارد بسیار گیج کننده خواهند شد و برای داده های بزرگ ایده آل نیست. تحت تاثیر نویز داده ها قرار می گیرد.
گردآوری : بخش علمی و آموزشی بیتوته